Reactorcore는 인터넷 연결이나 구독료 없이도 Windows 사용자가 전문가 수준의 음성-텍스트 변환 기능을 사용할 수 있도록 지원하는 새로운 무료 도구인 Whisper Batch Transcriber를 발표했습니다.
이 도구는 OpenAI의 Whisper AI 기술을 활용하여 오디오 파일을 깔끔하게 정리된 텍스트 문서로 자동 변환합니다. 클라우드 기반의 전사 서비스와는 달리, 사용자 컴퓨터에서 완전히 오프라인으로 실행되므로 개인 정보 보호는 물론 반복적인 비용 없이 무제한으로 사용할 수 있습니다.
주요 기능:
- 100% 오프라인 작동 - 설정 후 인터넷 필요 없음.
- 다양한 오디오 형식 지원: MP3, WAV, FLAC, OGG, M4A, AAC.
- 두 가지 AI 모델 포함: Small_en (2GB VRAM, 96% 정확도) 및 Large_v3_Turbo (6GB VRAM, 99.8% 정확도).
- 여러 파일을 일괄 처리할 수 있는 기능.
- 적절한 구두점 및 대문자 사용으로 깔끔하게 정리된 출력.
이 도구는 인터뷰, 음성 메모, 리허설 녹음 또는 기타 오디오 콘텐츠를 전사해야 하는 음악가, 팟캐스터, 콘텐츠 제작자 및 오디오 전문가에게 특히 유용합니다. 처리 시간은 하드웨어에 따라 다르며 일반적으로 오디오 1분당 2~10분이 소요됩니다.
시스템 요구 사항:
- Windows 7 이상.
- Python 3.10+ (자동 설치 프로그램 포함).
- 최소 2GB GPU VRAM (최상의 정확도를 위해 6GB+ 권장).
- 2GB 저장 공간.
개발자는 도구를 처음 로드하는 데 5~15분이 걸리지만 이는 정상적인 동작이라고 언급합니다. 최적의 성능을 위해 오디오 파일은 미리 16kHz 샘플 속도의 모노 WAV 형식으로 변환해야 합니다.
Python 소스 코드가 다운로드에 포함되어 있습니다. Python이 설치되어 있는 경우 .exe 대신 .py 파일을 두 번 클릭하면 애플리케이션을 약간 더 빠르게 실행할 수 있습니다.
Whisper Batch Transcriber는 개발자의 itch.io 페이지에서 무료로 다운로드할 수 있으며, 도구가 유용하다고 생각하는 사용자를 위해 기부를 통해 선택적으로 지원할 수 있습니다.
다운로드 위치: https://reactorcore.itch.io/whisper-batch-transcriber