用户封面
Jz的头像JzFlex - 专业音乐制作社区JzFlexUnknowStudio专属
测试5JzFlex - 专业音乐制作社区JzFlex
1个月前68人已阅读
TOP2
1111111111JzFlex - 专业音乐制作社区JzFlex
1个月前55人已阅读
TOP4
顺序播放(Sequence Container)JzFlex - 专业音乐制作社区JzFlex
1个月前49人已阅读
TOP5
这是论坛的测试~JzFlex - 专业音乐制作社区JzFlex
1个月前45人已阅读
TOP6
详情
评论
问答

福利:基于 OpenAI 家 Whisper 技术的免费离线语音转文本工具 Whisper Batch Transcriber

Reactorcore 推出了一款名为 Whisper Batch Transcriber 的新免费工具,为 Windows 用户带来专业级的语音转文本功能,而且可以离线本地运算使用,无需互联网连接或支付订阅费。

图片[1]JzFlex - 专业音乐制作社区福利:基于 OpenAI 家 Whisper 技术的免费离线语音转文本工具 Whisper Batch TranscriberJzFlex - 专业音乐制作社区JzFlex

该工具利用 OpenAI 的 Whisper AI 技术自动将音频文件转换为干净、格式化的文本文档。与基于云的转换服务不同,它在用户的计算机上完全离线运行,确保了隐私和无限制使用,且不会产生经常性成本。

主要特点:100 离线操作 —— 设置后无需互联网。支持多种音频格式:MP3、WAV、FLAC、OGG、M4A、AAC。包括两个 AI 模型:Small_en(2GB VRAM,准确率 96)和 Large_v3_Turbo(6GB VRAM,准确率 99.8)。多文件的批处理功能。干净、格式化的输出,具有适当的标点符号和大小写。
该工具对于需要转录采访、语音备忘录、排练录音或其他音频内容的音乐家、播客、内容创建者和音频专业人士特别有用。处理时间因硬件而异,通常每分钟音频需要 2-10 分钟。

系统需求:Windows 7 或更高版本。Python 3.10+(包括自动安装程序)。最低 2GB GPU 显存(建议 6GB 以上以获得最佳准确性)。2GB 存储空间。
虽然该工具最初加载需要 5-15 分钟,但这是正常的操作。为了获得最佳性能,最好事先将音频文件转换为 16kHz 采样率的单声道 WAV 格式。

Python 源代码也包含在下载中。如果您已安装 Python,则可以通过双击 .py 文件而不是 .exe 来稍微加快应用程序的运行速度。

Whisper Batch Transcriber 可从开发人员的 itch.io 页面免费下载,也感谢广大用户提供捐赠支持。

免费下载地址:https://reactorcore.itch.io/whisper-batch-transcriber

文章转载自midifan,版权归原作者所有,也请大家支持midifan

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    请登录后查看评论内容