SubGen 是一款基于 Whisper 的字幕生成工具,目前内置了 medium 模型,相比直接使用 Whisper ,SubGen 多了一层 VAD 检测,会过滤静音和纯音乐片段,从而减少 Whisper 的幻觉输出(当然没办法从根本上解决)

有兴趣的 V 友可以试试看,现在只做了 Mac 版本,Windows 版本还在调试。
有啥问题都可以交流,产品地址
先送 10 个永久 license
1
lovejoy 31 天前
machine already activated with another license
|
3
ly1878 2 天前
不支持音频?
用的是 stable-ts 吗? 英文断句是什么大规则? 最近我在折腾这个,找不到好用的。 参数:语言 = 英文;模型 = medium ; threshold = 2 ; sample_rate = 16000 处理失败:提取音频失败: ffmpeg 错误: dyld[10479]: Library not loaded: /opt/homebrew/opt/libxcb/lib/libxcb.1.dylib Referenced from: <7FCB7E99-4B3A-3397-8D19-370906059BD1> /Applications/subgen.app/Contents/Resources/resources/mac/ffmpeg Reason: tried: '/opt/homebrew/opt/libxcb/lib/libxcb.1.dylib' (no such file), '/System/Volumes/Preboot/Cryptexes/OS/opt/homebrew/opt/libxcb/lib/libxcb.1.dylib' (no such file), '/opt/homebrew/opt/libxcb/lib/libxcb.1.dylib' (no such file) 未选择媒体文件。 |