WhisperDesktop vs 剪映,AI 語音轉文字測試
https://pastebin.com/1vw1r8JS
測試檔案:
https://www.youtube.com/watch?v=3vZGFPihoEA
下載成 .mp4 檔案後進行遍識測試環境:
Windows 10 21H2/ i7-12700K/ RTX 3080Ti
測試結果:
- ggml-large.bin
- 字幕檔:https://pastebin.com/HZDZnCwg
- 耗時 11 分 36 秒
- ggml-medium.bin
- 字幕檔:https://pastebin.com/1vw1r8JS
- 耗時 7 分 14 秒
- ggml-small.bin
- 字幕檔:https://pastebin.com/twWGNgUc
- 耗時 3 分 33 秒
- 剪映 (PC 版 v3.9.0)
- 字幕檔:https://pastebin.com/BExQ6NyM
- 耗時約 7 分
結果分析:
- Whisper 的識別結果會自行排除贅字,剪映則保留
- Whisper 的 large 跟 medium 能把 A prime 轉成 A',small 跟剪映則照原本輸出
- 00:02:35 附近,"雜湊函數" 所有模型皆無法識別出
- 00:07:24 附近,"加密" whisper medium 正確識別,其餘則識別錯誤
- 00:10:01 附近,"金鑰" whisper large 正確識別,其餘則識別錯誤。exclusive or 則所有模型皆識別錯誤
- 00:15:51 附近,"Plain text" whisper large 正確識別,其餘則識別錯誤。
- 00:16:53 附近,"四散在外" whisper large 正確識別,其餘則識別錯誤。
留言
張貼留言