方法 1:通過迅捷語音識別功能在線實現(需聯網)#
注意:限制單個音頻文件不超過 20M。可刷新重複多次。
方法 2:通過微政網在線實現(需聯網)#
注意:共 3 次機會,儘量把音頻合併成一個再上傳。
方法 3:通過 i 迪雲聽寫在線實現(需聯網)#
方法 4:通過手機號登錄閱錄(需聯網)#
方法 5:通過 converter.app 轉文字(需聯網)#
方法 6:用 faster-whisper 轉文字(無需聯網)#
- 先從Github下載適合自己電腦系統的 FFmpeg 並安裝,安裝教程可參考Windows10 系統怎樣下載安裝 ffmpeg?
- 再從Github下載 faster-whisper-GUI.exe 並右鍵選擇以管理員身份安裝
- 再從huggingface搜索下載以 base 結尾的模型,並複製到合適的目錄文件夾下
- 以管理員身份運行 FasterWhisperGUI
- 選擇使用本地模型並選中剛才下載的模型文件,點擊加載模型
- 如果使用的是英偉達(Nvidia)顯卡,請在處理設備選項中選擇 cuda
- 點擊執行轉寫
- 點擊加號選擇需要轉寫的視頻文件
- 轉寫完成後點擊跳轉到 whisperX 及字幕編輯
- 點擊保存字幕文件
- 也可選擇需要保存的字幕格式