testxlog

在沒有網路的情況下如何實現語音轉文本？

2024年5月16日363

AI 翻譯

這篇文章透過AI由簡體中文翻譯成繁體中文。查看原文

AI 生成的摘要

"Xlog"項目已完成，提供了多種方法在沒有網絡的情況下實現語音轉文本。包括使用迅捷語音識別、微政網、i迪云聽寫、阅录、converter.app等在線工具，以及使用faster-whisper在本地轉換文字。需要下載相應軟件和模型，並按照指示操作。

方法 1：通過迅捷語音識別功能在線實現（需聯網）#

注意：限制單個音頻文件不超過 20M。可刷新重複多次。

方法 2：通過微政網在線實現（需聯網）#

注意：共 3 次機會，儘量把音頻合併成一個再上傳。

方法 3：通過 i 迪雲聽寫在線實現（需聯網）#

方法 4：通過手機號登錄閱錄（需聯網）#

方法 5：通過 converter.app 轉文字（需聯網）#

方法 6：用 faster-whisper 轉文字（無需聯網）#

先從Github下載適合自己電腦系統的 FFmpeg 並安裝，安裝教程可參考Windows10 系統怎樣下載安裝 ffmpeg？
再從Github下載 faster-whisper-GUI.exe 並右鍵選擇以管理員身份安裝
再從huggingface搜索下載以 base 結尾的模型，並複製到合適的目錄文件夾下
以管理員身份運行 FasterWhisperGUI
選擇使用本地模型並選中剛才下載的模型文件，點擊加載模型
如果使用的是英偉達（Nvidia）顯卡，請在處理設備選項中選擇 cuda
點擊執行轉寫
點擊加號選擇需要轉寫的視頻文件
轉寫完成後點擊跳轉到 whisperX 及字幕編輯
點擊保存字幕文件
也可選擇需要保存的字幕格式

此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。

區塊鏈編號
#59476-20
擁有者
0x2468683ff691bf0d7c8ac63afbbc0f157985a600
交易雜湊值
創作 0x3a5a404a...5c1f57d088 最後更新 0x3a5a404a...5c1f57d088
IPFS 位址
ipfs://QmeMtfjnbTCVPpszHTJRtJudZVkwv2xV5z9AqV3sAp7Umu