testxlog

怎样在没有网络的情况下实现语音转文本？

2024年5月16日364

AI 生成的摘要

项目名称为"Xlog"，已完成。提供了多种方法实现语音转文本，其中包括在线和离线的方式。其中方法6可以在没有网络的情况下使用。

方法 1：通过迅捷语音识别功能在线实现（需联网）#

注意：限制单个音频文件不超过 20M。可刷新重复多次。

方法 2：通过微政网在线实现（需联网）#

注意：共 3 次机会，尽量把音频合并成一个再上传。

方法 3：通过 i 迪云听写在线实现（需联网）#

方法 4 ：通过手机号登录阅录（需联网）#

方法 5：通过 converter.app 转文字（需联网）#

方法 6：用 faster-whisper 转文字（无需联网）#

先从Github下载适合自己电脑系统的 FFmpeg 并安装，安装教程可参考Windows10 系统怎样下载安装 ffmpeg？
再从Github下载 faster-whisper-GUI.exe 并右键选择以管理员身份安装
再从huggingface搜索下载以 base 结尾的模型，并复制到合适的目录文件夹下
以管理员身份运行 FasterWhisperGUI
选择使用本地模型并选中刚才下载的模型文件，点击加载模型
如果使用的是英伟达（Nvidia）显卡，请在处理设备选项中选择 cuda
点击执行转写
点击加号选择需要转写的视频文件
转写完成后点击跳转到 whisperX 及字幕编辑
点击保存字幕文件
也可选择需要保存的字幕格式

此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。

区块链标识
#59476-20
所有者
0x2468683ff691bf0d7c8ac63afbbc0f157985a600
交易哈希
创作 0x3a5a404a...5c1f57d088 最后更新 0x3a5a404a...5c1f57d088
IPFS 地址
ipfs://QmeMtfjnbTCVPpszHTJRtJudZVkwv2xV5z9AqV3sAp7Umu