方法 1:通过迅捷语音识别功能在线实现(需联网)#
注意:限制单个音频文件不超过 20M。可刷新重复多次。
方法 2:通过微政网在线实现(需联网)#
注意:共 3 次机会,尽量把音频合并成一个再上传。
方法 3:通过 i 迪云听写在线实现(需联网)#
方法 4 :通过手机号登录阅录(需联网)#
方法 5:通过 converter.app 转文字(需联网)#
方法 6:用 faster-whisper 转文字(无需联网)#
- 先从Github下载适合自己电脑系统的 FFmpeg 并安装,安装教程可参考Windows10 系统怎样下载安装 ffmpeg?
- 再从Github下载 faster-whisper-GUI.exe 并右键选择以管理员身份安装
- 再从huggingface搜索下载以 base 结尾的模型,并复制到合适的目录文件夹下
- 以管理员身份运行 FasterWhisperGUI
- 选择使用本地模型并选中刚才下载的模型文件,点击加载模型
- 如果使用的是英伟达(Nvidia)显卡,请在处理设备选项中选择 cuda
- 点击执行转写
- 点击加号选择需要转写的视频文件
- 转写完成后点击跳转到 whisperX 及字幕编辑
- 点击保存字幕文件
- 也可选择需要保存的字幕格式