发布说明 - 版本 v1.0
概述
版本 v1.0 是我们语音转文字工具的第一个正式发行版。该工具使用 Gradio 构建了一个用户友好的 Web 界面,允许用户上传音视频文件并选择语言、模型和响应格式,从而获取相应的转录结果。
主要功能
- 上传音视频文件:支持多种格式的音频和视频文件。
- 选择语言:提供多种语言选项,包括中文、英文、法语等。
- 选择模型:提供不同大小的模型选项,以适应不同的性能需求。
- 选择响应格式:支持 JSON、TEXT 和 SRT 格式的转录结果。
新特性
- Gradio 驱动的 WebUI:提供直观的用户界面,易于操作。
- 多语言支持:覆盖多种常见语言。
- 多种模型选择:满足不同的准确性和性能需求。
- 灵活的响应格式:可以根据需要选择不同的输出格式。
示例内容
JSON 格式
[
{
"end_time": "00:00:25,200",
"line": 1,
"start_time": "00:00:00,000",
"text": "从选学的角度来讲,当有一些事上天不让你做成,其实是在保护你,比如车坏了,蓝点了或者你的错过了,这时候我们别生气别抱怨,事件呢,都是有规律,该来的会来,该走的,我们也留不住,有时候得到了规定是好事,失去也不一定是坏事,人间自有英国,残事,机有因素。"
}
]
TEXT 格式
从选学的角度来讲,当有一些事上天不让你做成,其实是在保护你,比如车坏了,蓝点了或者你的错过了,这时候我们别生气别抱怨,事件呢,都是有规律,该来的会来,该走的,我们也留不住,有时候得到了规定是好事,失去也不一定是坏事,人间自有英国,残事,机有因素。
SRT 格式
1
00:00:00,000 --> 00:00:25,200
从选学的角度来讲,当有一些事上天不让你做成,其实是在保护你,比如车坏了,蓝点了或者你的错过了,这时候我们别生气别抱怨,事件呢,都是有规律,该来的会来,该走的,我们也留不住,有时候得到了规定是好事,失去也不一定是坏事,人间自有英国,残事,机有因素。
安装和运行
-
安装依赖:
pip install gradio requests
-
下载代码:
将以下代码保存为transcription_ui.py
。 -
运行程序:
python transcription_ui.py
-
访问界面:
打开浏览器并访问生成的本地URL(通常是http://127.0.0.1:7861
)。
联系方式
如有任何问题或建议,请联系我们的技术支持团队:
- Email: [email protected]
- GitHub: Unsiao GitHub