经过一段时间的代码重构与优化,我很高兴地宣布 VideoCaptioner v1.3.0 正式发布!
此版本带来了许多改进
🚀 核心功能增强
- 代码架构重构:对代码进行了完整的重构,优化了整体性能。
- 模块分离:字幕优化与翻译功能分离,您可以更灵活地选择处理选项。
- 批量处理:新增批量处理功能,支持批量字幕、批量转录、批量字幕视频合成。
- UI 优化:全面优化了 UI 界面与交互细节,带来更便捷的体验。
🤖 多种优化与升级
- 扩展 LLM 支持:新增对以下 LLM 模型支持,为您提供更多选择:
- SiliconCloud
- DeepSeek
- Ollama
- Gemini
- ChatGLM
- 集成多种翻译服务:
- DeepLx
- Bing
- LLM
- 新增模型支持:新增
faster-whisper-large-v3-turbo
模型支持。 - 多种 VAD 方法:新增多种 VAD(语音活动检测)方法,提高语音识别准确性。
- 自定义反思翻译:支持自定义反思翻译开关,您可以根据需要开启或关闭此功能。
- 字幕断句优化:
- 支持语义/句子两种断句模式。
- 优化断句、优化、翻译提示词。
- 缓存机制优化优化字幕、转录缓存机制,提高处理速度。
- 新增中文字幕自动换行功能,使字幕更美观。
- 新增竖屏字幕样式。
- 改进字幕时间轴切换,消除闪烁问题。
- 新增日志文件打开功能。
- 新增泰语、德语等语言的字幕优化。
- 新增多种字幕视频格式支持。
- 优化输出视频工作目录结构。
🐛 Bug 修复与其他改进
- 修复 Whisper API 无法使用问题。
- 修复部分情况转录错误的问题。
- 修复诸多其他 Bug...
📥 获取方式
您也可以通过以下链接下载 VideoCaptioner v1.3.0:
🙏 感谢
感谢所有为 VideoCaptioner 做出贡献的开发者和用户!
如果您在使用过程中遇到任何问题或有任何建议,请随时在 GitHub 上提出 Issue 或 Pull Request。