VideoCaptioner v1.3.0 重磅发布！🎉🎉🎉

Latest

Latest

WEIFENG2333 released this 07 Feb 10:40

· 8 commits to master since this release

f46d125

经过一段时间的代码重构与优化，我很高兴地宣布 VideoCaptioner v1.3.0 正式发布！

此版本带来了许多改进

🚀 核心功能增强

代码架构重构：对代码进行了完整的重构，优化了整体性能。
模块分离：字幕优化与翻译功能分离，您可以更灵活地选择处理选项。
批量处理：新增批量处理功能，支持批量字幕、批量转录、批量字幕视频合成。
UI 优化：全面优化了 UI 界面与交互细节，带来更便捷的体验。

🤖 多种优化与升级

扩展 LLM 支持：新增对以下 LLM 模型支持，为您提供更多选择：
- SiliconCloud
- DeepSeek
- Ollama
- Gemini
- ChatGLM
集成多种翻译服务：
- DeepLx
- Bing
- Google
- LLM
新增模型支持：新增 faster-whisper-large-v3-turbo 模型支持。
多种 VAD 方法：新增多种 VAD（语音活动检测）方法，提高语音识别准确性。
自定义反思翻译：支持自定义反思翻译开关，您可以根据需要开启或关闭此功能。
字幕断句优化：
- 支持语义/句子两种断句模式。
- 优化断句、优化、翻译提示词。
缓存机制优化优化字幕、转录缓存机制，提高处理速度。
新增中文字幕自动换行功能，使字幕更美观。
新增竖屏字幕样式。
改进字幕时间轴切换，消除闪烁问题。
新增日志文件打开功能。
新增泰语、德语等语言的字幕优化。
新增多种字幕视频格式支持。
优化输出视频工作目录结构。

🐛 Bug 修复与其他改进

修复 Whisper API 无法使用问题。
修复部分情况转录错误的问题。
修复诸多其他 Bug...

📥 获取方式

您也可以通过以下链接下载 VideoCaptioner v1.3.0：

🙏 感谢

感谢所有为 VideoCaptioner 做出贡献的开发者和用户！

如果您在使用过程中遇到任何问题或有任何建议，请随时在 GitHub 上提出 Issue 或 Pull Request。

Assets 3