Skip to content

VideoCaptioner v1.3.0 重磅发布!🎉🎉🎉

Latest
Compare
Choose a tag to compare
@WEIFENG2333 WEIFENG2333 released this 07 Feb 10:40
· 8 commits to master since this release

经过一段时间的代码重构与优化,我很高兴地宣布 VideoCaptioner v1.3.0 正式发布!

此版本带来了许多改进

🚀 核心功能增强

  • 代码架构重构:对代码进行了完整的重构,优化了整体性能。
  • 模块分离:字幕优化与翻译功能分离,您可以更灵活地选择处理选项。
  • 批量处理:新增批量处理功能,支持批量字幕批量转录批量字幕视频合成
  • UI 优化:全面优化了 UI 界面与交互细节,带来更便捷的体验。

🤖 多种优化与升级

  • 扩展 LLM 支持:新增对以下 LLM 模型支持,为您提供更多选择:
    • SiliconCloud
    • DeepSeek
    • Ollama
    • Gemini
    • ChatGLM
  • 集成多种翻译服务
    • DeepLx
    • Bing
    • Google
    • LLM
  • 新增模型支持:新增 faster-whisper-large-v3-turbo 模型支持。
  • 多种 VAD 方法:新增多种 VAD(语音活动检测)方法,提高语音识别准确性。
  • 自定义反思翻译:支持自定义反思翻译开关,您可以根据需要开启或关闭此功能。
  • 字幕断句优化
    • 支持语义/句子两种断句模式。
    • 优化断句、优化、翻译提示词。
  • 缓存机制优化优化字幕、转录缓存机制,提高处理速度。
  • 新增中文字幕自动换行功能,使字幕更美观。
  • 新增竖屏字幕样式。
  • 改进字幕时间轴切换,消除闪烁问题。
  • 新增日志文件打开功能。
  • 新增泰语、德语等语言的字幕优化。
  • 新增多种字幕视频格式支持。
  • 优化输出视频工作目录结构。

🐛 Bug 修复与其他改进

  • 修复 Whisper API 无法使用问题。
  • 修复部分情况转录错误的问题。
  • 修复诸多其他 Bug...

📥 获取方式

您也可以通过以下链接下载 VideoCaptioner v1.3.0:

蓝奏网盘

🙏 感谢

感谢所有为 VideoCaptioner 做出贡献的开发者和用户!

如果您在使用过程中遇到任何问题或有任何建议,请随时在 GitHub 上提出 Issue 或 Pull Request。