FFMPEG GUI PyDracula

😊简介

❌重要： 本项目没有ffmpeg环境安装，需要用户自行解决ffmpeg的环境问题。能够在命令行识别到ffmpeg命令即可。❌

目前实现的功能：

命令窗口预览将要执行的命令，可以修改（懂ffmpeg命令的话，就可以自己修改执行指令）
转码视频文件
提取视频
视频转MP3
批量转码功能（暂时不包括批量合成字幕）
转码码率设置
转码速度设置
内挂字幕（仅限mkv格式）
内嵌字幕
自动切片（根据音频端点分割自动切出对应视频）
接入 Whisper 实现视频自动生成字幕
接入阿里达摩院的 Paraformer 实现自动生成中文字幕

未来期望实现功能：

更多的预设功能
多段视频拼接（感觉这个功能不是那么重要）
whisper 模型选择和下载
whisper 使用 cuda 加速

软件界面

🛠 以下为开发人员内容

YouTube - 教程与帮助

关于修改用户界面以及理解项目的教程。

🔗 https://youtu.be/9DnaHg4M_AM

💥警告: 本项目使用 PySide6 和 Python 3.10 开发，使用较早的版本可能会出现兼容性问题。

高分辨率设置

QT 控件是一项比较老的技术，不能较好的支持高DPI的设置。如果你的系统DPI设置高于100%，GUI界面的图像会被扭曲。你可以用下面的方法，通过在"main.py"的Qt控件导入后加入这段代码来避免这个问题。

from modules import *
from widgets import *
os.environ["QT_FONT_DPI"] = "96"

启动

在你的系统上按照'requirements.txt'安装环境，然后就可以使用下面的代码在终端中启动这个项目。

Windows:

python main.py

MacOS and Linux:

python3 main.py

编译

使用 Pyinstaller 编译 exe 项目

pyinstaller -Dw ./main.py --copy-metadata tqdm --copy-metadata regex --copy-metadata requests --copy-metadata packaging --copy-metadata filelock --copy-metadata numpy --copy-metadata tokenizers --copy-metadata huggingface-hub --copy-metadata safetensors --copy-metadata pyyaml

transformers库打包需要这一溜的metadata数据才可以正常运行，所以需要加上。

在那之前还需要使用命令 pip install pyinstaller==6.3.0 来安装打包环境。更新的pyinstaller没有尝试。编译成功后，在当前目录下可以找到"./dist/main/main.exe"文件，在启动之前还需要复制theme主题文件到"./dist/main"，否则会因为找不到主题文件报错。类似的还有：

复制model文件到'./dist/main/_internal'目录下，自动剪辑和自动配字幕功能需要这个模型。
复制modules/whisper/文件夹到'./dist/main/modules/'目录下，配字幕需要这个功能

错误修复

pyinstaller 打包时错误

如果打包python3.10出现 tuple index out of range 错误，去python可执行文件位置找到 ./Lib/dis.py 修改 _unpack_opargs 函数为如下

def _unpack_opargs(code):
    extended_arg = 0
    for i in range(0, len(code), 2):
        op = code[i]
        if op >= HAVE_ARGUMENT:
            arg = code[i+1] | extended_arg
            extended_arg = (arg << 8) if op == EXTENDED_ARG else 0
        else:
            arg = None
            extended_arg = 0
        yield (i, op, arg)

打包后错误

使用 pyinstaller 可以打包，但是启动程序时出现如下所示错误。

File "<frozen importlib._bootstrap>", line 1176, in _find_and_load
  File "<frozen importlib._bootstrap>", line 1147, in _find_and_load_unlocked
  File "<frozen importlib._bootstrap>", line 690, in _load_unlocked
  File "PyInstaller\loader\pyimod02_importers.py", line 385, in exec_module
  File "transformers\utils\import_utils.py", line 37, in <module>
    logger = logging.get_logger(__name__)  # pylint: disable=invalid-name
             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "transformers\utils\logging.py", line 124, in get_logger
    _configure_library_root_logger()
  File "transformers\utils\logging.py", line 88, in _configure_library_root_logger
    _default_handler.flush = sys.stderr.flush
                             ^^^^^^^^^^^^^^^^
AttributeError: 'NoneType' object has no attribute 'flush'

修改 transformers 库的 src/transformers/utils/logging.py 文件，加上如下有 + 标记的两行代码，然后重新打包即可。

def _configure has already_library_root_logger() -> None:
    ...
    _default_handler = logging.StreamHandler()
    + if sys.stderr is None:
    +     sys.stderr = open(os.devnull, "w")
    
    _default_handler.flush = sys.stderr.flush
    ...

项目文件及文件夹

main.py: 程序主文件.

main.ui: 使用 Qt Designer GUI界面设计文件.

resouces.qrc: Qt Designer 加载"main.ui"使用的图片资源（例如背景图，图标等），也需要加载以保证程序正确运行。使用 version 6 >

setup.py: 编译项目为 Windows 可执行程序。

themes/: 放你的主题文件 (.qss)。

modules/: 本项目功能实现模块。

modules/app_funtions.py: 原来的功能实现文件。

modules/app_settings.py: 用户交互界面全局设置文件。

modules/auto_cut.py: 自动剪辑功能实现文件。

modules/auto_subtitle.py: 调用whisper配字幕功能实现文件。

modules/btn_functions.py: 软件其他功能实现文件。

modules/video_convert.py: 调用ffmpeg进行视频转码，也是主界面功能实现。

modules/vad_functions.py: 声音识别模块，来自snakers4/silero-vad。

modules/resources_rc.py: "resource.qrc" 需要使用这条命令编译得到 pyside6-rcc resources.qrc -o resources_rc.py。

modules/ui_functions.py: 和用户交互界面相关函数实现。

modules/ui_main.py: 由 Qt Designer 编译导出用户界面得到。你可以使用下面的命令手动导出本文件 pyside6-uic main.io -o ui_main.py。导出以后需要把代码 "import resources_rc" 修改成 "from . resources_rc import *" 来导入资源文件。或者直接修改resources_rc.py文件的位置能够被python解释器找到也可以。

images/: 在编译成资源文件resource_rc.py之前把项目需要使用的图像资源全部放到这里。

感谢

本项目从PyDracula修改而来。

感谢 Wanderson M. Pimenta 的 repository PyDracula。

感谢 snakers4 的 repository Silero-vad 。

感谢 PINTO0309 的 repository whisper-onnx-cpu 。

感谢 RapidAI 的 repository RapidASR 。

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
gallery		gallery
images		images
model		model
modules		modules
themes		themes
widgets		widgets
.gitignore		.gitignore
LICENSE		LICENSE
README-en.md		README-en.md
README.md		README.md
build.py		build.py
config.json		config.json
icon.ico		icon.ico
main.py		main.py
main.spec		main.spec
main.ui		main.ui
requirements.txt		requirements.txt
resources.qrc		resources.qrc
resources_rc.py		resources_rc.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FFMPEG GUI PyDracula

😊简介

软件界面

🛠 以下为开发人员内容

YouTube - 教程与帮助

高分辨率设置

启动

Windows:

MacOS and Linux:

编译

使用 Pyinstaller 编译 exe 项目

错误修复

pyinstaller 打包时错误

打包后错误

项目文件及文件夹

感谢

About

Releases 6

Packages

Languages

License

peach-water/ffmpeg-GUI-with-PyDracula

Folders and files

Latest commit

History

Repository files navigation

FFMPEG GUI PyDracula

😊简介

软件界面

🛠 以下为开发人员内容

YouTube - 教程与帮助

高分辨率设置

启动

Windows:

MacOS and Linux:

编译

使用 Pyinstaller 编译 exe 项目

错误修复

pyinstaller 打包时错误

打包后错误

项目文件及文件夹

感谢

About

Resources

License

Stars

Watchers

Forks

Releases 6

Packages 0

Languages

Packages