核心功能仅使用numpy
实现的条件卷积变分自编码器(CVAE)人脸图像生成模型。
- 高度轻量化: DecoderOnly且fp16量化之后大小仅有1.7MB
- 使用numpy实现高度类似Pytorch的接口
- 支持使用彩色字符显示图像(ASCII Art)
- numpy
- matplotlib
- PyTorch(可选,仅用于训练模型)
- torchvision(可选,用于处理训练期间的CelebA数据集)
-
克隆仓库并初始化子模块:
git clone --recurse-submodules https://github.com/hammershock/CVAEGenerator.git cd CVAEGenerator
-
使用pip安装所需的软件包:
pip install numpy matplotlib pip install torch torchvision # 仅用于训练
- 运行
main.py
进行推理,使用预训练模型生成人脸图像 - 训练模型
train.py
该项目使用CelebA数据集。
- 模型将图像属性集成到其架构中,使其能够生成有条件的人脸图像。
- 该系统支持加载预训练权重和使用PyTorch从头开始训练。