SPAN-rtmri Audio-Guided Diffusion Model

Setup enviroment

conda env create --file=environments.yml
conda activate genai

Preparing dataset

Create preprocessed dataset folder

mkdir ./datasets/preprocessed_dataset/

Create gifs from original SPAN dataset for training and test

python create_gifs_dataset.py
                --path2span /mnt/c/Users/PCM/Dropbox/span
                --target_dir ./datasets/preprocessed_dataset/

Create audio embeddings from a pretrained model. Each pretrained model should have seperated target_dir folder.

python create_audio_embeddings.py --path2span /mnt/c/Users/PCM/Dropbox/span --target_dir ./datasets/preprocessed_dataset/hubert-large --model_name Hubert --model_size large --pretrain_on None

Training

Train diffusion model, save models to ./checkpoints/ and save samples per epoch to ./gif_samples

python imagen-video-training.py 
                --audio_path ./datasets/preprocessed_dataset/audio_embs 
                --audio_embed_dim 1024
                --from_pretrained False
                --ignore_time False
                --audio_pooling False
                --gif_path ./datasets/preprocessed_dataset/train

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
__pycache__		__pycache__
.gitignore		.gitignore
Inference.ipynb		Inference.ipynb
README.md		README.md
calc_fvm.ipynb		calc_fvm.ipynb
create_audio_embeddings.py		create_audio_embeddings.py
create_gifs_dataset.py		create_gifs_dataset.py
environment.yml		environment.yml
gen_syn_img.py		gen_syn_img.py
gif-inference.ipynb		gif-inference.ipynb
imagen-video-training.py		imagen-video-training.py
run_imagen_video.sh		run_imagen_video.sh
super-res-training.py		super-res-training.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SPAN-rtmri Audio-Guided Diffusion Model

Setup enviroment

Preparing dataset

Training

About

Releases

Packages

Languages

Hong7Cong/SPAN-rtmri

Folders and files

Latest commit

History

Repository files navigation

SPAN-rtmri Audio-Guided Diffusion Model

Setup enviroment

Preparing dataset

Training

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages