文件构架
D:.
├─.idea
├─data
│ └─folder
├─datasets
│ └─__pycache__
├─images
├─models
│ └─__pycache__
├─tools
│ └─__pycache__
├─utils
└─work_dir
先创建好环境并安装好pytorch,激活环境(至于要安装什么pytorch版本,可以参考这篇文章:
conda create -n torchvu python=3.7
conda activate torchvu
conda install pytorch=1.8 torchvision cudatoolkit=10.2
进入项目目录:
cd Pyotrch-AudioClassification-master
安装相关包库:
pip install -r requirements.txt
tips:
如果prettytable库无法安装,可以尝试如下命令:
python -m pip install -U prettytable
将权重存放到任意路径下,打开pycharm项目tools下的predict.py文件。
修改get_arg下的参数——预测视频(已分帧)、权重文件以及类别信息文件的路径。运行即可
folder:
-datasets:
-class0
-0.wav
-1.wav
.......
-class1
-0.wav
-1.wav
.......
.......
1.在data下根据自己数据集的格式选择对应格式的demo;
2.运行分帧脚本并检查,之后运行对应的数据集信息生成脚本从而得到DIF等文件;
3.在train.py脚本文集里面修改get_arg函数下的参数;
4.运行train.py脚本即可;