Fine-tune T5 for Text Dialogue(Text Generation)

数据集

使用 ProsocialDialog 数据集 (单轮对话数据集)，其中训练集 120,236, 验证集 20,416, 测试集 25,029)

可从 Hugging Face (https://huggingface.co/datasets/allenai/prosocial-dialog) 了解更多

运行 load_and_process_dataset/prosocial_dialog.py。下载并处理 ProsocialDialog 数据集到本地，处理成：

[
    {
        "context": "I tried a bit of shadowboxing today. Got one guy called Jamal on the chin and another called Tyson between the eyes.",
        "response": "This isn't a joke about black people, right? If it is, it isn't funny."
    },
    {
        "context": "You're right, it isn't funny. Finding enjoyment in other people's pains isn't funny.",
        "response": "I am glad that you agree. Joking about abusing black people can quickly get you marked as a racist."
    },
    ...
]

运行后的结果可以在 dialogue_generation/T5/dataset 找到 (若因网络等原因无法连接到 Hugging Face 导致运行报错，可以直接使用该文件)

硬件设备要求

若使用 T5-base 作为预训练模型：

当使用全部数据用于训练时
- 若设置 train_batch_size=64，需要一块 48GB 的 GPU，训练一个 epoch 需要约 15min
- 若设置 train_batch_size=32，需要一块 24GB 的 GPU，训练一个 epoch 需要约 15min
- 若设置 train_batch_size=8，需要一块 12GB 的 GPU (训练时占 9GB 显存)，训练一个 epoch 需要约 30min
当使用部分数据 (从数据集中截取部分样本，训练集4k，验证集4k，测试集500) 用于训练时，若设置 train_batch_size=8，需要一块 8GB 的 GPU，训练一个 epoch 仅需 45s
如果仅仅想测试代码是否可运行，为节省时间，推荐使用部分数据用于训练。
可以通过运行 load_and_process_dataset/partial_prosocial_dialog.py 获得只有部分训练集和测试集的数据集，运行后的结果可以在 dialogue_generation/T5/partial_dataset 找到

训练相关参数和路径等

在 params.py 可以找到默认值，可以在该文件进行修改和设置。

若您了解如何使用 shell 脚本运行代码，也可以通过 train.sh 设置相关参数和路径

默认设置使用部分数据用于训练和测试，若希望在整个数据集上进行训练和测试，请启用 data_dir = os.path.join(sys.path[0], "dataset") (params.py中) 或 export DATA_DIR="dataset" (train.sh中)

运行

git clone https://github.com/friedrichor/NLP-HuggingFace-Tutorial
cd NLP-HuggingFace-Tutorial/dialogue_generation/T5

下载并处理 ProsocialDialog 数据集

python load_and_process_dataset/partial_prosocial_dialog.py

训练

python train.py

或

sh train.sh

此外，训练时使用了 logging 和 tensorboard 记录训练时各个参数/指标的变化。关于 tensorboard，可以通过以下命令查看

tensorboard --logdir=runs

测试

1. 生成预测回复

若训练后保存模型参数为 weights/t5-base-May19_16-41-26-epoch0-ppl12.552.pth 且使用该模型用于测试，则可通过以下代码测试

python generate_response.py --weights_name t5-base-May19_16-41-26-epoch0-ppl12.552.pth

运行后将会生成文件 results/gt_pred_response.json，可用于后续计算评价指标

2. evaluate/计算评价指标

提供了计算 BLEU 和 ROUGE 评价指标的代码

python evaluate.py

demo

使用训练后的模型用于单轮人机对话的 demo (t5-base-May19_16-41-26-epoch0-ppl12.552.pth 换成自己的模型名)

python demo.py --weights_name t5-base-May19_16-41-26-epoch0-ppl12.552.pth

使用自己的数据集进行训练

按照 dialogue_generation/T5/dataset 或 dialogue_generation/T5/partial_dataset 中的格式，将自己的数据集改成相同格式，即

[
    {
        "context": "I tried a bit of shadowboxing today. Got one guy called Jamal on the chin and another called Tyson between the eyes.",
        "response": "This isn't a joke about black people, right? If it is, it isn't funny."
    },
    {
        "context": "You're right, it isn't funny. Finding enjoyment in other people's pains isn't funny.",
        "response": "I am glad that you agree. Joking about abusing black people can quickly get you marked as a racist."
    },
    ...
]

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
__pycache__		__pycache__
load_and_process_dataset		load_and_process_dataset
logs		logs
results		results
runs/t5-small_May04_09-45-38		runs/t5-small_May04_09-45-38
.gitignore		.gitignore
README.md		README.md
dataset.py		dataset.py
demo.py		demo.py
evaluate.py		evaluate.py
generate_response.py		generate_response.py
params.py		params.py
train.py		train.py
train.sh		train.sh
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Fine-tune T5 for Text Dialogue(Text Generation)

数据集

硬件设备要求

训练相关参数和路径等

运行

下载并处理 ProsocialDialog 数据集

训练

测试

1. 生成预测回复

2. evaluate/计算评价指标

demo

使用自己的数据集进行训练

About

Releases

Packages

Languages

lifelsl/nlp-model

Folders and files

Latest commit

History

Repository files navigation

Fine-tune T5 for Text Dialogue(Text Generation)

数据集

硬件设备要求

训练相关参数和路径等

运行

下载并处理 ProsocialDialog 数据集

训练

测试

1. 生成预测回复

2. evaluate/计算评价指标

demo

使用自己的数据集进行训练

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages