自定义数据集训练的话，是不是只需要把数据集做成cluener的样子，放在dataset/cluener文件就可以了，需不需要为自己的数据集重写processor？ #96

LXXiaogege · 2023-09-08T08:11:18Z

No description provided.

chasingdream9 · 2023-11-28T13:06:34Z

请问你用自定义的训练集训练成功了吗，我也是不知道怎么自己训练其他的数据集

jhy354 · 2023-12-02T11:55:52Z

格式一样就不用重写processor吧, 我半年前在华为云modelart上训练过自己的数据, 格式一样直接用就行了
或者格式不一样的话可以试试写个脚本转化成一样的格式, 这样方便一点, 不用改processor

Violettttee · 2023-12-29T17:52:44Z

格式一样就不用重写processor吧, 我半年前在华为云modelart上训练过自己的数据, 格式一样直接用就行了或者格式不一样的话可以试试写个脚本转化成一样的格式, 这样方便一点, 不用改processor

如果我的标签有所增加删减的话，在processor中需要添加我增加/删除的标签吗？

jhy354 · 2023-12-31T13:02:51Z

格式一样就不用重写processor吧, 我半年前在华为云modelart上训练过自己的数据, 格式一样直接用就行了或者格式不一样的话可以试试写个脚本转化成一样的格式, 这样方便一点, 不用改processor

如果我的标签有所增加删减的话，在processor中需要添加我增加/删除的标签吗？

是的, 如果不想改其实可以偷懒, 直接文本替换掉就行了
比如你用不到NAME, 那就把所有O-NAME B-NAME替换成你要的标签就行

Provide feedback