pip install -r requirements.txt
python3 train.py files plagiat1 plagiat2 --model model.pkl
- files - директория с оригинальными программами
- plagiat1, plagiat2 - директории с плагиатными программами
- model.pkl - файл, куда будет сохранена модель
- примерная длительность обучения - 4 минуты
python3 compare.py input.txt scores.txt --model model.pkl
-
input.txt - файл с парами путей к файлам программ, которые нужно проверить на плагиат
-
scores.txt - файл, куда будут сохранены результаты оценки
-
model.pkl - файл с моделью
-
пример файла input.txt:
files/main.py plagiat1/main.py
files/loss.py plagiat2/loss.py
files/loss.py files/loss.py
- Каждой строке файла input.txt соответствует строка файла scores.txt, в которой записано число от 0 до 1 (чем ближе число к 1, тем выше вероятность плагиата)