Replies: 6 comments 7 replies
-
저의 경우 테스트용으로 "yjgwak/klue-bert-base-finetuned-squad-kor-v1" 모델을 사용하였고, aistage 기본 제공 코드와 baseline 코드를 비교 분석을 하고 있습니다.
|
Beta Was this translation helpful? Give feedback.
-
training_args.learning_rate = 1e-5 기존에 위와 같은 환경에서 저는 실험을 진행하고 있었고 |
Beta Was this translation helpful? Give feedback.
-
시드 번호 default 42로 통일 -> set_seed 함수를 사용하면 됩니다. |
Beta Was this translation helpful? Give feedback.
-
sandbox/template_code 브랜치에서 uomnf97/klue-roberta-finetuned-korquad-v2 를 가지고 동일 하이퍼파라미터 조건에서 seed 42 -> 2024로 모두 맞춘 후 진행해 봤으나 |
Beta Was this translation helpful? Give feedback.
-
베이스라인 코드(utils_qa.py에 seed함수가 42로 되어있으나, inference.py를 제외하고 나머지는 seed가 2024로 직접 할당됨)를 참고해서 아래와 같은 실험을 해봤어요. 최고 성능을 냈던 모델(uomnf97/klue-roberta-finetuned-korquad-v2)은 베이스라인 코드에서 정해준대로 seed를 썼기 때문인데요. A-> 기존 dev 방식대로 set_seed 함수를 통해 42로 고정 결과는 거의 동일한 수준으로 큰 의미는 없었어요. |
Beta Was this translation helpful? Give feedback.
-
#26 Seed 문제 해결로 본 Discussion은 종료합니다. |
Beta Was this translation helpful? Give feedback.
-
같은 모델을 사용하는데 코드가 달라서 점수가 다르게 나오는 문제를 파악하고 있고, 해결 방안을 찾고 있습니다.
각자 실험하고 있는 내용과 문제점 등을 공유하면 좋을 것 같아 discussion을 남깁니다. 자유롭게 의견 부탁드립니다.
변인 통제를 위해 다음의 하이퍼파라미터 설정을 해주세요
위의 설정은 trainer 인스턴스 정의 직전에 다음의 코드를 넣으면 됩니다.
Beta Was this translation helpful? Give feedback.
All reactions