프로젝트 접근 방향에 대한 대략적 생각들 #16
doraemon500
started this conversation in
General
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
이번 프로젝트에서는 학습 데이터셋과 테스트 데이터셋으로 나누어져 있고 진행 방식도 크게 모델 학습 후 테스트셋으로 추론하여 그 결과를 바탕으로 리더보드의 순위가 매겨지는 방식임. 즉, 우리는 훈련 과정과 테스트 과정 두 가지 방향으로 최종 결과 성능을 높힐 수 있는 방식을 나눌 수 있다고 생각.
훈련 과정에서는 MRC 를 잘 수행할 수 있는 성능 좋은 모델을 구현하는 게 목표
-> 데이터 전처리 , 데이터 증강 , 성능 좋은 base model 선택 등
테스트 과정에서는 훈련 과정에서는 없는 context를 추출해야하는 retrieval 과정이 존재. 이로 인해서 아무리 성능이 좋은 모델이라도 retrieval 방식에 따라서 성능이 천차만별이 될 수도 있음
-> 다양한 retrieval 방식 시도 및 조합 등
Beta Was this translation helpful? Give feedback.
All reactions