Optimize LLM on Edge Devices Loop Unrolling, Multithreading, SIMD(Single Instruction, Multiple Data) 세 가지 기법을 이용한 추론 가속과 메모리 footprint 감소 (kernels/starter_code) 작성 야호!