
[더팩트|우지수 기자] SK텔레콤이 매개변수 5190억개(519B) 규모의 초거대 AI 모델 'A.X K1(에이닷엑스 케이원)' 기술 보고서를 공개했다. 4개월이라는 짧은 기간에 자체 자원만으로 개발했음에도 수학과 코딩 등 주요 벤치마크에서 글로벌 오픈소스 모델을 압도하는 성능을 확보했다.
7일 SK텔레콤은 글로벌 오픈소스 플랫폼 허깅페이스에 이 같은 내용을 담은 기술 보고서를 게재했다. 정예팀은 1000개의 GPU를 활용해 약 10조개(10T)의 데이터를 학습시켰다. 정부 지원 없이 자체 GPU 조달만으로 국내 첫 500B 이상 초거대 모델을 완성해 개발 효율을 입증했다.
A.X K1은 성능 면에서 경쟁력을 보였다. 미국 고등학생 수학 올림피아드 문제인 AIME25 벤치마크에서 89.8점을 받아 '딥시크-V3.1(88.4점)'을 앞섰다. 실시간 코딩 능력을 측정하는 '라이브코드벤치'에서도 영어 75.8점과 한국어 73.1점을 기록하며 경쟁 모델 대비 100% 이상의 성능을 나타냈다.
효율적인 구조 설계가 주효했다. 전체 5190억개 파라미터 중 330억개만 선택적으로 활성화하는 '전문가 혼합(MoE)' 구조를 채택해 훈련 안정성과 효율을 확보했다. 한 번에 12만8000토큰의 긴 문맥을 처리할 수 있어 소설책 한 권이나 기업 연간 보고서도 동시에 검토 가능하다.
SK텔레콤 관계자는 "제한된 자원에도 스케일링 이론에 근거한 설계로 글로벌 수준의 성능을 확보했다"며 "연내 멀티모달 기능을 추가하고 조 단위 파라미터로 모델을 확장할 계획"이라고 말했다.
index@tf.co.kr