비즈팩트

  • HOME >NEWS >경제 >IT >IT
    • 페이스북 공유하기
    • 트위터 공유하기
    • 글자크게
    • 글자작게
    • 인쇄하기
    기사제보
'국가대표 AI' 가장 먼저 탈락하는 기업은?...참가사 성능 입증 '사활'
입력: 2026.01.14 00:00 / 수정: 2026.01.14 00:00

LG 10개 항목 석권·SKT 한국어 1위 등 발표
1차 컷오프, '프롬 스크래치' 충족 여부 변수


정부 독자 인공지능(AI) 파운데이션 모델 프로젝트 사업에 참여하는 5개 정예팀이 1차 평가 결과를 앞두고 자사 AI 모델 성능 입증에 집중하고 있다. /우지수 기자
정부 '독자 인공지능(AI) 파운데이션 모델 프로젝트' 사업에 참여하는 5개 정예팀이 1차 평가 결과를 앞두고 자사 AI 모델 성능 입증에 집중하고 있다. /우지수 기자

[더팩트|우지수 기자] 정부가 추진 중인 '독자 인공지능(AI) 파운데이션 모델 프로젝트' 1차 평가 마감이 하루 앞으로 다가왔다. 5개 정예팀(SK텔레콤·LG AI연구원·네이버클라우드·업스테이지·엔씨소프트) 중 한 곳이 탈락할 예정인 가운데 기업들이 자사 AI 모델의 성능 보고서를 발표하고 있다.

14일 관련업계에 따르면 오는 15일 1차 평가 마감을 앞두고 후보 기업들은 글로벌 오픈소스 플랫폼 허깅페이스 등을 통해 자사 AI 모델의 기술보고서를 잇달아 공개하며 본격적인 검증 국면에 들어갔다. 기술보고서는 AI 모델의 구조와 학습 방식, 벤치마크 성능 등을 상세히 담은 제품 사양서다.

각 사가 자체적으로 진행해 공개한 주요 벤치마크 결과에 따르면 LG AI연구원의 'K-엑사원(EXAONE)'은 프로젝트 1차 평가 기준인 13개 벤치마크 테스트 중 10개 항목에서 1위를 차지했다. 영어 중심의 종합 지식 평가인 'MMLU-Pro'에서 83.8점으로 가장 높은 점수를 냈으며 수학(AIME 2025)과 코딩(라이브코드벤치) 능력 평가에서도 타 모델 대비 높은 점수를 받았다.

SK텔레콤의 '에이닷엑스 케이원(A.X K1)'은 고난도 한국어 벤치마크인 'KMMLU-Pro'에서 68.1점을 받아 1위를 달성했다. SK텔레콤은 아파치 2.0 라이선스를 적용해 상업적 이용과 수정 배포를 허용했다. 공개 나흘 만에 다운로드 8800여건을 넘어서기도 했다. 네이버클라우드는 일부 핵심 벤치마크 점수를 기술보고서에 포함하지 않았으나 후보군 중 유일하게 이미지와 음성을 함께 처리하는 '멀티모달' 기능을 탑재했다. 허깅페이스 누적 다운로드 수는 3만건을 넘겨 1위를 나타냈다.

업스테이지는 영어 중심의 종합 지식 평가인 'MMLU-Pro'에서 3위에 랭크됐으며 법률·의료·금융 등 전문 지식이 필요한 특화 분야 적용을 강조했다. 엔씨소프트의 'NC AI'는 자체 모델 '바르코'를 기반으로 한 '배키(VARCO)'를 통해 게임 개발과 시나리오 작성 등 산업 특화 활용성을 제시했다.

클렘 들랑그 허깅페이스 CEO가 SNS를 통해 한국 기업의 AI 모델들이 트렌드 순위에 오른 소식을 언급하며 관심을 드러넀다. /클램 들랑그 허깅페이스 CEO 링크드인 갈무리
클렘 들랑그 허깅페이스 CEO가 SNS를 통해 한국 기업의 AI 모델들이 트렌드 순위에 오른 소식을 언급하며 관심을 드러넀다. /클램 들랑그 허깅페이스 CEO 링크드인 갈무리

글로벌 AI 업계도 이들 모델을 주목하고 있다. 클렘 들랑그 허깅페이스 CEO는 SNS를 통해 한국 모델들이 트렌드 순위에 오른 사실을 언급하며 "AI 분야에서 미국과 중국에 대해 많이 이야기하지만, 오픈소스 덕분에 모든 국가가 개발자가 될 수 있으며 그렇게 돼야 한다"고 평가했다. 미국 비영리 연구기관 에포크AI는 5개 모델 전원을 '주목할 만한 AI'로 선정했다.

다만 업계는 벤치마크 점수와 함께 '프롬 스크래치' 충족 여부가 이번 1차 컷오프에 영향을 미칠 것으로 보고 있다. 프롬 스크래치는 데이터 수집부터 모델 설계와 학습까지 전 과정을 독자적인 과정으로 개발했는지를 따지는 기준이다.

최근 일부 기업이 해외 모델의 기술을 차용했다는 논란이 일면서 이 기준에 대한 정부의 판단이 중요해진 분위기다. 업스테이지와 SK텔레콤은 추론 코드 차용 의혹이, 네이버클라우드는 가중치 활용 의혹이 제기된 상태다. 네이버클라우드는 멀티모달 구현 과정에서 일부 인코더와 가중치 외부 차용을 인정했다. 반면 SK텔레콤과 업스테이지는 구조적 유사성은 있으나 핵심인 가중치 학습은 자체적으로 수행했다는 입장이다.

최종 판단은 과학기술정보통신부가 내린다. 아직 독자성에 대한 명문화된 가이드라인이 없는 상황에서 이번 1차 탈락자 선정은 향후 '소버린 AI(AI 주권)'의 정의를 규정하는 사례가 될 전망이다. 과기정통부는 제출된 개발 일지를 바탕으로 데이터 출처와 외부 기술 활용 범위를 검증할 계획이다. 한 IT업계 관계자는 "이번 1차 탈락자 선정은 한국형 독자 AI의 기준점을 잡는 과정"이라며 "정부가 명확한 가이드라인을 제시하면 향후 개발 방향성에 대한 업계의 혼선을 줄일 수 있을 것"이라고 말했다.

index@tf.co.kr

발로 뛰는 <더팩트>는 24시간 여러분의 제보를 기다립니다.
▶카카오톡: '더팩트제보' 검색
▶이메일: jebo@tf.co.kr
▶뉴스 홈페이지: http://talk.tf.co.kr/bbs/report/write
- 네이버 메인 더팩트 구독하고 [특종보자▶]
- 그곳이 알고싶냐? [영상보기▶]
AD
인기기사
  • BIZ & GIRL

    • 이전
    • 다음
 
  • TOP NEWS

 
 
  • HOT NEWS