카카오브레인이 내년 글로벌 최대 멀티모달로 난제를 해결하겠다는 포부를 밝혔다. /카카오브레인 간담회 화면 캡처 |
20일 김일두 대표 간담회 열어…코지피티·민달리로 교육·헬스케어 부분 개발
[더팩트|한예주 기자] 카카오가 글을 쓰는 것을 넘어 그림까지 그릴 수 있는 인공지능(AI)을 개발해 공개했다.
김일두 카카오브레인 대표는 20일 온라인 간담회를 열고 초거대 AI 로드맵과 내년 핵심 기술 연구 계획, 방향성 등을 설명했다.
최근 오픈소스로 공개한 초거대 AI 모델 'KoGPT(코지피티)'와 'minDALL-E(민달리)'가 핵심이다.
코지피티는 한국어 초거대 언어모델이다. 민달리는 이용자가 텍스트를 명령어로 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 1400만 장의 텍스트와 이미지 세트를 사전 학습하고, 13억 개의 파라미터(매개변수)를 가지고 있다.
예를 들어 "바나나 껍질로 만든 의자 그려줘", "보름달과 파리 에펠탑이 같이 있는 그림 보여줘", "살바도르 달리 화가 스타일로 그려줘" 라는 명령어를 입력하면 AI가 명령어의 맥락을 이해하고 바로 이미지를 도출한다. 검색을 통해 이미지를 찾아내는 것이 아니라 AI가 스스로 명령을 이해하고 직접 이미지를 그리는 것이다. 스토리텔링 콘텐츠의 삽화를 만들거나, 교육 자료 제작 등에 활용하는 등 다양한 콘텐츠 산업에 적용할 수 있을 것으로 기대된다.
김일두 대표는 "구글의 경우 18억 건의 데이터셋을 구축했고, 오픈 AI의 경우 10억 건을 만들었다"며 "카카오브레인의 경우 20억 건의 데이터셋을 구축했고 이미지와 텍스트를 동시에 이해할 수 있는 모델을 내년 1월 일부 공개할 것"이라고 설명했다.
카카오브레인은 교육과 헬스케어의 난제성 이슈들을 AI로 많이 해결할 수 있을 것이라고 전망했다. 민달리 이미지. /카카오브레인 제공 |
코지피티 모델의 성능 고도화에도 집중하고 있다. 구글에서 개발한 텐서 처리 장치인 '구글 TPU'를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위·초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입해 연구 효율을 높였다. 아울러 코지피티 모델의 매개변수(파라미터)를 60억 개에서 300억 개의 사이즈까지 5배 늘려 이전보다 더 정확하게 명령을 이행할 수 있도록 만들었다.
카카오브레인의 AI가 적용될 분야로는 '교육'과 '헬스케어'를 점찍었다.
김 대표는 "교육과 헬스케어 분야에서는 하이테크 기반으로 난제성 이슈들을 많이 해결할 것이라 믿고 있다"며 "많은 스타트업들과 연구 기관이 세상을 바꿀 고민들을 함께 해 나갔으면 좋겠다"고 말했다.
카카오브레인은 카카오의 헬스케어 사내독립기업(CIC)과도 협업을 이어간다는 계획이다. 그는"카카오브레인은 차별화된 연구 요소 기술을 선도해 가면서 인식과 수많은 경로에서 탐색을 넘어서 사람 같은 인공지능을 향해 도전해 나갈 것"이라며 "세상의 가장 중요한 문제에서 이 기술들이 쓰여지게 할 것"이라고 강조했다.
hyj@tf.co.kr