"승부처는 GPU가 아니라 데이터 레이어"
![]() |
| 정부는 올해 AI 예산안을 10조1000억원 규모로 편성했다. /디노티시아 |
[더팩트ㅣ장병문 기자] 정부는 인공지능(AI) 3대 강국과 소버린 AI를 내걸고 역량을 집중하고 있다. 해당 분야는 계산용 칩만으로 성공하기 어렵다. 대규모 비정형 데이터를 얼마나 빨리 찾고 정확히 연결하느냐가 생성형 AI 성능을 가르는 승부처로 꼽히면서 백터 검색, 저장 반도체 경쟁이 본격화 되고 있다.
19일 업계에 따르면 정부는 올해 AI 예산안을 10조1000억원 규모로 편성했다. 지난 4월 14일에는 금융위원회가 '국민성장펀드 제2차 전략위원회'를 열고 소버린 AI를 150조원 규모 국민성장펀드의 2차 메가프로젝트로 확정했다. 10조원 안팎의 자금이 우선 투입될 예정이며, 향후 5년간 50조원 이상의 대규모 자금이 첨단산업 생태계에 공급된다.
다만 현장에서는 'AI 경쟁력은 더 많은 계산용 칩만으로 완성되지 않는다'는 의견이 나온다. 정부가 소버린 AI의 범위를 '반도체 → 데이터센터 → 파운데이션 모델 → 응용 서비스'로 이어지는 전 주기 자립형 생태계로 규정한 것처럼, 생성형 AI가 기업 안으로 들어갈수록 답을 잘 만드는 능력은 모델 자체보다 사내 문서와 이미지, 영상, 도면 같은 다양한 데이터를 얼마나 빨리 찾고 정확히 연결하느냐에 달려 있다. 비정형 데이터를 제때 꺼내 답변에 붙이지 못하면, 모델이 아무리 좋아도 응답은 느려지고 정확도도 떨어진다.
이 과정에서 벡터 데이터베이스가 새 전장으로 떠오르고 있다. 최근 기업들이 도입하는 RAG(검색증강생성)는 사내 데이터를 찾아 답변에 반영하는 방식이다. 이 기술은 AI의 허위 답변을 줄이는 데 도움을 주지만, 동시에 새로운 병목도 만든다. 데이터를 저장하는 구조가 느리거나 검색이 비효율적이면, 좋은 모델을 얹어도 응답 속도와 정확도가 함께 떨어질 수 있다.
국내에서 이 영역을 정면으로 파고드는 회사 중 하나가 디노티시아다. 2023년 설립된 이 회사는 생성형 AI 시대에 필요한 데이터 검색·처리·활용 기술을 소프트웨어와 반도체 관점에서 통합 개발하고 있다. 특히 고성능 벡터 데이터베이스 '씨홀스 클라우드(Seahorse Cloud)'는 데이터를 파싱, OCR 후처리, 구조 복원, 테이블 처리, 청킹, 벡터화 과정을 등을 AI 에이전트 서비스에 적용될 수 있도록 운영 환경을 제공한다. 씨홀스는 소프트웨어만으로도 경쟁사 대비 2배 이상의 검색 성능을 제공하며, 지난 3월에는 한국정보통신기술협회(TTA)로부터 소프트웨어 품질 최고 등급인 'GS인증 1등급'을 획득했다.
세계 최초로 벡터 데이터 처리 전용 가속 반도체 'VDPU(Vector Data Processing Unit)'을 자체 개발해, 대규모 비정형 데이터를 보다 빠르고 정확하게 활용할 수 있도록 한다. 지난해 11월 미국 슈퍼컴퓨팅(SC25) 전시회에서 공개된 내부 테스트 결과, VDPU 카드 1장이 고성능 서버 CPU 최대 6개와 동등한 벡터 검색 성능을 보이는 것으로 확인됐다.
회사 측에 따르면 VDPU 기반 씨홀스 엔진은 기존 벡터 DB 솔루션 대비 최대 15배 빠른 성능과 88%의 총소유비용(TCO) 절감 효과를 목표로 하고 있으며, 최종 상용 ASIC 버전은 2026년 하반기 공개를 앞두고 있다. 디노티시아는 엔비디아가 올해 공식화한 AI 스토리지 플랫폼 규격 'CMX(Context Memory Storage)' 생태계 진입도 목표로 삼고 있다. 엔비디아 서버 내에 VDPU를 탑재해 KV캐시 정보 압축과 검색 가속화를 담당하는 방식으로, 스토리지 제품 출시 후 본격적인 공급망 진입을 추진할 계획이다.
jangbm@tf.co.kr








