‘소버린 AI’ 정책 맞물려 국내 AI 생태계 경쟁 본격화
KT 기술혁신부문 연구원들이 서울 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있다. KT 제공
SK텔레콤과 KT가 각각 자체 개발한 한국어 특화 대규모 언어모델(LLM)을 오픈소스로 공개했다. 두 회사가 같은 날 한국어와 한국적 맥락에 최적화된 자체 인공지능(AI) 모델을 개방한 것은 이재명 정부가 추진하는 '소버린(주권형) AI' 정책 기조와 맞물려 있다는 평가다. 국내 통신업계 1, 2위 기업이 국내 AI 생태계의 선순환 모델을 만들 수 있다는 해석도 나온다.
그래픽=이지원 기자
3일 SKT와 KT는 각각 '에이닷X 4.0' '믿:음 2.0', LLM을 글로벌 AI 개발자 플랫폼 허깅페이스를 통해 공개했다고 밝혔다. SKT의 '에이닷X 4.0'은 큐엔(Qwen)2.5 오픈소스 모델에 한국어 데이터를 추가 학습해 720억(표준)과 70억(경량) 매개변수 모델을 제공한다. 기업 내부 서버에 설치하는 '온프레미스' 방식을 지원해 기업 데이터 보안과 처리 효율을 강조했다. SKT는 "기업들이 데이터 보안에 대한 걱정을 덜 수 있게 할 계획"이라고 설명했다. 이 모델은 에이닷 통화 요약 등 SKT의 서비스에 적용 중이며 그룹 내 더 많은 서비스에 적용할 예정이라고 SKT는 설명했다.
KT의 믿:음 2.0은 베이스 모델이 매개 변수 115억 개, 미니 모델이 매개변수 23억 개로 이뤄져 있다. KT는 자체 데이터 수집과 토크나이저 개발을 통해 한국어와 기업간거래(B2B) 환경에 최적화됐다고 설명했다. 신동훈 KT 생성형 AI 랩장은 "국내 기술로 설계·학습한 믿:음 2.0은 누구나 자유롭게 상업적으로 활용할 수 있다"며 "공공, 금융, 교육, 법률 등 다양한 분야에 적용할 수 있게 확장할 계획"이라고 밝혔다. 실제로 KT는 이 모델을 지니TV, AI 고객센터 등 자사 서비스에 적용하고 있는데 공공·금융·교육 등 다양한 산업 분야로 활용 범위를 넓힐 계획이다.
SK텔레콤 에이닷X 4.0의 대규모 학습(CPT)을 진행한 SKT 자체 구축 슈퍼컴퓨터 ‘타이탄’. SK텔레콤 제공
두 회사가 이례적으로 같은 날 LLM을 꺼내 놓은 것은 정부가 추진하는 소버린 AI 정책과도 밀접한 관련이 있다는 평가다. 이재명 정부는 AI 기술의 자립과 데이터 주권을 강조하며 공공·민간 협력형 독자 AI 모델 개발을 핵심 정책으로 내세우고 있다. SKT와 KT 모두 정부의 독자 AI 파운데이션 모델 프로젝트 참여 의사를 밝히며 국내 AI 생태계의 자립과 확산에 힘을 보태겠다는 입장이다.
SKT는 한국어와 한국 문화에 특화된 모델을 통해 국내 산업 환경에 최적화된 AI 서비스를 제공하겠다고 밝혔다. 오승필 KT 최고기술책임자(CTO)도 이날 기자간담회에서 "한국 데이터 주권과 문화적 가치 반영이 핵심"이라며 "모든 데이터는 국내에서 확보·관리하고 한국 사회가 요구하는 윤리 기준과 문화적 특성을 반영한다"고 말했다. 양사에 따르면 에이닷X 4.0과 믿:음 2.0은 Ko-소버린, KMMLU, CLIcK 등 한국어와 한국 문화 이해도를 측정하는 벤치마크에서 기존 글로벌 모델을 뛰어넘는 결과가 나왔다.
두 통신사가 경쟁적으로 LLM 오픈소스 전략에 나선 것은 국내 AI 생태계의 자립과 경쟁력 강화를 목적으로 했다는 평가가 나온다. SKT는 "기업과 연구 현장에서 자유롭게 활용할 수 있는 AI 생태계 조성에 앞장서겠다"고 강조했다. KT는 "모든 모델 라인업에 한국적 정신을 담아 국민 데이터의 주권을 지키겠다"고 밝혔다. 두 회사는 멀티모달, 추론형 등 고도화된 LLM을 추가로 공개할 계획도 밝혔다. 국내 AI 시장에서 '한국적 AI' 경쟁이 더 치열해 질 것이라고 예측하게 하는 대목이다.
김진욱 기자 kimjinuk@hankookilbo.com
Copyright © 한국일보. 무단전재 및 재배포 금지.