KT 광화문 이스트 사옥. /사진=뉴스1
KT는 16일 서울 송파구 소피텔 앰배서더 서울에서 'K 데이터 얼라이언스' 협약식을 개최했다고 밝혔다. 한국적 AI 경쟁력의 핵심 자산이자 AI 모델 성능을 좌우하는 올바르고 신뢰할 수 있는 고품질 데이터 교류를 위해 한국 대표 기업과 공공, 학계가 공고한 협력을 추진하겠다는 취지다.

이날 KT를 비롯한 고려대학교 민족문화연구원, 두산디지털이노베이션, 아이스크림에듀, 중앙일보, 한국교육방송공사(EBS), 한글학회 등 총 7개 기관 관계자가 참석해 'K 데이터 얼라이언스' 결성을 위한 협약을 맺었다. 이어 AI 데이터 생태계 구축에 대해 밀도 있게 논의하는 자리도 마련됐다.


이 자리에서 KT는 K 데이터 얼라이언스의 주관사로서 한국적 AI 철학을 구현하기 위해 한국어 고유 표현과 사회·문화적 맥락, 사용자의 다양한 목적을 반영할 수 있는 고품질 데이터의 중요성을 강조했다. 각 분야에서 선도적 역할을 하고 있는 대표 기관들이 보유한 한국적 데이터를 공유하는 것이 어떤 의미와 가치가 있는지 역설했다.

K 데이터 얼라이언스 결성은 한국적 AI의 구현과 안전하고 가치있는 활용에서 나아가 협력과 개방을 통한 확산으로 함께 성장하고 발전하는 생태계를 조성해 글로벌 경쟁력을 갖추겠다는 사명감과 공감대가 원동력이 됐다는 평가다.

각 기관들은 앞으로 ▲한국적 AI를 위한 데이터 구축 ▲한국적 AI 관련 도메인 선도 사례 창출 ▲한국적 AI 관련 활동·성과에 대한 홍보 및 대외 확산 ▲한국적 AI 데이터에 기반한 인문·사회분야 연구를 위해 긴밀한 상호 협력을 이어갈 예정이다.


KT는 한국의 정신과 언어, 문화, 지식 등의 정체성을 담아 한국을 가장 잘 이해하고 안전하며 신뢰할 수 있는 '한국적 AI'를 개발해 대한민국의 산업과 일상 속 AI 대중화를 위해 앞장서고 있다. 이를 위해 최우선으로 올바르고 신뢰할 수 있는 데이터의 중요성을 강조하며 교육, 인문, 역사, 한국어, 언론 등 각 영역에서 대표 콘텐츠를 보유한 기업과 기관들이 K 데이터 얼라이언스로 결집할 수 있도록 주도했다.

KT는 각 기관이 보유한 콘텐츠들을 선별해 고품질 데이터로 가공하고, AI가 학습할 수 있는 형태로 구조화해 독자 개발 모델인 믿:음 2.0, 마이크로소프트 협력 기반 GPT 모델, 이외 오픈소스 모델 등의 한국적 AI 모델과 서비스로 연결한다.

특히 EBS가 보유한 검증된 학습·교양 콘텐츠와 함께 질문-답변 형태로 구조화된 피드백 기반 학습 데이터는 AI 모델의 핵심 기능인 추론 능력을 향상시킬 수 있는 최적화된 자원이다. 이는 한국어 사용자 특유의 질문 방식과 문맥을 이해하는 데 있어 매우 높은 가치를 지닌다.

정치·사회·문화 전반의 시대 흐름을 빠짐없이 기록해 온 언론 분야에서도 참여한다. 중앙일보의 뉴스 콘텐츠는 한국 사회를 입체적으로 반영하는 고유한 언어 자산으로 모델의 문맥 이해와 사실 기반 응답 생성에 있어 신뢰할 수 있는 학습 자원으로 평가된다.

앞으로 K-데이터 얼라이언스에 참여하는 각 기관들은 KT를 구심점으로 정기 협의체를 운영하고 추진 성과를 공유하며 한국적 AI 확산을 위한 신규 과제를 발굴하는 등 실행력과 결속력을 더한다. 또 참여기관의 지속적인 확장을 추진해 데이터-모델-서비스로 이어지는 정교한 한국적 AI 데이터 생태계를 구축해 나갈 방침이다.

오승필 KT 기술혁신부문 부사장은 "한국적 AI는 국가의 AI 경쟁력을 높이는 동시에 기업의 AI 혁신을 촉진하고 국민이 일상 속에서 체감할 수 있는 실용적 가치로 이어져야 한다"며 "K 데이터 얼라이언스가 한국적 AI의 지속적인 고도화와 실용화에 있어 핵심 동력이 될 수 있도록 힘을 모아 협력해 나갈 것"이라고 밝혔다.