• 맑음동두천 -7.1℃
  • 맑음강릉 -3.5℃
  • 맑음서울 -5.8℃
  • 맑음대전 -4.5℃
  • 맑음대구 -2.0℃
  • 맑음울산 -2.4℃
  • 구름많음광주 0.0℃
  • 맑음부산 -0.2℃
  • 흐림고창 -0.9℃
  • 흐림제주 5.2℃
  • 맑음강화 -5.8℃
  • 맑음보은 -5.4℃
  • 맑음금산 -3.8℃
  • 구름많음강진군 1.7℃
  • 맑음경주시 -1.6℃
  • 맑음거제 0.8℃
기상청 제공

2026년 01월 08일 목요일

메뉴

과학·기술·정보


KT ‘믿:음 K’, AI 평가 플랫폼 AAII서 국내 중소형 모델 최고 기록

글로벌 AI 성능평가 플랫폼 AAII에 등재, 국내 중소형 모델 중 최고점
에이전트 성능 최정상 수준...한국 기업 위한 ‘에이전틱 AI’ 솔루션 제시

 

KT는 자체 개발한 AI 모델 ‘믿:음 K’가 글로벌 AI 모델 성능을 종합 평가하는 플랫폼 ‘AAII(Artificial Analysis Intelligence Index)’에서 국내 중소형 모델 중 1위를 달성했다. 특히 에이전틱 AI(Agentic AI) 분야에서 높은 성적을 거뒀다.


KT는 이번 성과를 바탕으로 기업 고객이 손쉽게 도입할 수 있는 ‘작지만 강한’ AI 모델로 국내 B2B 시장 공략에 박차를 가할 방침이다.

 

AAII는 AI 평가 전문기관인 Artificial Analysis가 운영하는 글로벌 평가 플랫폼으로, 전 세계 주요 AI 모델의 성능을 단일 시험이 아닌 다수의 공개 벤치마크 결과를 종합해 사용자에게 객관적이고 신뢰성 있는 AI 모델 정보를 제공한다. 국내 주요 AI 모델인 LG 엑사원(Exaone), 네이버 하이퍼클로바(HyperCLOVA), 업스테이지 솔라(Solar), 모티프(Motif) 등도 함께 등재돼 한국의 AI 경쟁력을 알리고 있다.


이번 평가에서 ‘믿:음 K’는 추론, 전문 지식, 수학·프로그래밍, 에이전트 수행 능력 등 10여개 핵심 평가 항목에서 전반적으로 우수한 점수를 기록해 ‘범용적으로 똑똑한 AI’임을 공식적으로 인정받았다. 이는 ‘믿:음 K’가 목표를 이해한 뒤 필요한 시스템이나 도구를 스스로 활용해 과업을 완수하는 ‘에이전틱 AI(Agentic AI)’로 글로벌 경쟁력을 갖췄음을 객관적으로 입증한 것이다.


이번 AAII 공개 결과에서 KT의 ‘믿:음 K’는 주요 에이전트 성능 벤치마크 τ²-bench(타우 스퀘어 벤치) 점수에서 87%를 기록하며 에이전틱 AI 분야 최정상 모델로 이름을 올렸다. 타우 스퀘어 벤치는 AI가 실제 업무 환경에서 사람과 협업하며 여러 도구를 활용해 과업을 끝까지 수행할 수 있는지를 평가하는 에이전트 특화 벤치마크다.


최근 AI 시장은 단순 대화형 AI를 넘어 업무를 대신 처리하는 AI 에이전트 시대로 빠르게 전환되고 있다. ‘믿:음 K’는 기업 내부 업무 자동화, 문서 분석 및 작성, 소프트웨어 개발, 서버 관리 등 실무 중심 영역에서 인간의 개입을 최소화하고 자율적으로 과업을 수행해 기업들이 실제로 비즈니스 현장에 즉시 투입해 성과를 낼 수 있는 ‘실전형 AI’로서의 가치를 인정받았다는 점에서 큰 의미가 있다.


‘믿:음 K’는 에이전틱 지표 외에도 전문 지식과 고난도 추론 능력을 평가하는 MMLU Pro, GPQA, HLE 등 주요 벤치마크에서도 우수한 성적을 고르게 받았다. 특히 한국어 이해 성능 지표에서는 국내 최고 수준을 달성했다.

 

KT ‘믿:음 K’는 보고서 작성, 문서 요약, 데이터 분석, 고객 응대 등 실무 현장에서 즉시 활용 가능한 다양한 시나리오에 대응할 수 있도록 설계됐다. 이는 KT가 초기 개발 단계부터 철저히 B2B 시장을 정조준하며 모델 개발을 추진한 결과다. 최근 기업들이 자사만의 특화된 ‘AI 에이전트’ 서비스를 개발하고자 하는 니즈를 파악했기 때문이다.


KT는 국내외 주요 데이터 보유기관과 ‘데이터 얼라이언스’를 결성하고, 깨끗하고 정교한 고품질 데이터를 학습에 활용했다. 또 주요 B2B 고객사들과 긴밀히 협력하며 실제 현장에서 작동하는 모델을 만들기 위해 노력했다.

 

KT는 이를 계기로 ‘믿:음 K’를 국내 B2B 시장에 최적화된 에이전틱 AI 모델로 본격 확산할 계획이다. 금융·공공·제조 등 산업별로 기업의 실제 업무를 자동화하고 스스로 판단해 처리하는 맞춤형 AI 에이전트를 제공해, 기업 고객의 AI 전환을 선도하겠다는 전략이다.


오승필 KT 기술혁신부문장(부사장)은 “이번 AAII 등재는 KT의 자체 AI 기술력이 글로벌 기준에 도달했음을 객관적으로 입증한 성과”라며 “에이전틱 AI를 통해 한국 기업들의 업무 혁신과 디지털 전환을 이끄는 최고의 AI 파트너가 되겠다”고 말했다.




HOT클릭 TOP7


배너






사회

더보기
크래프톤 배그M, ‘포레스트’ 테마와 신규 시스템 업데이트 공개
크래프톤(Krafton)의 배틀그라운드 모바일(PUBG MOBILE)이 업데이트를 진행하고 신규 테마 콘텐츠 ‘포레스트(Forest)’ 테마 모드를 선보였다. 이번 포레스트 테마 모드에서는 세계수의 힘이 나타난 이후 변화한 전장의 모습을 확인할 수 있다. 일부 대도시에는 새로운 건축 지역이 추가되고, 외형과 환경이 변화한 지형이 적용된다. 세계수의 영향을 받은 신규 지역인 ‘감염된 도시’와 ‘오염된 숲’도 등장하며 기존과는 다른 전투 경험을 제공한다. 감염된 도시에는 다양한 돌연변이 식물이 등장하는데 이를 처치하면 오염된 덩굴에 쌓인 상자를 획득할 수 있다. 오염된 숲에서는 돌연변이 꽃과 강력한 돌연변이 왕꽃이 출현하며, 왕꽃을 처치한 뒤 상자를 획득해 다양한 보상 획득이 가능하다. 이용자들은 두 지역을 탐험하며 전투와 보상 획득을 동시에 즐길 수 있다. 포레스트 테마 모드에는 사녹 맵을 제외하고 신규 NPC ‘나무 정령 바클’이 추가된다. 전투 종료 후 일정 시간이 지나면 맵에서 바클을 찾을 수 있으며, 상호작용을 통해 팀에 합류시키는 것이 가능하다. 바클은 교전에서 적을 선제공격하고, 소환 플레이어의 체력이 낮으면 몸으로 총알을 막아 보호한다. 또 소환