카카오, 자체 개발 LLM 오케스트레이션 능력 평가 벤치마크 ‘ICLR 2026’ 논문 채택... 깃허브에 오픈소스로 공개
- 오케스트레이션 벤치마크 자체 개발, AI 분야 국제 학술대회 ICLR 2026 논문 채택
- LLM의 에이전틱 AI 고도화 트렌드 착안... 다양한 작업 계획하고 처리하는 능력 평가에 초점
- 실 서비스 대화 흐름 기반 시나리오 구축, 한국어 맥락 및 문화적 특성 반영해 실용성·정확도 높여... AI 연구 개발 생태계 활성화 위해 오픈소스로 공개
[2026-02-03] 카카오의 인공지능(AI) 연구 개발 성과가 글로벌 학회를 통해 인정받으며 기술 경쟁력을 입증했다.
카카오(대표이사 정신아)는 자체 개발한 AI 모델의 오케스트레이션 능력 평가 지표인 ‘오케스트레이션 벤치마크(Orchestration Benchmark)’가 세계 3대 AI 학회인 ‘ICLR 2026’의 논문으로 채택됐다고 3일 밝혔다.
ICLR(국제표현학습학회, International Conference on Learning Representations)은 글로벌 빅테크 기업들이 주목하는 인공지능 분야의 최고 학술대회다. ICLR 2026에는 약 19,000여 건의 논문이 제출됐으며, 이 가운데 상위 28%만 채택됐을 정도로 경쟁이 치열하다.
카카오는 최근 대형 언어모델(이하 LLM)이 단순 질의응답을 넘어 이용자가 요구하는 다양한 종류의 작업을 계획하고 조율하는 에이전틱(Agentic) AI로 고도화되고 있는 기술 트렌드에 주목해 이번 벤치마크를 개발했다. 특히, 실제 서비스 환경에서의 멀티 스텝(Multi-step)과 멀티 도메인(Multi-domain) 처리 능력을 평가하는 데 초점을 맞췄다.
기존의 LLM 벤치마크는 단편적인 성능 평가에 그쳐, 복잡한 사용자 요청을 해석해 적절한 도구를 호출하고 다양한 작업 간 의존 관계를 관리하는 오케스트레이션 능력을 평가하는데 한계가 존재했다. 이에 카카오는 실제 서비스 시나리오를 기반으로 AI 모델의 작업 계획(Planning)과 도구 실행(Tool Execution)을 분리하여 정밀하게 평가하는 새로운 프레임워크를 제시했다.
이번 오케스트레이션 벤치마크는 여행·쇼핑·금융·일정 등 17개 서비스 도메인과 100여 개의 가상 도구를 포함해 구성했으며, 사용자 요청 변경이나 추가 질문 등과 같은 실제 서비스 상의 대화 흐름을 토대로 시나리오를 구축해 실용성을 높였다.
모든 평가 데이터는 AI 어노테이터의(Annotator)의 수작업을 통해 구축 및 검증됐으며, 한국어와 영어 두 가지 언어를 지원한다. 한국어의 경우 문화적 특성과 맥락을 반영해 평가의 정확도와 신뢰도를 높인 것이 특징이다.
카카오는 글로벌 AI 생태계의 활성화에 기여하고, 연구 개발 성과의 자유로운 활용을 위해 해당 논문을 오픈소스 플랫폼 깃허브(GitHub)에 공개했다.
카카오 관계자는 “오케스트레이션 벤치마크는 에이전틱 AI가 실제 서비스 환경에서 안정적으로 작동하는지를 평가하는 핵심 도구로, 스스로 판단하고 이행하는 에이전틱 AI로 진화하는 현 시점에서 의미있는 연구 성과”라며 “향후에도 에이전트 간 협업 및 오케스트레이션 능력 강화를 위한 연구를 지속할 예정이며, 카카오의 에이전틱 AI 방향성에 부합하는 기술의 고도화를 추진해 갈 계획”이라고 말했다. (끝)
참고) LLM Orchestration Benchmark 깃허브 공개
- 보도자료 발행일 2026.02.03 카카오, 이모티콘 ‘올해의 작가 프로그램’ 정식 운영
#카카오#이모티콘#올해의작가 - 보도자료 발행일 2026.01.05 카카오, ‘카톡 숏폼 챌린지’로 창작자 발굴 및 성장 지원
#카카오#카카오톡#숏폼#크리에이터 - 보도자료 발행일 2026.01.05 카카오, ‘스스로 생각하고 답변하는’ 한국형 하이브리드 멀티모달 언어모델 공개
#카카오#자체개발AI모델#멀티모달언어모델