오픈AI가 추론 능력을 대폭 강화한 새로운 인공지능(AI) 모델 'o3'를 내년에 선보인다. 사진은 챗GPT의 출력이 표시되는 컴퓨터 화면 앞에 있는 휴대폰에 오픈AI 로고가 보이는 모습. /사진=뉴시스
23일 IT(정보기술) 업계에 따르면 오픈AI는 최근 '오픈AI의 12일'(12 Days of OpenAI) 행사에서 차세대 AI 모델 o3와 소형 모델 'o3 미니'를 소개했다.
o3는 오픈AI가 지난 9월 출시한 추론 모델 'o1'의 향상된 버전이다. o1과 마찬가지로 이용자 질문에 답하기 전에 답을 추론하도록 설계됐다. ▲수학 ▲과학 ▲코딩 등 부문에서 성능이 한층 더 강화됐다.
오픈AI는 o3의 성능이 기존 o1을 크게 앞선다고 밝혔다. 프로그래밍 작업 성능을 평가하는 벤치마크(SWE-Bench Verified)에서 o3는 o1보다 22.8%포인트(p) 높은 성과를 기록했다. 코딩 기술을 측정하는 지표(Codeforces)에서도 2727점을 달성해 상위 99.2% 엔지니어를 뛰어넘는 수준을 보였다.
수학 시험에서도 탁월한 성과를 거뒀다. 올해 미국 초청 수학 시험(AIME)에서는 단 한 문제만 틀리며 96.7%의 점수를 기록했다. 대학원 수준의 ▲생물학 ▲물리학 ▲화학 문제 테스트(GPQA Diamond)에서는 87.7%의 성과를 거뒀다. 특히 에포크AI의 프론티어매스 벤치마크에서는 문제의 25.2%를 해결하며 기존 모델이 2%도 넘지 못했던 한계를 극복했다.
또 o3는 프롬프트를 받으면 응답 전 잠시 멈추고 관련 프롬프트를 고려해 자신의 추론을 설명한다. 이후 가장 정확하다고 생각되는 응답을 요약한다. 이런 과정을 통해 오픈AI 측은 o3가 범용인공지능(AGI)에 가까워졌다고 평가했다.
o3는 추론 능력을 향상시키는 과정에서 '추론 시간 조정'이라는 새로운 기능을 도입했다. 이용자는 연산 시간, 즉 o3의 사고 시간을 ▲낮음 ▲중간 ▲높음으로 설정할 수 있다. 사고 시간을 높음으로 설정할수록 추론 성능은 향상되지만 응답 시간이 길어지는 방식이다.
현재 오픈AI는 연구자에게 o3를 미리보기 형태로 제공하고 있다. 샘 올트먼 오픈AI 최고경영자(CEO)는 "내년 1월 말에 o3 미니를 먼저 출시하며 이후 o3를 출시할 예정"이라고 말했다. 모델명을 'o2'가 아닌 o3로 지은 이유에 대해서는 "영국 통신사 'O2'를 존중하는 차원"으로 혼동을 피하고 싶었기 때문이라고 전했다.
<저작권자 © ‘재테크 경제주간지’ 머니S, 무단전재 및 재배포 금지>