왼쪽부터 KAIST 안성진 교수, 윤재식 박사과정, 조현서 석사과정, 백두진 석사과정. 요슈아 벤지오 캐나다 몬트리올대 교수. KAIST 제공
국내 연구진이 인공지능(AI) 확산 모델의 ‘추론-시간 확장성’을 비약적으로 개선한 신기술을 개발했다.
AI가 추론 과정에서 사용 가능한 계산 자원에 따라 성능을 유연하게 조절해 문제 해결에 소모되는 시간을 100배 단축했다.
향후 지능형 로봇이나 실시간 생성형 AI 등 고성능 추론이 필요한 다양한 분야에 활용될 것으로 기대된다.
KAIST는 안성진 전산학부 교수 연구팀이 요수아 벤지오 캐나다 몬트리올대 교수팀과 공동 연구를 통해 AI 확산 모델의 추론-시간 확장성을 획기적으로 개선한 신기술을 개발했다고 20일 밝혔다.
연구 결과는 13일부터 19일까지 캐나다 밴쿠버에서 열린 국제기계학습학회(ICML 2025)에서 전체 채택 논문 중 상위 2.6%인 '스포트라이트 논문'으로 발표됐다.
확산 모델은 이미지 생성 등 다양한 생성형 AI에 활용되며 주목받고 있지만 실시간 활용에 필수적인 ‘추론-시간 확장성(inference-time scalability)’은 미흡하다는 평가를 받는다.
추론-시간 확장성은 AI가 추론 과정에서 주어진 계산 자원의 양에 따라 성능을 유연하게 조절할 수 있는 능력을 의미한다.
연구팀은 이러한 한계를 극복하기 위해 몬테카를로 트리 탐색(Monte Carlo Tree Search)을 기반으로 확산 모델의 새로운 추론 방법을 제안했다.
몬테카를로 트리 탐색은 선택지를 트리 구조로 구성한 뒤 시뮬레이션을 반복해 최적 경로를 찾아내는 방식으로 바둑 AI 등 복잡한 결정 문제에서 활용되는 탐색 알고리즘이다.
이번에 개발된 몬테카를로 트리 탐색 기반 기술은 확산 과정에서 발생 가능한 생성 경로를 트리 구조로 탐색해 제한된 자원 하에서도 고품질 출력을 효과적으로 도출할 수 있도록 설계됐다.
이를 통해 기존 방법이 단 한 번도 성공하지 못한 ‘초대형 미로 찾기’ 문제를 100%의 성공률로 해결했다.
초대형 미로 찾기 문제는 AI가 수천 개의 갈림길로 이뤄진 대규모 미로에서 출구를 찾아야 하는 고난도 탐색 과제로 기존 확산 모델로는 해결이 어려웠다.
인공지능(AI) 확산 모델의 추론-시간 확장 실현 개요. KAIST 제공
연구팀은 후속 연구를 통해 기존 방식의 단점으로 지적된 속도 문제도 대폭 개선했다.
개발된 트리 탐색 구조를 병렬화하는 방식으로 자원 환경을 최적화해 기존 방식 대비 최대 100배 빠른 속도로 동등하거나 더 높은 품질의 결과를 얻는 데 성공했다.
기술이 고정된 자원 환경뿐 아니라 실시간성이 요구되는 다양한 분야에서도 적용 가능하다는 점을 입증한 것이다.
안성진 교수는 “이번 연구는 고비용 계산이 필요했던 기존 확산 모델의 근본적 한계를 넘어선 기술”이라며 “지능형 로봇, 실시간 생성형 AI, 시뮬레이션 기반 의사결정 등 다양한 영역에서 핵심 기술로 활용될 수 있을 것”이라고 밝혔다.
<참고 자료>
- doi.org/10.48550/arXiv.2502.07202,
- doi.org/10.48550/arXiv.2506.09498
AI