Test-Time Compute Scaling
모델의 크기를 키우지 않고도 추론(inference) 시점에 연산량을 증가시켜서 성능을 높이는 전략. OpenAI o1이 검증한 원리로, 2026년 AI 성능 향상의 핵심 패턴.
설명
전통적인 AI 성능 향상: 모델을 더 크게 학습(training-time compute 증가)
- 리소스 비용 증가
- 배포 비용 증가
Test-Time Compute Scaling: 추론 시점의 연산 비용을 증가시켜 성능 향상
- 같은 크기 모델을 더 오래 생각하게 함
- 반복 루프로 여러 번 시도해서 최고 결과 선택
- 재귀 호출로 복잡한 문제를 단계적으로 해결
실제 적용 사례
세 가지 대표 패턴이 이 원리를 다르게 활용:
| 패턴 | 적용 영역 | 메커니즘 |
|---|---|---|
| Ralph-Loop | 코드 품질 | 반복 루프로 실패 극복 |
| RLM (Recursive Language Model) | 맥락 이해 | 재귀 호출로 단계적 탐색 |
| autoresearch | 연구/최적화 | 시간 예산 반복으로 진화 |
관련 개념
- Agentic-AI — 에이전트 설계의 테스트-타임 전략
- Ralph-Loop — 코드 루프로 구현한 계산 증가
소스
- 2026-AI-Loop-반복-Ralph-패턴 — OpenAI o1 이후 AI 패러다임 변화