Test-Time Compute Scaling

모델의 크기를 키우지 않고도 추론(inference) 시점에 연산량을 증가시켜서 성능을 높이는 전략. OpenAI o1이 검증한 원리로, 2026년 AI 성능 향상의 핵심 패턴.

설명

전통적인 AI 성능 향상: 모델을 더 크게 학습(training-time compute 증가)

Test-Time Compute Scaling: 추론 시점의 연산 비용을 증가시켜 성능 향상

세 가지 대표 패턴이 이 원리를 다르게 활용:

패턴	적용 영역	메커니즘
Ralph-Loop	코드 품질	반복 루프로 실패 극복
RLM (Recursive Language Model)	맥락 이해	재귀 호출로 단계적 탐색
autoresearch	연구/최적화	시간 예산 반복으로 진화