Test-Time Compute Scaling

모델의 크기를 키우지 않고도 추론(inference) 시점에 연산량을 증가시켜서 성능을 높이는 전략. OpenAI o1이 검증한 원리로, 2026년 AI 성능 향상의 핵심 패턴.

설명

전통적인 AI 성능 향상: 모델을 더 크게 학습(training-time compute 증가)

  • 리소스 비용 증가
  • 배포 비용 증가

Test-Time Compute Scaling: 추론 시점의 연산 비용을 증가시켜 성능 향상

  • 같은 크기 모델을 더 오래 생각하게 함
  • 반복 루프로 여러 번 시도해서 최고 결과 선택
  • 재귀 호출로 복잡한 문제를 단계적으로 해결

실제 적용 사례

세 가지 대표 패턴이 이 원리를 다르게 활용:

패턴적용 영역메커니즘
Ralph-Loop코드 품질반복 루프로 실패 극복
RLM (Recursive Language Model)맥락 이해재귀 호출로 단계적 탐색
autoresearch연구/최적화시간 예산 반복으로 진화

관련 개념

  • Agentic-AI — 에이전트 설계의 테스트-타임 전략
  • Ralph-Loop — 코드 루프로 구현한 계산 증가

소스