유령 비유 (Summoning Ghosts, Not Animals)

Andrej-Karpathy의 가장 유명한 LLM 비유.

한 줄 정리

우리는 동물이 아니라 유령을 소환하고 있다.

두 종류의 지능

동물 지능 (Animal Intelligence)

  • 진화의 산물
  • 본질적 동기: 배고픔, 두려움, 호기심, 재미
  • 본능 위에 학습이 얹어진 구조
  • 강아지/고양이/침팬지/사람

LLM 지능 (Ghost Intelligence)

  • 진화의 산물이 아님
  • 데이터 + 보상 함수로 빚어진 통계적 시뮬레이션
  • 서브스트레이트 = 프리트레이닝(다음 단어 맞추기) + RL 볼트
  • 본능·생존 압력 없음

함의: 동물 직관이 통하지 않는다

소리 지른다고 더 잘하지 않는다.

동물에게 통하는 것LLM에 통하지 않는 것
화내기”제발 제대로 해 봐”
사정하기”이번엔 정말 중요해”
협박하기”틀리지 마, 책임은 네가 져”

— 사람은 무의식적으로 LLM에 동물 지능 직관을 투사하지만, 아무 영향이 없다.

다루는 법

카파시 본인도 명확한 답은 없다고 인정:

의심을 유지하면서 시간에 걸쳐 알아가는 것에 가깝다.

  • 결정적 가이드라인보다는 회로 탐험
  • 어디서 잘하고 어디서 못 하는지 직접 알아내기 (Jagged-Intelligence 때문)

화자(김플립) 보충

  • 하지 마라”는 부정 지시는 강하게 말할수록 잘 듣는 경향이 있다
  • Boris도 CLAUDE.md에서 “하지 마라” 부분의 중요성을 강조

관련 개념

출처