OpenCode 리뷰(4) — Z.AI GLM 연동 실전 가이드 (갓대희)
Key Insight
Z.AI GLM-4.7을 Claude Code·OpenCode·VS Code(Cline/Kilo)에 연동하는 실전 설정 가이드. GLM-4.7은 Tool-calling 90.6%, SWE-bench 73.8%로 Claude 수준 성능을 Claude 가격의 ~10%에 제공. Coding Plan 전용 endpoint 혼동이 가장 흔한 오류.
출처: https://goddaehee.tistory.com/492 타입: 블로그 (갓대희) 작성자: 갓대희 유효일: 2026-01-09 시리즈: OpenCode 시리즈 Part 4 (Part 1 | Part 2 | Part 3)
핵심 Takeaway
- Claude Code + Z.AI GLM 연동:
settings.json에ANTHROPIC_AUTH_TOKEN=ZAI_API_KEY+ANTHROPIC_BASE_URL=https://api.z.ai/api/anthropic설정 → Claude Code가 GLM-4.7을 Claude처럼 사용 - 3가지 endpoint 반드시 구분 (혼동 시 “Authorization Failure”): 일반 API
paas/v4/ Coding Plancoding/paas/v4/ Anthropic 호환api/anthropic - GLM-4.7 Thinking Mode 3종: Interleaved(매 응답 전 추론) / Preserved(멀티턴 추론 보존) / Turn-level(턴별 활성화) — Claude Extended Thinking과 유사
- OMO 3.0 Categories 비용 최적화: deep-thinking(Opus) + balanced(GLM-4.7) + quick(GLM-4.5-Flash) 조합 → 전체 Claude 대비 월 70–80% 절감
- GLM-4.7 벤치마크 (valid_as_of 2026-01): SWE-bench 73.8%, AIME 95.7%, GPQA-Diamond 85.7%, Tool-calling 90.6% (Claude 5 Sonnet에 근접)
상세 요약
Claude Code 연동 방법
Claude Code settings.json에 환경변수 주입으로 GLM-4.7을 Claude처럼 사용:
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your_zai_api_key",
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"API_TIMEOUT_MS": "3000000",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.7",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.7"
}
}요구사항: Claude Code 2.0.14 이상 필요
Z.AI Endpoint 3종 구분
| 용도 | Endpoint |
|---|---|
| 일반 API (종량제) | https://api.z.ai/api/paas/v4 |
| Coding Plan 전용 | https://api.z.ai/api/coding/paas/v4 |
| Anthropic 호환 (Claude Code용) | https://api.z.ai/api/anthropic |
흔한 오류
Coding Plan 구독자가 일반 endpoint 사용 시 “Authorization Failure” 또는 “Insufficient Balance” 에러. 반드시 Coding Plan 전용 endpoint 사용.
OpenCode 연동 (opencode.json)
{
"provider": {
"zai-coding": {
"npm": "@ai-sdk/openai-compatible",
"name": "Z.AI Coding Plan",
"options": {
"baseURL": "https://api.z.ai/api/coding/paas/v4",
"apiKey": "{env:ZAI_API_KEY}"
},
"models": {
"glm-4.7": { "name": "GLM-4.7", "limit": { "context": 200000, "output": 16384 } }
}
}
}
}oh-my-opencode 에이전트 매핑 권장:
- Sisyphus, oracle →
zai-coding/glm-4.7 - librarian →
zai/glm-4.5-flash(무료) - explore →
zai/glm-4.5-air(무료)
OMO 3.0 Categories 비용 최적화
| Category | 용도 | 권장 모델 | 가격 |
|---|---|---|---|
| deep-thinking | 복잡한 아키텍처·계획 | Claude Opus 4.5 | 75 per M |
| balanced | 일반 코딩 | GLM-4.7 | 2.2 per M |
| quick | 빠른 수정·간단 질문 | GLM-4.5-Flash | 무료 |
→ 전체 Claude 대비 월 70–80% 비용 절감
실전 팁: /plan(Prometheus + Opus 기획) → /start-work(GLM-4.7 구현) 분리 전략.
GLM-4.7 고급 기능
Context Caching (valid_as_of 2026-01-09):
| 모델 | 일반 입력 | 캐시된 입력 | 절감률 |
|---|---|---|---|
| GLM-4.7 | $0.60/1M | $0.11/1M | ~82% |
| GLM-4.5-Air | $0.20/1M | $0.03/1M | ~85% |
캐시 저장 비용 현재 무료 (베타).
Thinking Mode 3종:
- Interleaved: 모든 응답·도구 호출 전 추론 → 환각 감소
- Preserved: 멀티턴 추론 맥락 보존 → 장기 복잡 작업
- Turn-level: 턴별 추론 on/off 제어 → 비용 최적화
{ "thinking": { "type": "enabled", "budget_tokens": 8192 } }GLM-4.7 벤치마크 (valid_as_of 2026-01-09)
| 벤치마크 | GLM-4.7 | 참고 |
|---|---|---|
| SWE-bench Verified | 73.8% | Claude 5 Sonnet 수준 |
| AIME 2025 | 95.7% | 고난도 수학 |
| GPQA-Diamond | 85.7% | 박사급 과학 |
| Tool-calling | 90.6% | Claude 5 Sonnet에 근접 |
| τ²-Bench | 87.4 | 오픈소스 최고 |
커뮤니티 평가: “Claude의 약 80% 수준” (Hacker News)
VS Code 연동 (Cline / Kilo)
API Provider → “OpenAI Compatible” 선택 후:
- Base URL: Coding Plan
https://api.z.ai/api/coding/paas/v4 - Model ID:
glm-4.7또는glm-4.5-flash
연결되는 노트
- Z-AI-GLM — Z.AI / GLM-4.7 엔티티
- OpenCode — 연동 대상
- Oh-My-OpenAgent — OMO 3.0 Categories 활용