Z.AI (Zhipu AI) / GLM-4.7
Summary
중국 AI 기업 Zhipu AI(智谱AI)의 코딩 특화 모델 서비스. GLM-4.7 모델은 SWE-bench 73.8%, AIME 95.7%로 Claude 5 Sonnet에 근접하는 성능을 Claude 가격의 약 10%에 제공. Coding Plan $3/월로 200K 컨텍스트 + Thinking Mode 포함.
중국 AI 기업 Zhipu AI(智谱AI)의 코딩 특화 모델 서비스. GLM-4.7 모델은 SWE-bench 73.8%, AIME 95.7%로 Claude 5 Sonnet에 근접하는 성능을 Claude 가격의 약 10%에 제공. Coding Plan $3/월로 200K 컨텍스트 + Thinking Mode 포함.
개요
Zhipu AI가 운영하는 코딩 에이전트 특화 플랫폼. 일반 API, Coding Plan 구독, Anthropic 호환 endpoint 세 가지 접근 방식을 제공한다. Claude Code, OpenCode, oh-my-opencode, Cline, Kilo Code 등 주요 AI 코딩 도구와 호환된다.
GLM-4.7 주요 사실 (valid_as_of 2026-01-09)
- 가격: 2.20/1M output
- 컨텍스트: 200K 토큰
- Coding Plan: 10/월(Standard) — 5시간당 120 프롬프트
- 무료 모델:
glm-4.5-flash(텍스트),glm-4.5-air(경량),glm-4.6v-flash(비전)
벤치마크 (valid_as_of 2026-01-09)
| 벤치마크 | GLM-4.7 | 비고 |
|---|---|---|
| SWE-bench Verified | 73.8% | Claude 5 Sonnet 수준 |
| AIME 2025 | 95.7% | GPT-5.1(94.0%) 상회 |
| GPQA-Diamond | 85.7% | 박사급 과학 |
| Tool-calling | 90.6% | Claude 5 Sonnet에 근접 |
| τ²-Bench | 87.4 | 오픈소스 최고 |
커뮤니티: “Claude의 약 80% 수준” (Hacker News)
3가지 Endpoint (반드시 구분)
| 용도 | URL |
|---|---|
| 일반 API | https://api.z.ai/api/paas/v4 |
| Coding Plan 전용 | https://api.z.ai/api/coding/paas/v4 |
| Anthropic 호환 (Claude Code용) | https://api.z.ai/api/anthropic |
혼동 주의
Coding Plan 구독자가 일반 endpoint 사용 시 “Authorization Failure” / “Insufficient Balance” 오류.
Claude Code 연동
settings.json 환경변수로 GLM-4.7을 Claude처럼 사용:
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your_zai_api_key",
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.7",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.7"
}
}Context Caching
| 모델 | 일반 | 캐시 | 절감 |
|---|---|---|---|
| GLM-4.7 | $0.60/1M | $0.11/1M | ~82% |
| GLM-4.5-Air | $0.20/1M | $0.03/1M | ~85% |
캐시 저장 비용 현재 무료 (베타).
Thinking Mode
Interleaved / Preserved / Turn-level 3종. Claude Extended Thinking과 유사한 구조.
{ "thinking": { "type": "enabled", "budget_tokens": 8192 } }관련 엔티티
- OpenCode — 주요 연동 플랫폼
- Oh-My-OpenAgent — OMO 3.0 Categories에서 GLM 활용