Qwen3.6-35B-A3B on my laptop drew a better pelican than Claude Opus 4.7
Source: raw/articles/2026-04-16-simon-willison-qwen-beats-opus.md Type: article By: Simon Willison (simonwillison.net) Valid as of: 2026-04-16
핵심 Takeaway
- Qwen3.6-35B-A3B (21GB 양자화, 로컬 MacBook Pro M5) > Claude Opus 4.7 (클라우드), pelican 벤치마크 기준 (2026-04-16)
- Qwen 3.6 SWE-Bench 73.4% — 오픈 웨이트 모델로 최고 수준
- “pelican benchmark” = Simon Willison의 비공식 크리에이티브 벤치마크 (SVG 자전거 타는 펠리컨)
- 벤치마크 취지: “모델 비교 작업의 불합리함을 보여주는 것” — 하지만 펠리컨 품질과 범용 모델 유용성 간 상관관계 역사적으로 존재
연결되는 위키 페이지
- anthropic — Claude Opus 4.7 개발사
- qwen — 이 아티클의 주요 모델 패밀리
- simon-willison-qwen36-27b — 동일 저자의 4/22 Qwen3.6-27B 후속 실험 (dense 27B > MoE 397B)
- simon-willison-llm-openrouter-06 — 동일 저자의 4/20 Kimi K2.6 pelican 벤치마크 (HTML+JS UI 생성)