JYP Garden

sparse-attention

2건의 항목

  • 2026년 5월 07일

    DeepSeek-V4 아키텍처

    • deepseek
    • sparse-attention
    • moe
    • pre-training
    • llm아키텍처
    • knowledge
  • 2026년 5월 07일

    EP 95. DeepSeek-V4 논문 읽기 — 노정석

    • deepseek
    • llm
    • 모델아키텍처
    • sparse-attention
    • pre-training
    • ai뉴스
    • gpt-5.5
    • knowledge

Created with Quartz v5.0.0 © 2026