LLM Wiki

태그: moe

2건의 항목

  • 2026년 4월 13일

    Flash-MoE — 순수 C/Metal로 M3 Max에서 397B MoE 모델 실행

    • apple-silicon
    • metal
    • moe
    • inference
    • quantization
    • on-device-ai
  • 2026년 3월 24일

    iPhone 17 Pro에서 400B LLM 실행하기

    • llm
    • ios
    • moe
    • qwen

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community