LLM Wiki

태그: on-device-ai

1건의 항목

  • 2026년 4월 13일

    Flash-MoE — 순수 C/Metal로 M3 Max에서 397B MoE 모델 실행

    • apple-silicon
    • metal
    • moe
    • inference
    • quantization
    • on-device-ai

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community