MTPLX – 2,24 ganger raskere MTP-inferens for Apple Silicon
MTPLX er en ny MTP-inferensmotor for Apple Silicon som gir 2,24 ganger raskere token-generering uten ekstra minne. Qwen3.6-27B gikk fra 28 til 63 tokens per sekund på MacBook Pro M5 Max.
5. mai 2026
53 visninger
4 minutter lesetid
Qwen3.5 122B – fortsatt den beste lokale LLM-en i 2026
Ferske benchmarks på M5 Max 128GB bekrefter at Qwen3.5 122B fortsatt er toppen av bunken for lokale LLM-er. Her er tallene, arkitekturen og hvordan du kommer i gang.