Jan Sverre fascinert over MTPLX ytelsesøkning på MacBook Pro M5 Max - 2,24 ganger raskere MTP-inferens

MTPLX – 2,24 ganger raskere MTP-inferens for Apple Silicon

MTPLX er en ny MTP-inferensmotor for Apple Silicon som gir 2,24 ganger raskere token-generering uten ekstra minne. Qwen3.6-27B gikk fra 28 til 63 tokens per sekund på MacBook Pro M5 Max.
Jan Sverre studerer benchmark-resultater for Qwen3.5 122B lokal LLM på M5 Max terminal

Qwen3.5 122B – fortsatt den beste lokale LLM-en i 2026

Ferske benchmarks på M5 Max 128GB bekrefter at Qwen3.5 122B fortsatt er toppen av bunken for lokale LLM-er. Her er tallene, arkitekturen og hvordan du kommer i gang.