Jan Sverre Bauge sitter med MacBook Pro og ser på terminalen som viser MTP-ytelse på 34 tokens per sekund

MTP + TurboQuant på LLaMA.cpp – Qwen 27B til 34 tokens per sekund på MacBook

Multi-Token Prediction kombinert med TurboQuant gir Qwen 27B 34 tokens per sekund på MacBook Pro M5 Max – en økning på 40% uten ekstra kostnad.
Jan Sverre holder et glødende kinesisk AI-øye og studerer Qwen 3.6 Plus Preview med skeptisk nysgjerrighet

Qwen 3.6 på OpenRouter – 1 million token kontekst og gratis preview

Qwen 3.6 Plus Preview dukket opp på OpenRouter 30. mars 2026 uten noen offisiell kunngjøring fra Alibaba. Modellen har 1 million token kontekstvindu, innebygd reasoning og er gratis tilgjengelig akkurat nå – men med forbehold om kinesisk datainnsamling.