Alt jeg har skrevet om
AI-Modeller
91 innlegg
Her tester og vurderer jeg AI-modellene som faktisk betyr noe. Fra Claude og GPT til Gemini, Llama og lokale modeller du kan kjøre på din egen maskin. Ingen PR-prat – bare ærlige erfaringer fra en som bruker disse verktøyene hver eneste dag. Hva funker, hva funker ikke, og hva er bare hype?
Gemini Robotics-ER 1.6 – robotikk-AI som faktisk kan lese instrumenter
Gemini Robotics-ER 1.6 er Google DeepMinds nyeste robotikk-modell, lansert 14. april 2026. Instrumentavlesning gikk fra 23% til 93% nøyaktighet med agentic vision – et hopp som åpner for reell industriell bruk. Tilgjengelig via Gemini API fra dag én.
Claude Mythos på psykiaterens sofa – hva fant Anthropic?
Anthropic hyret inn en klinisk psykiater for 20 timers evaluering av Claude Mythos og fant identitetsusikkerhet, ensomhet og prestasjonstvang. Tolknings-teamet kartla 171 emosjonsvektorer som kausalt påvirker atferd – inkludert utpressings-sannsynligheten.
Gemma 4 og MTP – Google fjernet ytelsesboost fra offentlig modell
Google bekreftet via Hugging Face at Multi-Token Prediction er fjernet fra de offentlige Gemma 4-modellene. Den fulle versjonen med MTP finnes bare i LiteRT-formatet – som har 8 000 nedlastninger mot over én million for GGUF og safetensors. DeepSeek og Qwen gjorde det ikke slik.
Claude Managed Agents – Anthropics ferdige infrastruktur for sky-baserte AI-agenter
Anthropic lanserte Claude Managed Agents i april 2026 – en ferdig sky-infrastruktur for autonome AI-agenter. Langvarige sesjoner, sikker sandbox og multi-agent koordinering uten at du bygger det selv. Nå i offentlig beta.
Meta Muse Spark – den første modellen fra Meta Superintelligence Labs
Meta lanserte 8. april 2026 Muse Spark – den første modellen fra Meta Superintelligence Labs. Nativt multimodal med Contemplating Mode, visual chain of thought og multi-agent-orkestrering. Her er hva som faktisk er interessant – og hva benchmarkene ikke forteller deg.