Siste nytt
Nvidia AI-Q – open source forskningsagent som topper DeepResearch Bench
Nvidia lanserte AI-Q på GTC 2026 – et open source blueprint for deep research agents som topper DeepResearch Bench. Hybrid-arkitektur med Nemotron 3 Super kutter søkekostnadene med 50 prosent og slår frontier-only systemer på nøyaktighet.
NemoClaw sandbox-isolasjon omgått – fullstendig lokal inferens med Nemotron 9B og RTX 5090
En utvikler omgikk NemoClaws sandbox-isolasjon for å kjøre Nemotron 9B med tool calling fullstendig lokalt på WSL2 og RTX 5090 via vLLM. Her er den tekniske gjennomgangen av iptables-regler og TCP-relay-teknikken.
FastVideo – live-redigering av 30s 1080p-video med 4,5 sekunders latensy
FastVideo-teamet har klart å generere og live-redigere 30 sekunders 1080p-video med bare 4,5 sekunders forsinkelse. Prosjektet Dreamverse er bygget på LTX-2 og er open source under Apache 2.0-lisens. En 3,9x forbedring over nest raskeste alternativ.
GPT-5.4 Mini og Nano – OpenAIs raskeste og billigste modeller hittil
OpenAI lanserte 17. mars 2026 GPT-5.4 Mini og Nano – to lettmodeller bygget for hastighet, lavt forbruk og subagent-arkitekturer. Mini scorer 54,4% på SWE-Bench Pro og er over 2x raskere enn forgjengeren. Nano koster $0,20 per million tokens.
Ollama-skrivebordsagent med Clippy – lokal AI som faktisk gjør ting
En utvikler har bygget en Ollama-drevet desktop-agent med flytende maskot – inkludert en Clippy-skin. Agenten kan utføre filoperasjoner, browse nettet og sende e-post lokalt, uten sky og uten API-nøkler. Her er hva det betyr og hvilke modeller som fungerer best for tool calling.