Jan Sverre foran NVIDIAs GPU-racker med grønt lys - Nemotron Ultra 550B MoE-modell

Nemotron Ultra – NVIDIAs åpne 550B-modell med 1 million tokens kontekst

NVIDIA slipper Nemotron Ultra – en åpen 550B MoE-modell med 1 million tokens kontekst og opptil 6x raskere inferens enn sammenlignbare modeller. Her er hva det betyr i praksis.
Jan Sverre undersøker holografisk visualisering av Nemotron-Labs-Diffusion sine tre dekodingsmodus i NVIDIA serverrom

Nemotron-Labs-Diffusion – NVIDIAs språkmodell med 6× gjennomstrøm

NVIDIA har sluppet Nemotron-Labs-Diffusion – en språkmodell som kombinerer tre dekodingsmodus i én arkitektur og leverer 6× høyere gjennomstrøm enn Qwen3-8B.