Nemotron Ultra – NVIDIAs åpne 550B-modell med 1 million tokens kontekst
NVIDIA slipper Nemotron Ultra – en åpen 550B MoE-modell med 1 million tokens kontekst og opptil 6x raskere inferens enn sammenlignbare modeller. Her er hva det betyr i praksis.
5. juni 2026
26 visninger
4 minutter lesetid
Nemotron-Labs-Diffusion – NVIDIAs språkmodell med 6× gjennomstrøm
NVIDIA har sluppet Nemotron-Labs-Diffusion – en språkmodell som kombinerer tre dekodingsmodus i én arkitektur og leverer 6× høyere gjennomstrøm enn Qwen3-8B.