Jan Sverre studerer et dokument med annoterte bounding boxes og strukturert OCR-output

Mistral OCR 4 lansert: dokumenter som vet hvor hvert ord sitter – klar for RAG

Mistral OCR 4 gir deg ikke bare tekst fra dokumenter – den forteller deg nøyaktig hvor på siden hvert ord sitter, hvor sikker den er, og hva slags blokk det er. Det forandrer ganske mye for RAG og agentic pipelines.
NuExtract3 - Jan Sverre ved skrivebordet med dokumenter og holografisk JSON-ekstraksjon

NuExtract3 – open source 4B VLM for OCR og strukturert dokumentekstraksjon

NuExtract3 er en 4B open-weight VLM fra Numind som slår Qwen3.5-9B på strukturert dokumentekstraksjon. Apache 2.0-lisens, gratis demo på HuggingFace.