Har du noen gang hatt en haug med PDF-fakturaer, rapporter eller skjemaer som du bare ønsket fantes som strukturert data? Datalab slapp i går en open-weights modell kalt lift som gjør akkurat det: du gir den et JSON-schema, og den returnerer matchende JSON-data fra dokumentet – uten å fylle inn felt den ikke finner.

Det siste er faktisk det interessante her. De fleste modeller som trekker ut data fra dokumenter har en tendens til å fylle inn noe – selv om feltet er tomt eller tvetydig. lift er trent til å returnere null for manglende felt. Det høres enkelt ut, men det er en viktig egenskap hvis du skal bruke output i en automatisert pipeline der stille feil er vanskelig å oppdage.

Modellen er på 9 milliarder parametere, er bygget på en vision-arkitektur som forstår layout og struktur i sider, og håndterer både PDF-er og bilder. Den kan kjøres lokalt via vLLM. Kildekoden er Apache 2.0 og tilgjengelig på GitHub. Vektene har en modifisert OpenRAIL-M-lisens – gratis for forskning, personlig bruk og startups med under 5 millioner dollar i finansiering eller inntekt. Liker du å kjøre ting selv slik jeg gjør, er dette samme sjanger som open source-verktøyene som lar deg kjøre inferens lokalt uten å sende data ut av huset.

Hva er schema-constrained decoding?

Den tekniske mekanismen bak lift er noe som heter schema-constrained decoding. I korte trekk: du gir modellen et JSON-schema, og under generering maskeres tokens som ville bryte strukturen. Det betyr at modellen rett og slett ikke kan produsere ugyldig JSON – strukturen håndheves token for token, ikke sjekket etterpå. Under panseret oversettes schema-et til Pydantic-modeller.

Rent praktisk betyr det at du aldri trenger å skrive kode som parser eller validerer output-formatet. Strukturen er alltid som forventet. Innholdet er en annen sak – schema-constrained decoding styrer form og typer, ikke meningsinnhold. En numerisk verdi kan fremdeles være feil, selv om den er syntaktisk korrekt.

Lifts eget eksempel er en faktura-parser der schema definerer felter som invoice_number, total og en array med linjeposter. Modellen leser PDF-en og returnerer et ferdig JSON-objekt. Ingen regex, ingen rule-basert parsing, ingen brittle post-processing.

Illustrasjon av PDF-dokument som konverteres til strukturert JSON med felter som invoice_number og total
Du definerer schema-et, lift leverer matchende JSON – felt for felt

Slik installerer og bruker du lift

Installasjon er rett frem via pip og krever Python 3.12 eller nyere, samt at du har vLLM tilgjengelig. Med en lokal GPU kan du kjøre hele pipelinen selv:

pip install lift-pdf
lift_vllm            # starter vLLM-server
lift_extract input.pdf ./output --schema schema.json

Det finnes også et Python-API:

from lift import extract
result = extract("document.pdf", "schema.json")

Datalab anbefaler å skrive gode beskrivelser for felt som kan være tvetydige – det er det viktigste enkeltgrepet for å øke nøyaktigheten. Hold schema-et flatt og grunt der det er mulig, og marker felt som required sparsomt. Output bør valideres i pipeline-en etterpå, siden modellen garanterer struktur men ikke semantisk korrekthet.

Modellen er tilgjengelig på HuggingFace og Datalab har bygget en playground du kan bruke for å teste mot egne dokumenter uten å sette opp noe lokalt.

Hvem passer lift for?

Datalab trekker frem tre bruksscenarioer der selvhosting av lift gir mening: data-residency-krav (dokumenter som ikke kan forlate egne servere), høyt volum der API-kostnader begynner å bite, og situasjoner der du trenger forutsigbar latens uten nettverksavhengigheter.

Jeg tenker lift er interessant for alle som jobber med dokumentautomatisering – fakturabehandling, kontraktsanalyse, skjemaparsing, rapportekstraksjon. Det er den typen ting mange SMB-er gjør manuelt i dag, og som egentlig burde vært automatisert for lenge siden. Hvis du har en haug med PDF-er som ser noenlunde like ut, er dette en god kandidat for automatisering.

Vil du ha høyere nøyaktighet og ikke har GPU tilgjengelig, er Datalabs hostede API et alternativ. Det inkluderer per-felt verifikasjon, sitasjoner og tillitsscorer – og scorer ifølge Datalab litt høyere enn selvhostet lift. Valget mellom cloud-API og selvhosting avhenger mer av kravene dine enn av modellen i seg selv.

Abstrakt visualisering av schema-constrained decoding der tokens filtreres gjennom JSON-struktur
Schema-constrained decoding håndhever strukturen token for token – ikke etterpå

Hvordan står lift mot lignende verktøy?

Dokumentekstraksjon er et felt med en del konkurrenter. NuExtract3 – den open source VLM-en for strukturert dokumentekstraksjon – er en 4B-modell fra NumInd som gjør mye av det samme. Den er mindre og lettere, mens lift legger seg høyere på Datalabs egen nøyaktighetsmåling. Som alltid med slike interne benchmarks: ta tallene med en klype salt og test mot dine egne dokumenter før du konkluderer.

Mistral OCR 4 er en annen tilnærming, men det er primært et verktøy for layout-bevart tekstekstraksjon og Markdown-konvertering, ikke JSON-strukturering basert på ditt eget schema. De to adresserer litt forskjellige problemer – vil du sammenligne flere vision-modeller, har jeg også sett på hvordan Qwen 3 VL og Gemma 4 gjør det på vision-oppgaver.

Datalab sammenligner også lift mot Gemini Flash 3.5 og sin egen cloud-API. Selvhostet lift ligger litt under Gemini Flash 3.5 på felt-nøyaktighet, men poenget Datalab vil frem til er at du får en lokal modell du eier selv, uten å sende dokumentene til en skytjeneste. For mange brukstilfeller – særlig der personopplysninger er involvert – er det en fornuftig avveining.

Ofte stilte spørsmål

Kan lift kjøres lokalt uten internettilgang?

Ja. lift kjøres via vLLM på egen hardware og trenger ikke nettverkstilgang under inferens. Du laster ned modellvektene fra HuggingFace én gang, og deretter kjøres alt lokalt. Nyttig for dokumenter med personopplysninger eller strengt konfidensielle data.

Hvilken maskinvare trenger jeg for å kjøre lift?

lift er en 9B-modell som kjøres via vLLM, så du trenger en GPU med nok minne til en modell i den størrelsesklassen. Med et moderne forbruker-skjermkort som et RTX 4090 er du godt innenfor. Har du ikke GPU, kan du bruke Datalabs hostede API eller playgrounden deres i stedet.

Er lift gratis å bruke kommersielt?

Kildekoden er Apache 2.0, altså helt fritt. Modellvektene har en modifisert OpenRAIL-M-lisens som tillater kommersiell bruk for startups med under 5 millioner dollar i finansiering eller inntekt. Er du over den terskelen, må du bruke Datalabs hosted API eller forhandle separat.

Kan lift brukes uten JSON-schema?

Nei – lift er designet rundt schema-constrained decoding og krever at du definerer strukturen du vil ha. Det er egentlig en fordel: du tvinger deg selv til å tenke igjennom hva du faktisk vil ha ut av dokumentene, og modellen leverer nøyaktig det.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Meld deg på nyhetsbrevet

Få oppdateringer om AI nyhetene rett i inboxen!

Du liker kanskje denne også
Jan Sverre arbeider med Suno AI musikk-generering på datamaskinen, kreativt workspace med hodetelefoner

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Jeg testet 150 Suno-låter og fant tydelige mønstre. Her er hva som faktisk gir kvalitet, og hva som bare kaster bort tid.
Jan Sverre styrer et digitalt kontrollpanel omgitt av Claude AI-symboler og glødende lysstriper i et mørkt rom

Claude AI – pris, funksjoner og norsk guide (2026)

Alt om Claude AI i 2026 – priser i norske kroner, Claude Pro vs Max, Claude Code, og ærlig sammenligning med ChatGPT. Komplett norsk guide fra en som bruker Claude daglig.
Jan Sverre med headphones og lydmikser i boardroom-møte med forvirrede executives

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Kan du tjene penger på Suno-musikk? Her er en praktisk gjennomgang av rettigheter, risiko og hva du bør avklare før publisering.
Jan Sverre sitter ved sitt kraftige AI-workstation oppsett med ultrawide skjerm og flere PC-er som kjører Ollama og lokale LLM-modeller

Ollama Guide – Kjør AI Gratis og Lokalt på Din Egen PC (2026)

Komplett guide til Ollama og lokale LLM-er på RTX 4090. Lær quantisering, Hugging Face import, beste modeller (Gemma 3, Qwen 3), GDPR-fordeler og full kostnadskontroll.