Microsoft Research har sluppet Fara1.5, en familie med nettleser-AI som kan styre nettleseren din ved å se på skjermbilder og sende museklikk og tastetrykk. Resultatet er ganske overraskende: den største varianten scorer 72% på Online-Mind2Web-benchmarken, mot OpenAI Operators 58,3% og Gemini 2.5 Computer Use sine 57,3%.

Det er ikke en liten margin. 14 prosentpoeng på en benchmark med 300 reelle oppgaver fordelt på 136 nettsteder er nok til at det er verdt å ta på alvor – selv om man bør ta alle benchmarks med en liten klype salt.

Modellene finnes i tre størrelser – 4B, 9B og 27B parametere – og er bygget på Qwen3.5 som fundament. Det gir dem et bredt bruksområde, fra edge-kjøring på kraftigere laptoper til skytjenester der du vil ha best mulig ytelse.

Hva er Fara1.5 og hva kan den gjøre?

Fara1.5 er det Microsoft kaller en «pixel-to-action»-modell. Den ser på et skjermbilde, tenker seg om, og sender så handlinger tilbake – museklikk, scrolling, tastetrykk, nettsøk. Alt det du selv gjør når du navigerer i en nettleser, kan Fara1.5 gjøre automatisk.

Selve arbeidsmåten er en observe-think-act-løkke: modellen prosesserer samtalehistorikken og de nyeste skjermbildene, genererer en tankerekke, og utfører deretter en handling. Det er konseptuelt likt det vi ser fra andre computer use-agenter, men treningsdataen og arkitekturen er tydeligvis godt gjennomtenkt.

Modellen kjøres inne i Microsoft MagenticLite, et sandkasse-basert nettlesermiljø som logger alle handlinger og gjør dem sporbare. Det betyr at du i prinsippet kan gå tilbake og se nøyaktig hva agenten har gjort – noe som er smart fra et tillitstankegangsperspektiv.

Et aspekt jeg synes er gjennomtenkt: agenten pauser og spør brukeren i tre situasjoner – når den trenger personlig informasjon den ikke har, når oppgavebeskrivelsen er uklar, og når den er i ferd med å gjøre noe som ikke kan angres. Det er litt som at en god assistent vet når den skal stoppe og dobbeltsjekke i stedet for å bare kjøre på.

Benchmark-sammenligning: Fara1.5-27B på 72% mot OpenAI Operator 58.3% og Gemini 2.5 Computer Use 57.3% på Online-Mind2Web
Fara1.5-27B scorer 72% på Online-Mind2Web – 14 prosentpoeng foran OpenAI Operator og Gemini 2.5 Computer Use.

Hva sier benchmark-tallene?

Online-Mind2Web, som er 300 oppgaver fordelt på 136 virkelige nettsider, scorer modellene slik:

  • Fara1.5-27B: 72%
  • Fara1.5-9B: 63,4%
  • Yutori Navigator n1: 64,7%
  • OpenAI Operator: 58,3%
  • Gemini 2.5 Computer Use: 57,3%

På WebVoyager-benchmarken er tallene enda bedre: Fara1.5-27B scorer 88,6%, 9B-varianten 86,6% og den minste 4B-varianten 80,8%.

Benchmarks er aldri hele historien. De sier noe om ytelse på et utvalg oppgaver under kontrollerte forhold, ikke nødvendigvis hvordan modellen klarer seg på rare edge cases i det virkelige liv. Men som en indikator på at Fara1.5 er seriøst konkurranse for de beste kommersielle alternativene, er tallene overbevisende.

Interessant nok scorer solver-agenten som ble brukt under treningsdataproduksjonen – basert på GPT-5.4 med egne verktøy – 83% på Online-Mind2Web. Det er høyere enn Fara1.5-27B. Men GPT-5.4 er en kraftig og dyr skymodell; Fara1.5 på 27B er noe du selv kan kjøre.

Hvordan er Fara1.5 trent?

Treningsdataen er det virkelig interessante her. Microsoft har trent på rundt 2 millioner eksempeldata via supervised fine-tuning. Fordelingen er omtrent slik:

  • 60% ekte nett-trajektorier (faktiske nettlesersøk og handlinger)
  • 12,8% syntetiske miljøer
  • 12,5% skjemautfylling og brukerinteraksjoner
  • 8,8% grounding-data
  • 4,9% VQA (visual question answering)
  • Resten er sikkerhetsdata og annet

Den syntetiske datapipelinen heter FaraGen1.5 og er egentlig ganske elegant. For å trene på nettsteder som krever innlogging eller er bak betalingsmurer – såkalt «gated content» – har Microsoft bygget syntetiske kloner. De kaller dem FaraEnvs, og de inkluderer blant annet simulerte e-postklienter, kalendre, strømmetjenester, ML-plattformer og reiseplanleggere.

Hvert av disse miljøene har realistiske grensesnitt, fungerende APIer og persona-baserte databaser. Hele greia er satt sammen ved hjelp av GitHub Copilot CLI kombinert med iterativ menneskelig finjustering. Det er en pragmatisk tilnærming – i stedet for å prøve å lære av data du ikke har tilgang til, bygger du en god nok kopi og trener på den.

Illustrasjon av Fara1.5 sin observe-think-act-løkke: AI-agenten ser skjermbilder, tenker, og utfører handlinger i nettleseren
Slik fungerer Fara1.5: en løkke der agenten observerer skjermbildet, tenker seg om, og utfører handlinger – igjen og igjen til oppgaven er løst.

Hva betyr dette for AI-agenter som styrer nettleseren din?

Computer use-agenter er fortsatt i en tidlig fase der mange produkter lover mer enn de leverer i praksis. OpenAI Operator kom med mye fanfare, Gemini 2.5 Computer Use er sterk på mange områder, og Holotron-12B fra H Company og NVIDIA har imponert på throughput. Nå kommer Microsoft inn og sier: vent, vi har noe som er bedre på nøyaktighet.

Det som skiller Fara1.5 fra mange av de andre er at tre størrelser gir deg reelle valg. En 4B-modell kan potensielt kjøres lokalt på en moderne laptop, mens 27B-varianten er for skykjøring der du vil ha best mulig resultater. Det er en annen filosofi enn de fleste kommersielle computer use-produkter som bare tilbyr én skybasert løsning.

Microsoft har tidligere integrert autonome AI-agenter i Copilot, og det er naturlig å tenke at Fara1.5 kan ende opp som teknologien bak fremtidige versjoner av Copilot i nettleseren. Det er ikke bekreftet, men Microsofts Research-avdeling jobber sjelden i et vakuum.

OpenAI har på sin side lagt til computer use og innebygd nettleser i Codex, og Google kjemper hardt med Gemini på mange fronter. Browser-agenter er blitt et kappløp, og Fara1.5 er Microsofts svar på at de vil være med i den kampen.

Er Fara1.5 tilgjengelig nå?

Microsoft Research har publisert resultatene og detaljer om FaraGen1.5-pipelinen, men selve modellene er ikke lagt ut åpent på Hugging Face eller GitHub ennå – i hvert fall ikke per i dag. Det er typisk for store selskaper å publisere paperet og la vente på den faktiske modellslippet.

Om og når Fara1.5 blir tilgjengelig for eksterne utviklere er ikke klart. Microsoft kan velge å integrere det direkte i Azure AI-tjenester, gi det ut som open weights, eller begge deler. Gitt at modellen er bygget på Qwen3.5-checkpoints og ikke Microsofts egne modeller, er det ikke umulig at vektene kan slippes – men det avhenger av lisensvilkårene de forhandler om.

Det verdt å følge med på er om Fara1.5 dukker opp i Azure AI Foundry eller som en del av Copilot Studio. Microsoft har hatt en tydelig strategi om å ta Research-arbeid og pakke det inn i kommersielle produkter – og computer use-agenter er akkurat det slags teknologi som passer inn i den strategien.

72% task success på en benchmark med reelle nettsteder er et godt argument for at Fara1.5 er noe annet enn bare et forskningsprosjekt. Nå gjenstår det å se om Microsoft faktisk lar folk prøve det.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Meld deg på nyhetsbrevet

Få oppdateringer om AI nyhetene rett i inboxen!

Du liker kanskje denne også
Jan Sverre arbeider med Suno AI musikk-generering på datamaskinen, kreativt workspace med hodetelefoner

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Jeg testet 150 Suno-låter og fant tydelige mønstre. Her er hva som faktisk gir kvalitet, og hva som bare kaster bort tid.
Jan Sverre med headphones og lydmikser i boardroom-møte med forvirrede executives

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Kan du tjene penger på Suno-musikk? Her er en praktisk gjennomgang av rettigheter, risiko og hva du bør avklare før publisering.
Jan Sverre styrer et digitalt kontrollpanel omgitt av Claude AI-symboler og glødende lysstriper i et mørkt rom

Claude AI – pris, funksjoner og norsk guide (2026)

Alt om Claude AI i 2026 – priser i norske kroner, Claude Pro vs Max, Claude Code, og ærlig sammenligning med ChatGPT. Komplett norsk guide fra en som bruker Claude daglig.
Jan Sverre riding a dinosaur in safari outfit, photorealistic AI-generated image demonstrating Nano Banana Pro capabilities

Jeg testet Nano Banana Pro: AI som faktisk skriver norsk i bilder

Endelig! En AI som kan generere norsk tekst i bilder med 94% nøyaktighet. Jeg testet Nano Banana Pro grundig – her er resultatene.