Innhold Vis
Microsoft Research har sluppet Fara1.5, en familie med nettleser-AI som kan styre nettleseren din ved å se på skjermbilder og sende museklikk og tastetrykk. Resultatet er ganske overraskende: den største varianten scorer 72% på Online-Mind2Web-benchmarken, mot OpenAI Operators 58,3% og Gemini 2.5 Computer Use sine 57,3%.
Det er ikke en liten margin. 14 prosentpoeng på en benchmark med 300 reelle oppgaver fordelt på 136 nettsteder er nok til at det er verdt å ta på alvor – selv om man bør ta alle benchmarks med en liten klype salt.
Modellene finnes i tre størrelser – 4B, 9B og 27B parametere – og er bygget på Qwen3.5 som fundament. Det gir dem et bredt bruksområde, fra edge-kjøring på kraftigere laptoper til skytjenester der du vil ha best mulig ytelse.
Hva er Fara1.5 og hva kan den gjøre?
Fara1.5 er det Microsoft kaller en «pixel-to-action»-modell. Den ser på et skjermbilde, tenker seg om, og sender så handlinger tilbake – museklikk, scrolling, tastetrykk, nettsøk. Alt det du selv gjør når du navigerer i en nettleser, kan Fara1.5 gjøre automatisk.
Selve arbeidsmåten er en observe-think-act-løkke: modellen prosesserer samtalehistorikken og de nyeste skjermbildene, genererer en tankerekke, og utfører deretter en handling. Det er konseptuelt likt det vi ser fra andre computer use-agenter, men treningsdataen og arkitekturen er tydeligvis godt gjennomtenkt.
Modellen kjøres inne i Microsoft MagenticLite, et sandkasse-basert nettlesermiljø som logger alle handlinger og gjør dem sporbare. Det betyr at du i prinsippet kan gå tilbake og se nøyaktig hva agenten har gjort – noe som er smart fra et tillitstankegangsperspektiv.
Et aspekt jeg synes er gjennomtenkt: agenten pauser og spør brukeren i tre situasjoner – når den trenger personlig informasjon den ikke har, når oppgavebeskrivelsen er uklar, og når den er i ferd med å gjøre noe som ikke kan angres. Det er litt som at en god assistent vet når den skal stoppe og dobbeltsjekke i stedet for å bare kjøre på.

Hva sier benchmark-tallene?
På Online-Mind2Web, som er 300 oppgaver fordelt på 136 virkelige nettsider, scorer modellene slik:
- Fara1.5-27B: 72%
- Fara1.5-9B: 63,4%
- Yutori Navigator n1: 64,7%
- OpenAI Operator: 58,3%
- Gemini 2.5 Computer Use: 57,3%
På WebVoyager-benchmarken er tallene enda bedre: Fara1.5-27B scorer 88,6%, 9B-varianten 86,6% og den minste 4B-varianten 80,8%.
Benchmarks er aldri hele historien. De sier noe om ytelse på et utvalg oppgaver under kontrollerte forhold, ikke nødvendigvis hvordan modellen klarer seg på rare edge cases i det virkelige liv. Men som en indikator på at Fara1.5 er seriøst konkurranse for de beste kommersielle alternativene, er tallene overbevisende.
Interessant nok scorer solver-agenten som ble brukt under treningsdataproduksjonen – basert på GPT-5.4 med egne verktøy – 83% på Online-Mind2Web. Det er høyere enn Fara1.5-27B. Men GPT-5.4 er en kraftig og dyr skymodell; Fara1.5 på 27B er noe du selv kan kjøre.
Hvordan er Fara1.5 trent?
Treningsdataen er det virkelig interessante her. Microsoft har trent på rundt 2 millioner eksempeldata via supervised fine-tuning. Fordelingen er omtrent slik:
- 60% ekte nett-trajektorier (faktiske nettlesersøk og handlinger)
- 12,8% syntetiske miljøer
- 12,5% skjemautfylling og brukerinteraksjoner
- 8,8% grounding-data
- 4,9% VQA (visual question answering)
- Resten er sikkerhetsdata og annet
Den syntetiske datapipelinen heter FaraGen1.5 og er egentlig ganske elegant. For å trene på nettsteder som krever innlogging eller er bak betalingsmurer – såkalt «gated content» – har Microsoft bygget syntetiske kloner. De kaller dem FaraEnvs, og de inkluderer blant annet simulerte e-postklienter, kalendre, strømmetjenester, ML-plattformer og reiseplanleggere.
Hvert av disse miljøene har realistiske grensesnitt, fungerende APIer og persona-baserte databaser. Hele greia er satt sammen ved hjelp av GitHub Copilot CLI kombinert med iterativ menneskelig finjustering. Det er en pragmatisk tilnærming – i stedet for å prøve å lære av data du ikke har tilgang til, bygger du en god nok kopi og trener på den.

Hva betyr dette for AI-agenter som styrer nettleseren din?
Computer use-agenter er fortsatt i en tidlig fase der mange produkter lover mer enn de leverer i praksis. OpenAI Operator kom med mye fanfare, Gemini 2.5 Computer Use er sterk på mange områder, og Holotron-12B fra H Company og NVIDIA har imponert på throughput. Nå kommer Microsoft inn og sier: vent, vi har noe som er bedre på nøyaktighet.
Det som skiller Fara1.5 fra mange av de andre er at tre størrelser gir deg reelle valg. En 4B-modell kan potensielt kjøres lokalt på en moderne laptop, mens 27B-varianten er for skykjøring der du vil ha best mulig resultater. Det er en annen filosofi enn de fleste kommersielle computer use-produkter som bare tilbyr én skybasert løsning.
Microsoft har tidligere integrert autonome AI-agenter i Copilot, og det er naturlig å tenke at Fara1.5 kan ende opp som teknologien bak fremtidige versjoner av Copilot i nettleseren. Det er ikke bekreftet, men Microsofts Research-avdeling jobber sjelden i et vakuum.
OpenAI har på sin side lagt til computer use og innebygd nettleser i Codex, og Google kjemper hardt med Gemini på mange fronter. Browser-agenter er blitt et kappløp, og Fara1.5 er Microsofts svar på at de vil være med i den kampen.
Er Fara1.5 tilgjengelig nå?
Microsoft Research har publisert resultatene og detaljer om FaraGen1.5-pipelinen, men selve modellene er ikke lagt ut åpent på Hugging Face eller GitHub ennå – i hvert fall ikke per i dag. Det er typisk for store selskaper å publisere paperet og la vente på den faktiske modellslippet.
Om og når Fara1.5 blir tilgjengelig for eksterne utviklere er ikke klart. Microsoft kan velge å integrere det direkte i Azure AI-tjenester, gi det ut som open weights, eller begge deler. Gitt at modellen er bygget på Qwen3.5-checkpoints og ikke Microsofts egne modeller, er det ikke umulig at vektene kan slippes – men det avhenger av lisensvilkårene de forhandler om.
Det verdt å følge med på er om Fara1.5 dukker opp i Azure AI Foundry eller som en del av Copilot Studio. Microsoft har hatt en tydelig strategi om å ta Research-arbeid og pakke det inn i kommersielle produkter – og computer use-agenter er akkurat det slags teknologi som passer inn i den strategien.
72% task success på en benchmark med reelle nettsteder er et godt argument for at Fara1.5 er noe annet enn bare et forskningsprosjekt. Nå gjenstår det å se om Microsoft faktisk lar folk prøve det.