Innhold Vis
Nous Research slapp Hermes Agent i februar 2026, og GitHub-stjernene raste inn. Repoet passerte raskt forbi 170 000 stjerner – for et agent-rammeverk under MIT-lisens er det ekstraordinært. Norske AI-entusiaster har for det meste ignorert det. Det er en feil. Denne artikkelen er del 1 av en serie: her går jeg gjennom hva Hermes faktisk er, hva du kan bruke det til, og hva som angivelig gjør det bedre enn OpenClaw. Del 2 er installasjonen – hva som faktisk skjer på serveren min, ikke hva README-en lover.
Korte svaret: Hermes er en agent som bor på din server, kobler til 15+ meldingsplattformer (Telegram, Discord, Slack, WhatsApp, Signal og mer), og – og dette er kjernen – skriver sine egne ferdigheter over tid. Ikke du. Agenten. Det er enten meget spennende eller litt skummelt avhengig av hva du er komfortabel med.
Hva er egentlig forskjellen på en chatbot og en agent?
La oss rydde opp i en påstand som florerer i artikler om agenter: at chatboter «glemmer deg» og er «statsløse». Det stemmer ikke lenger – og det har ikke stemt på lenge. ChatGPT, Claude og Gemini husker alle samtaler på tvers av sesjoner. ChatGPT husker til og med kontekst på tvers av alle dine tidligere samtaler, noe som innimellom er mer enn du ba om (den drar inn urelatert gammel kontekst der den ikke hører hjemme). Minne er ikke skillet mellom chatbot og agent.
Det faktiske skillet er enklere: en chatbot svarer. Du åpner nettleseren, stiller et spørsmål, får et svar. En AI-agent gjør ting. Den bor på en server. Den kjører 24 timer i døgnet, syv dager i uken. Den kan motta en Telegram-melding midt på natten, kjøre en planlagt jobb du satte opp forrige uke, bruke verktøy (nettleser, filer, API-er, kode), og kjede handlinger uten at du er til stede – «søk etter X, les det du finner, sammenfatt det, send til Slack-kanalen». Den handler selvstendig. Den reagerer ikke bare.

Hva er Hermes Agent?
Hermes Agent er et åpent agent-rammeverk fra Nous Research, sluppet i februar 2026 under MIT-lisens. Det er ikke en modell – det er programvare du installerer på din egen server. Ingen telemetri, ingen cloud lock-in. Alt fra en $5 VPS til en GPU-klynge til serverless (Modal/Daytona hibernerer agenten mellom sesjoner, nær null kostnad hvis du ikke bruker den mye). Nåværende versjon er v0.15.2 (29. mai 2026).
Du kobler Hermes til en språkmodell via API. OpenRouter gir deg over 200 modeller via én enkelt API-nøkkel. Egne endepunkter, OpenAI, Google – alt funker. Bytter du modell, kjører du hermes model. Det er det. Rammeverket er modell-agnostisk.
Hermes fungerer som en gateway mot 15+ meldingsplattformer: Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, e-post, SMS og flere. Du sender en melding fra Telegram – agenten svarer fra din maskin, ikke via en mellomtjeneste. Over 40 innebygde verktøy: nettsøk, nettleser-automasjon, bildesyn, bildegenerering, TTS og naturlig-språk cron-planlegging («kjør dette hver mandag kl. 7»).
Hva kan du bruke Hermes til?
Dette er seksjonen som mangler i de fleste artikler om Hermes. La oss snakke om konkrete ting mennesker faktisk gjør med det – ikke abstrakt om «kjeder verktøy-kall».
Daglig briefing-bot. Agenten kjører en planlagt morgen-jobb, søker gjennom nyhetskilder og RSS-feeder du definerer, sammenfatter det relevante, og sender et Telegram-sammendrag til deg før du er oppe. Zero-token-kostnad når ingenting har endret seg – cron-jobben vekker kun språkmodellen når noe faktisk er nytt.
GitHub PR-review automatisk. Sett opp en webhook eller cron-jobb som kjøres når en PR er åpen. Hermes henter koden, kjører review-instruksjonene dine og legger igjen en kommentar – uten at du gjør noe.
Autonom bokproduksjon. Dette er det mest ekstreme eksempelet fra Nous Research selv: de brukte Hermes til å produsere en 79 456-ords roman komplett med lydbok og nettside, ende-til-ende, autonomt. Det er på grensen til det absurde, men det viser hva rammeverket er designet for.
ComfyUI-orkestrering. Hermes kan styre ComfyUI for generativ mediaproduksjon og auto-installerer noder det trenger. Nyttig hvis du allerede bruker ComfyUI og vil automatisere deler av arbeidsflyten.
Smart hjem og mobil. Home Assistant-integrasjon for smart hjem. Android-styring via 36 verktøy. iOS-companion med HealthKit-sensor-data.
Team-assistent med per-bruker-sesjoner. En Telegram-gruppe der kollegaer kan spørre agenten om koding, research eller ops – og agenten holder separate kontekster per bruker. Dette er nærmere «liten intern Slack-bot» enn personlig assistent.
Penetrasjonstesting med godkjennings-gates. Autonom pentest-agent som stopper og ber om godkjenning fra operatøren på kritiske punkter. Ikke for hjemmebruk, men relevant for de som driver med sikkerhet.
Fellesnevneren: oppgaver som er repeterende, sekvensielle og tar tid hvis du gjør dem for hånd. Jo mer kompleks og kjørt et mønster er, jo mer igjen for selvlærings-loopen.
OAuth-historien som forklarer veksten
Her er bakhistorien du bør kjenne til, fordi den forteller deg noe om agent-markedet generelt.
OpenClaw-skaperen døpte opprinnelig agenten sin «clawdbot». Anthropic likte ikke det – for nær «Claude» – og blokkerte bruk av Claude-abonnementet via tredjeparts-OAuth. Det er fullt forståelig og Anthropics fulle rett. Konsekvensen var at OpenClaw-brukere som ville ha Claude gikk via API-nøkler, ikke abonnementet sitt.
OpenAI gjorde det stikk motsatte: de hentet inn skaperen av OpenClaw OG åpnet for at brukere kan logge inn med OpenAI-OAuth i tredjeparts-agenter. 20-dollar-planen din kan brukes direkte i Hermes via OAuth-innlogging. Det rekker relativt langt. Googles modeller fungerer på samme måte.
Effekten av det valget er vanskelig å overvurdere. Å senke terskelen fra «sett opp API-nøkkel, forstå rate limits, betal per token fra dag én» til «logg inn med OpenAI-kontoen din» – det er en annen brukeropplevelse. Etter mitt syn er Anthropics valg om å blokkere tredjeparts-OAuth og OpenAIs valg om å åpne det en av de viktigste enkeltbeslutningene som forklarer veksten i agent-markedet gjennom 2026. Pengene og ekspertisen gikk dit terskelen var lavest.
Hvordan fungerer selvlærings-loopen?
Dette er det som gjør Hermes genuint interessant, og annerledes fra det meste i agent-feltet. De fleste agent-rammeverk – inkludert OpenClaw – har skills du skriver selv. Instruksjoner i markdown-filer som forklarer agenten hva den skal gjøre i ulike situasjoner. Du skriver dem, du vedlikeholder dem.
Hermes gjør noe mer: agenten skriver sine egne skills. Når den løser en komplisert oppgave – en flertrinns research-jobb, et spesielt formatert dokument, en prosess med mange steg – kan den lagre løsningen som en gjenbrukbar markdown-fil via skill_manage-verktøyet. Neste gang den møter en lignende oppgave, henter den frem den lagrede fremgangsmåten og bruker den som utgangspunkt. Over måneder bygger agenten et bibliotek av ferdigheter tilpasset akkurat det du bruker den til – uten kodeendring fra din side.
Rammeverket leveres med rundt 118 medfølgende skills, og følger den åpne agentskills.io-standarden – skills kan i prinsippet deles og porteres mellom rammeverk. Hermes er per nå den eneste mainstream-agenten med autonom skill-skaping som kjernefunksjon.
For de som er interessert i forsidene: det finnes et companion-prosjekt kalt hermes-agent-self-evolution som bruker DSPy og GEPA (Genetic-Pareto Prompt Evolution, presentert som ICLR 2026 Oral) for å optimere skills og prompts mot brukerdefinerte mål. Det er ganske tung forskningsteknikk for noe som startet som et hobbykode-prosjekt.
Kombinert med vedvarende minne – FTS5-søk i tidligere samtaler pluss pluggbare providere som Honcho og mem0 – betyr dette at agenten over tid bygger noe som ligner en modell av deg: hva du jobber med, hvilke formater du foretrekker, hva du spør om igjen og igjen. Det er det «The Agent That Grows With You»-slagordet sikter til. Tanken er god. Å gi en AI-agent god langtidshukommelse er derimot et problem feltet ennå ikke har løst elegant – og det gjelder Hermes også.

Hermes vs OpenClaw – hva er forskjellen i praksis?
Min erfaring med OpenClaw var at det fungerte greit som meldings-gateway og agent-rammeverk, men det føltes aldri som en agent som vokste. Skills var noe jeg måtte skrive og vedlikeholde selv – guiden min handler mye om å sette opp rammeverket riktig, ikke om å la agenten ta over og utvikle seg.
Her er de konkrete forskjellene:
| Aspekt | Hermes | OpenClaw |
|---|---|---|
| Selvforbedring | Agenten skriver og redigerer egne skills | Kun bruker-skrevne statiske skills |
| Modell-fleksibilitet | 200+ modeller via OpenRouter, bytt med én kommando | Bredere men manuell konfigurasjon |
| Installasjon | Én curl-linje, alt automatisk, selv-reparerende | npm-oppsett, mer manuell konfigurasjon |
| Serverless | Modal/Daytona, nær null kostnad mellom sesjoner | Krever kjørende server |
| Stemme/wake-word | Ikke like modent | Bedre stemme, wake-word på macOS/iOS |
| Skills-økosystem | ~118 medfølgende, 647+ på tvers av registre | ~13 700 via ClawHub (større community) |
| Meldingsplattformer | 15+ | 23 (bredere dekning) |
| Migrering | hermes claw migrate importerer fra OpenClaw | Moden og stabil infrastruktur |
Det viktigste skillet er designfilosofien: OpenClaw er en agent du konfigurerer. Hermes er, i teorien, en agent som konfigurerer seg selv over tid. Det gjør OpenClaw bedre for deg som vil ha noe stabilt og forutsigbart fra dag én. Hermes er mer interessant for deg som er villig til å vente på effekten av lærings-loopen, og som har oppgavemønstre som er repeterende nok til at den faktisk lærer noe nyttig.
OpenClaw er heller ikke et dårlig produkt. Det har større community, mer modne meldingsintegrasjoner og bedre stemme på Apple-plattformer. For mange brukere er det fortsatt riktigere valg. Hermes er ikke et svar på spørsmål du ikke har.
Hvor lett er det å komme i gang?
Her er det nåværende artikler om Hermes bomber: de fremstiller det som noe for Python-folk som er komfortabel med CLI-miljøer og pakke-konfigurasjon. Det stemmer ikke.
Du installerer med én kommando:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
På Windows: iex (irm [install.ps1-URL]) i PowerShell. Installereren bundler Python 3.11, Node.js, ripgrep og ffmpeg – uten admin-rettigheter. Det tar under ett minutt. Deretter kjører du hermes setup for den guidede veiviseren, trykker deg gjennom, og så virker det. Det som ikke virker, melder du fra om til agenten, og den fikser det selv.
Du trenger ikke kjenne til Python-miljøer, virtuelle miljøer, pip-avhengigheter eller noe av det. Installasjons-terskelen er lav. Det som faktisk krever noe er den løpende driften – forstå minne-begrensningene, holde skills-biblioteket ryddig, skrive gode instruksjoner for planlagte jobber. Men drift og installasjon er to forskjellige terskler, og det er viktig å holde dem fra hverandre.
De svakhetene ingen poster om
Her er det som mangler i de entusiastiske GitHub-README-ene. Disse er reelle begrensninger – ikke dealbreakers nødvendigvis, men du bør vite om dem før du investerer tid i oppsettet.
Minne-taket er lavt. Det vedvarende minnet har et tak på rundt 2 200 tegn for agent-notater og 1 375 tegn for brukerprofil. Det er omtrent én til to avsnitt tekst. Brukere som kjører agenten intensivt treffer dette taket fort og bruker mye tid på å konsolidere og rydde. Tredjepartsintegrasjoner som Honcho og mem0 hjelper, men de fungerer ikke av seg selv fra dag én og krever ekstra oppsett.
Frozen snapshot-laget er treigt. Minne som skrives midt i en sesjon vises ikke i system-prompten før neste sesjon. Agenten kan motsi seg selv i samme samtale – den husker noe fra forrige uke, men ikke noe den lærte for ti minutter siden. Det er forvirring som kan se ut som en bug, men er et arkitekturvalg.
Planlagte jobber kjører blindt. Cron-jobber kjører i blanke sesjoner uten kontekst fra tidligere samtaler. «Gjør den ukentlige briefen vi snakket om» feiler. Alle planlagte instruksjoner må være helt selvstendige og eksplisitte – ingen implisitte referanser til tidligere kontekst. Dette er et vanlig problem i agent-feltet, ikke unikt for Hermes, men det er verdt å nevne.
64K kontekst-gulvet stenger ute små modeller. Hermes krever minimum 64K tokens kontekstlengde. Det utelukker 7B- og 13B-modeller du typisk kjører lokalt. Vil du kjøre Hermes helt offline og uten sky-API, trenger du en stor modell med tilstrekkelig GPU-minne. Det motsier litt det selvstendige «kjør på alt»-løftet.
Skills-biblioteket vokser ukritisk. Agenten samler opp skills uten automatisk å sortere ut det som ikke fungerte eller er utdatert. Over tid kan du ende med et bibliotek av halvferdige eller overlappende instruksjonsfiler. Kontroll over hva agenten din gjør over tid er din jobb, ikke agentens – i hvert fall ikke ennå.
Alt er token-tungt. Minne-overhead, skills-biblioteket og verktøy-kontekst legger seg oppå hvert API-kall. Med rimelige modeller via OpenRouter er dette håndterbart, men det er ikke gratis. Sett opp budsjett-varsler før du starter cron-jobber i blinde.
Hvem passer Hermes for?
Hermes passer deg som vil ha en agent som faktisk bor hos deg – ikke i et annet selskaps sky – og som har gjentakende, komplekse oppgavemønstre der en selvlærende agent faktisk kan akkumulere noe nyttig over tid. Research-jobber, dokumentformatering til faste maler, koordinering av verktøy-kall i sekvens.
Installasjonen er genuint lav terskel (én linje, guidet veiviser, selv-reparerende). Det som krever noe er den løpende driften – minne-grooming, skills-vedlikehold, gode instruksjoner for planlagte jobber. Det er verdt å skille disse to nivåene fra hverandre når du vurderer om dette er noe for deg.
Vil du ha noe du konfigurerer én gang og deretter glemmer, er OpenClaw et mer modent alternativ med større community og bedre plattform-dekning. Hermes er mer ambisiøst – og mer krevende å bruke riktig. 170 000+ GitHub-stjerner forteller deg at mange er nysgjerrige på løftet. Det forteller deg ingenting om hverdagsbruk.
Det tester jeg i neste artikkel: installasjon på serveren min, kobling til OpenRouter og Telegram-gateway – og hva som faktisk skjer over de første dagene, ikke hva README-en lover.