Jan Sverre ved skrivebordet med lokale AI-dokumenter og privat kunnskapsbase på skjermen

Lokal LLM som personlig kunnskapsbase – slik gjør du det privat

Bruk en lokal LLM med dine egne notater, PDF-er og dokumenter som en privat kunnskapsbase. Her er oppsettene som faktisk fungerer i 2026.
Jan Sverre holder en Intel Optane Persistent Memory-modul i et serverrom opplyst av blå LED-lys fra Xeon-servere

Intel Optane PMem – kjøre 1 000 milliarders parametermodell lokalt

En entusiast har bygget et PC-bygg basert på Intel Optane Persistent Memory – diskontinuert serverminne med opptil 512 GB per DIMM – og klarer å kjøre Kimi K2.5 med 1 000 milliarder parametere lokalt på over 4 tokens per sekund.
Jan Sverre ser på to GPU-kort i PC-chassis lyse opp et mørkt rom mens llama.cpp tensor parallelism kjører på dual Blackwell PCIe

llama.cpp b9095 – NCCL-Free Tensor Parallelism på dual Blackwell PCIe

llama.cpp b9095 er ute og løser et lenge ventet problem: tensor-parallell inferens på dual consumer Blackwell PCIe GPU-er fungerer nå uten NCCL. Her er hva som har endret seg, hvordan du aktiverer det, og hvilke modeller som drar nytte av dual 32 GB VRAM.
Jan Sverre utforsker OpenAIs WebRTC relay-arkitektur for lav-latens stemme-AI med 900 millioner brukere

OpenAI Voice AI – slik leverer de lav latens til 900 millioner brukere

OpenAI redesignet hele WebRTC-stakken for ChatGPT Voice og Realtime API – relay pluss transceiver-arkitektur, Global Relay og Go-implementasjon som leverer lav latens til 900 millioner ukentlige brukere.
Jan Sverre utforsker LLMSearchIndex - lokal websøk med 203 millioner indekserte sider for RAG-systemer

LLMSearchIndex – lokal websøk med 203 millioner sider for RAG

LLMSearchIndex er et open source Python-bibliotek som lar deg søke på internett lokalt – uten Brave API, SearXNG eller andre betalte tjenester. Over 203 millioner indekserte sider fra FineWeb og Wikipedia, komprimert til en FAISS-indeks som kjører på vanlig hardware med 6 GB RAM.
Mann i hettegenser som systematisk bygger opp en prompting-struktur med JSON-kode og sjekklister rundt seg

Systematisk prompting – fem teknikker for pålitelige AI-svar

Fem teknikker som gjør AI-svar pålitelige nok for produksjonssystemer: rolle-spesifikk prompting, negativ prompting, JSON-strukturerte svar, ARQ og verbalized sampling. Ingen modelltrening nødvendig – alt skjer i prompten.
Mann ser bekymret på laptop der Google viser AI-oppsummering om hans kriminelle fortid

Retten til å bli glemt – når Google AI husker alt du vil glemme

Google AI Overviews oppsummerer deg basert på det verste du har gjort. En mann i 40-årene finner at ett søk på hans navn avslører kriminell fortid – selv om han har rehabilitert seg. Hva er egentlig retten til å bli glemt, og hva kan du gjøre?
Mann i hettegenser studerer ytelsessammenligning mellom Ollama og llama.cpp på terminal-skjerm i mørkt hjemmekontor

Trenger lokal LLM-økosystemet Ollama? Kanskje ikke

Ollama er populært, men er det det beste verktøyet for lokal AI-kjøring? llama.cpp er 1,8x raskere, og alternativer som LM Studio, Jan og ramalama er modnet. Her er hva debatten handler om.
Jan Sverre studerer holografisk modell av hydrogenatom i kvantfysikklaboratorium med partikkelakselerator-visualiseringer i bakgrunnen

Protonradius-puslespillet løst – 16 år med fysikkdebatt er over

Fysikere mener de endelig har løst protonradius-puslespillet som har plaget vitenskapen siden 2010. To uavhengige eksperimenter bekrefter at protonen er 0,84 femtometer i radius – i tråd med standardmodellen. Her er hva dette betyr.
Jan Sverre studerer Linux kernel kildekode på terminaler med Tux-pingvinen i neongrønt

Linux kernel og AI – de nye reglene for AI-assistert koding

Linux-kjernen har fått sitt første offisielle regelsett for AI-assistert koding. coding-assistants.rst setter én ting krystallklart: du eier alt koden AI skriver for deg – og AI kan aldri signere Signed-off-by.