Browsing Tag
ai-verktøy
46 innlegg
SentrySearch – søk gjennom videoopptak med naturlig språk via Gemini Embedding 2
SentrySearch er et open source CLI-verktøy som bruker Gemini Embedding 2 til å søke gjennom timevis med videoopptak via naturlig språk. Rå videopikler projiseres direkte inn i samme vektorrom som tekst – ingen transkripsjon, ingen bildeteksting. Koster rundt 2,84 dollar per time å indeksere.
Nano Banana 2 – komplett guide til bildegenerering med fal.ai
Den komplette norske guiden til Nano Banana 2 — Google Gemini Flash Image via fal.ai. Prompting, image_edit med referansebilde, shot types, lyssetting, API-parametere og sammenligning med Nano Banana Pro. Alt du trenger for å gå fra null til ekspert.
Open Swarm — kjør tusenvis av parallelle AI-agenter med 150+ internettverktøy
Open Swarm er et open source Python-rammeverk for å kjøre tusenvis av parallelle AI-agenter simultant. Hvert agent har tilgang til 150+ verktøy: Gmail, Twitter, Reddit, LinkedIn, Google Workspace, nettsøk og kodeeksekvering. Blueprint-system, MCP-integrasjon, støtter Ollama for lokal kjøring.
Gemini Embedding 2 — Googles første multimodale embedding-modell
Gemini Embedding 2 er Googles første nativt multimodale embedding-modell — den plasserer tekst, bilder, video, lyd og PDF i ett felles vektorrom. MTEB-score 68,17, kontekstvindu på 8 192 tokens og støtte for over 100 språk. Her er hva dette betyr for deg som bygger RAG-systemer.