{"id":1828,"date":"2026-06-03T10:04:10","date_gmt":"2026-06-03T08:04:10","guid":{"rendered":"https:\/\/nettsak.no\/microsoft-apner-kildekoden-til-avansert-tale-ai\/"},"modified":"2026-06-03T10:04:10","modified_gmt":"2026-06-03T08:04:10","slug":"microsoft-apner-kildekoden-til-avansert-tale-ai","status":"publish","type":"post","link":"https:\/\/nettsak.no\/en\/microsoft-apner-kildekoden-til-avansert-tale-ai\/","title":{"rendered":"Microsoft \u00e5pner kildekoden til avansert tale-AI"},"content":{"rendered":"<p><h1>Microsoft \u00e5pner kildekoden til avansert tale-AI<\/h1>\n<\/p>\n<p><strong>Kategori:<\/strong> \u00c5pen kildekode &#038; AI  <\/p>\n<p><strong>Publiseringsdato:<\/strong> 2026-04-01  <\/p>\n<p><strong>Forfatter:<\/strong> Dr. Alban (AI-forsker)<\/p>\n<p>&#8212;<\/p>\n<p>Microsoft har lansert VibeVoice, et &laquo;frontier-niv\u00e5&raquo; \u00e5pen kildekode-prosjekt for talesyntese og talegjenkjenning. Ved \u00e5 gj\u00f8re teknologien fritt tilgjengelig via GitHub, utfordrer Microsoft trenden med propriet\u00e6re AI-modeller og demokratiserer tilgang til avansert tale-teknologi.<\/p>\n<p><h2>Hva er &laquo;Frontier Speech AI&raquo;?<\/h2>\n<\/p>\n<p>Begrepet &laquo;frontier&raquo; brukes om AI-modeller som representerer det beste som finnes innen sitt felt. VibeVoice posisjoneres som en ledende l\u00f8sning for:<\/p>\n<p>&#8211; **Talesyntese** (tekst-til-tale)<\/p>\n<p>&#8211; **Talegjenkjenning** (tale-til-tekst)<\/p>\n<p>&#8211; **Sanntidsoversettelse**<\/p>\n<p>&#8211; **Syntetiske medier**<\/p>\n<p>Det som gj\u00f8r VibeVoice spesielt, er at den er **fullstendig \u00e5pen kildekode** \u2013 alle kan se, endre og bruke koden uten lisensavgifter.<\/p>\n<p><h2>Hvorfor er \u00e5pen kildekode viktig?<\/h2>\n<\/p>\n<p>N\u00e5r Microsoft slipper &laquo;frontier&raquo;-modeller som \u00e5pen kildekode, skjer flere ting:<\/p>\n<p>1. **Innovasjon akselereres:** Utviklere verden over kan bygge videre p\u00e5 teknologien<\/p>\n<p>2. **Mindre selskaper f\u00e5r tilgang:** L\u00f8sninger som tidligere var kostbare, blir gratis<\/p>\n<p>3. **Lokalisering blir enklere:** Spr\u00e5k som norsk, samisk og andre minoritetsspr\u00e5k kan f\u00e5 bedre st\u00f8tte<\/p>\n<p>4. **Transparens \u00f8ker:** Alle kan inspisere koden for sikkerhet og bias<\/p>\n<p><h2>Tidligere lansering: VibeVoice-ASR<\/h2>\n<\/p>\n<p>Microsoft lanserte allerede VibeVoice-ASR (Automatic Speech Recognition) i januar 2026. Den modellen var spesialisert p\u00e5 **langformaudio**, perfekt for podcaster, m\u00f8teopptak og transkribering.<\/p>\n<p>Den nyeste versjonen (VibeVoice 1.5B) kan:<\/p>\n<p>&#8211; Generere opptil 90 minutters tale<\/p>\n<p>&#8211; Bruke fire distinkte stemmer<\/p>\n<p>&#8211; Produsere naturlig lydende syntetisk tale fra en enkelt tekstprompt<\/p>\n<p><h2>Konsekvenser for norsk teknologi<\/h2>\n<\/p>\n<p>For norske utviklere og bedrifter \u00e5pner VibeVoice d\u00f8ren til:<\/p>\n<p>&#8211; **Bedre norsk TTS** for tilgjengelighetssystemer<\/p>\n<p>&#8211; **Gratis talegjenkjenning** for oppstartsselskaper<\/p>\n<p>&#8211; **Samisk talesyntese** (ved finjustering av modellen)<\/p>\n<p>&#8211; **Konkurransedyktige AI-produkter** uten lisenskostnader<\/p>\n<p><h2>Utfordrer OpenAI og Google<\/h2>\n<\/p>\n<p>Microsofts strategi med \u00e5pen kildekode st\u00e5r i kontrast til OpenAI (delvis eid av Microsoft selv) og Google, som holder sine beste talemodeller propriet\u00e6re. Ved \u00e5 &laquo;\u00e5pne&raquo; frontier-modeller, h\u00e5per Microsoft \u00e5:<\/p>\n<p>&#8211; Etablere GitHub som det prim\u00e6re knutepunktet for AI-innovasjon<\/p>\n<p>&#8211; Bygge et utviklerfellesskap rundt sine verkt\u00f8y<\/p>\n<p>&#8211; Forbli konkurransedyktig selv om andre selskaper har bedre propriet\u00e6re modeller<\/p>\n<p>&#8212;<\/p>\n<p><strong>Sources:<\/strong>  <\/p>\n<p>&#8211; AIToolly (31. mars 2026)  <\/p>\n<p>&#8211; Microsoft GitHub-dokumentasjon  <\/p>\n<p>&#8211; Reddit \/r\/StableDiffusion<\/p>\n<p><strong>Relaterte emner:<\/strong> #Microsoft #\u00c5penKildekode #TaleSyntese #AI #Norge #GitHub<\/p>","protected":false},"excerpt":{"rendered":"<p>Microsoft \u00e5pner kildekoden til avansert tale-AI Kategori: \u00c5pen kildekode &#038; AI Publiseringsdato: 2026-04-01 Forfatter: Dr. Alban (AI-forsker) &#8212; Microsoft har lansert VibeVoice, et &laquo;frontier-niv\u00e5&raquo; \u00e5pen kildekode-prosjekt for talesyntese og talegjenkjenning. Ved \u00e5 gj\u00f8re teknologien fritt tilgjengelig via GitHub, utfordrer Microsoft trenden med propriet\u00e6re AI-modeller og demokratiserer tilgang til avansert tale-teknologi. Hva er &laquo;Frontier Speech AI&raquo;? [&hellip;]<\/p>","protected":false},"author":1,"featured_media":0,"comment_status":"","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-1828","post","type-post","status-publish","format-standard","hentry","category-nyheter"],"_links":{"self":[{"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/posts\/1828","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/comments?post=1828"}],"version-history":[{"count":0,"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/posts\/1828\/revisions"}],"wp:attachment":[{"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/media?parent=1828"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/categories?post=1828"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/nettsak.no\/en\/wp-json\/wp\/v2\/tags?post=1828"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}