Superwhisper vs Whisper Notes: en teknisk jämförelse

Priser, talmodeller, behörigheter och arkitektur — en detaljerad jämförelse av två offline-transkriptionsappar för Mac

Whisper Notes vs Superwhisper - Arkitektur och filosofijämförelse
Whisper Notes - Kanske den bästa offline Whisper-appen för iOS och Mac

Superwhisper var en pionjär. Det visade Mac-gemenskapen vad som var möjligt: kör OpenAI:s Whisper-modell lokalt på Apple Silicon, transkribera tal utan att skicka ljud till molnet.

Ett tag var det exakt vad många av oss ville ha—ett enkelt, snabbt, lokalt transkriptionsverktyg.

Sen förändrades det.

Den senaste riktningen har varit mot att bli en "AI-assistent"—kontextmedvetenhet, molnsynkronisering, agentlägen som tolkar dina ord istället för att bara transkribera dem.

Med denna pivot kom tre strukturella förändringar:

Prenumerationen: Betala månadshyra för modeller som körs på din egen hårdvara.

Behörigheten: Input Monitoring som kan observera alla dina tangenttryckningar.

Kontot: Obligatorisk inloggning för mjukvara som fungerar helt offline.

Den här sidan handlar inte om buggar eller tillfälliga problem. Det handlar om arkitekturfilosofi.

Whisper Notes finns som ett alternativ för dem som föredrog vad Superwhisper brukade vara: ett pålitligt, offline verktyg som gör en sak bra.

Snabb jämförelse: Whisper Notes vs Superwhisper

Funktion Whisper Notes Superwhisper
Pris $6.99 engångsbetalning $8.49/mån eller $250 livstid
macOS-behörighet Endast Accessibility Input Monitoring
Konto krävs Nej Ja
iOS-app $6.99 (separat köp) Separat prenumeration
Talmodeller Whisper + Parakeet V3 + Qwen3-ASR Whisper (+ distil-varianter)
100% Offline Ja Valfritt (hybrid)
Lokal AI-redigering Ja (Gemma 4, på enheten) Ja (molnberoende)
AI Context-funktioner Nej Ja

Talmodeller: Tre motorer mot en

Detta är den tekniska skillnaden som betyder mest för daglig användning.

Superwhisper erbjuder Whisper och dess destillerade varianter. Whisper Notes levererar tre oberoende talmotorer, var och en optimerad för olika scenarier:

Jämförelse av talmodeller

Modell Hastighet WER Bäst för
Whisper Large V3 Turbo 10–15× realtime 7.44% 100+ språk, allmänt ändamål
Parakeet V3 ~35× realtime 6.32% Engelska — snabbast, lägst felfrekvens
Qwen3-ASR Streaming Kinesiska, japanska, koreanska + 27 språk
Varför tre modeller spelar roll:

Parakeet V3 (av NVIDIA) transkriberar engelska 3× snabbare än Whisper med lägre felfrekvens — 6.32% mot 7.44% WER på FLEURS-benchmarket. Ett 35-minuters möte som tar 3 minuter med Whisper slutförs på under 20 sekunder med Parakeet V3.

Qwen3-ASR är specialbyggd för CJK-språk (kinesiska, japanska, koreanska) och levererar strömningstranskription — text visas medan du talar, inte efter att du slutat.

Dessa är inte molnmodeller bakom en betalvägg. De körs helt på din Macs Neural Engine, inkluderat i köpet på $6.99.

Superwhisper erbjuder bara Whisper-varianter. För engelsktunga eller CJK-arbetsflöden är modellvalsgapet betydande.

Input Monitoring-frågan

Det här är behörigheten som får integritetsmedvetna användare att stanna upp.

Superwhisper begär Input Monitoring-åtkomst på macOS. Denna behörighet tillåter en applikation att ta emot alla tangentbords- och mushändelser systemomfattande—oavsett vilken app som är i fokus.

Det är samma behörighetskategori som används av tillgänglighetsverktyg, automatiseringsmjukvara, och ja, keyloggers.

Varför behöver Superwhisper det?

För att vara "smart." Deras AI-kontextfunktioner läser ditt skärminnehåll, förstår vilken applikation du använder och anpassar sitt beteende därefter. För att observera din miljö behöver de observationsbehörigheter.

Den arkitektoniska avvägningen:

Du får kontextmedveten transkription. De får den tekniska förmågan att se allt du skriver, inklusive lösenord, privata meddelanden och konfidentiella dokument.

Vi antyder inte ont uppsåt—men själva behörigheten är arkitektoniskt kapabel till övervakning.

Behörighetsarkitektur

Input Monitoring (Superwhisper):
Kan ta emot alla tangentbordshändelser från alla applikationer. Krävs för 'kontextmedvetenhet'.

Tillgänglighet (Whisper Notes):
Kan infoga text vid markörpositionen. Kan inte läsa dina tangenttryckningar eller observera andra appar. Endast utdata.

macOS Privacy Settings
Tillgänglighetsbehörighet är säkrare än Input Monitoring

Whisper Notes använder uteslutande Tillgänglighetsbehörighet. Vi kan infoga text där din markör är—det är utdata. Vi kan inte läsa vad du skriver eller vad som är på din skärm.

Vår ståndpunkt: Vi valde att inte vara "smarta" eftersom smart kräver observation. Ett transkriptionsverktyg behöver inte veta att dina lösenord existerar. Det behöver bara skriva vad du sa.

Hårdvaruhyraproblemet

Det här är prissättningsbeslutet som frustrerar avancerade användare.

Superwhisper har placerat lokala AI-modeller—inklusive Nvidia Parakeet och Whisper-varianter—bakom en prenumerationsvägg. Användare betalar nu månadsavgifter för att låsa upp bearbetning som körs helt på deras egna enheter.

Låt oss vara precisa om vad som händer:

• Din M3 eller M4 MacBook har en Neural Engine.

• Apple designade detta chip specifikt för maskininlärning på enheten.

• Whisper-modellvikterna är open source, släppta av OpenAI.

• Elektriciteten kommer från ditt vägguttag.

Vad betalar prenumerationen egentligen för?

Tidsperiod Whisper Notes Superwhisper (Månadsvis) Superwhisper (Livstid)
År 1 $6.99 $101.88 $250
År 3 $6.99 $305.64 $250
Lokal AI-redigering Ja (Gemma 4, på enheten) Ja (molnberoende)
År 5 $6.99 $509.40 $250

Om Superwhispers molnfunktioner—synkronisering, AI-assistenter, externa API:er—ger värde för dig är prenumerationsprissättning försvarbar. Du betalar för deras infrastruktur.

Men att låsa lokala modeller bakom samma betalvägg? Det är att ta betalt för beräkning som sker på hårdvara du redan äger.

Användarrecensioner speglar denna frustration: "Satte ni verkligen lokala modeller bakom betalvägg? Det är meningslöst."

Vår prissättningsfilosofi: Whisper Notes kostar $6.99 engångsbetalning eftersom vi inte driver molninfrastruktur. Din Neural Engine gör jobbet. Vi tillhandahåller gränssnittet. Det är en engångstransaktion, inte en pågående relation.

Komplexitet och dess Konsekvenser

Det här avsnittet handlar inte om en specifik bugg. Det handlar om arkitektoniska avvägningar.

När mjukvara försöker göra många saker—molnsynkronisering, kontextmedvetenhet, agenttolkning, hybrid lokal/molnbearbetning—blir den nödvändigtvis komplex.

Komplexa system har fler fellägen än enkla. Det här är inte kritik; det är fysik.

Superwhisper-användare har rapporterat ett felmönster:

• Inspelningar som inte producerar transkript

• Ljud som verkar försvinna

• "Ingen röst hittad"-fel efter långa sessioner

Vi kan inte diagnostisera deras kodbas, men vi kan observera mönstret: ju fler funktioner en app hanterar, desto fler sätt kan den misslyckas.

Tillståndsmaskinproblemet:

Kontextmedvetna appar måste spåra många variabler. Vad är på skärmen? Är nätverket tillräckligt snabbt för molnbearbetning? Ska den här inspelningen synkroniseras? Vilken AI-modell ska hantera denna kontext?

Varje beslutspunkt är en potentiell obalans mellan förväntat och faktiskt tillstånd.

Whisper Notes är medvetet enkelt:

Spela in ljud → Skriv till disk kontinuerligt → Bearbeta med Whisper → Visa text

Linjärt dataflöde. Ingen molnsynkronisering som kan misslyckas. Ingen kontextmedvetenhet som kan felaktiveras. Inga hybrida routingbeslut.

Vi använder progressiv persistens—skriver ljud till disk var några sekund under inspelning. Om appen kraschar, eller ditt batteri tar slut, förlorar du högst de sista sekunderna. De föregående 20 minuterna är redan säkert på din enhet.

Det här är inte en funktion vi marknadsför; det är bara hur pålitlig inspelningsprogramvara ska fungera.

Avvägningen är verklig: Vi kan inte göra vad Superwhisper gör. Vi förstår inte din skärmkontext. Vi synkroniserar inte mellan enheter. Vi har inga AI-lägen som omformaterar ditt tal.

Vi bara transkriberar. Exakt, pålitligt, lokalt. Det är hela produkten.

Whisper Notes App Store listing - $6.99 one-time purchase on iPhone
Whisper Notes pris: $6.99 engångsköp per plattform

Kontokravet

Superwhisper kräver kontoskapande för att använda mjukvaran—även för lokal transkription på din egen enhet.

Detta tjänar deras affärsmodell: prenumerationshantering, molnsynkronisering och användningsanalys kräver användaridentitet.

Men för dem som helt enkelt vill ha lokal tal-till-text är det friktion utan fördel.

Whisper Notes har inget kontosystem:

• Du vill ha tre talmodeller — Whisper, Parakeet V3 (snabbast engelska), och Qwen3-ASR (bäst för kinesiska/japanska/koreanska)

• Du vill ha lokal AI-redigering med Gemma 4 — interpunktionsrensning, borttagning av utfyllnadsord, automatiskt genererade titlar, allt på enheten

• Ladda ner appen

• Börja prata

Ingen e-post. Inget lösenord. Ingen identitetsverifiering.

Det här handlar inte bara om bekvämlighet. Det handlar om dataminimering:

• Varje konto är ytterligare ett lösenord att hantera

• Varje databaspost är ytterligare ett intrångsmål

• Varje användaridentitet är ytterligare en datapunkt att skydda

För mjukvara som körs helt på din enhet ser vi ingen motivering för att veta vem du är. Whisper-modellen behöver inte din e-post för att konvertera tal till text.

När Superwhisper är Rätt för Dig

Vi påstår inte att Whisper Notes är universellt bättre. Superwhisper gjorde arkitektoniska val som tjänar specifika användningsfall väl.

Välj Superwhisper om:

• Du vill ha AI-kontextlägen som förstår din skärm och anpassar utdata

• Du behöver molnsynkronisering mellan flera Mac-datorer

• Du värdesätter "assistent"-upplevelsen framför ren transkription

• Prenumerationen eller livstidspriset på $250 passar ditt arbetsflödesvärde

• Input Monitoring-behörigheten oroar dig inte

Välj Whisper Notes om:

• Du vill ha minimala systembehörigheter (endast Tillgänglighet)

• Du föredrar ordagrann transkription utan AI-tolkning

• Du vill betala en gång ($6.99) och äga mjukvaran

• Du vill inte skapa ett konto

• Integritetsarkitektur är viktigare än bekvämlighetsfunktioner

• Du också använder iPhone ($6.99 i App Store, separat köp från Mac-versionen)

Den ärliga bedömningen:

Superwhisper bygger mot en framtid där AI förstår hela din datorkontext. Det är ambitiöst och vissa användare vill ha det.

Whisper Notes bygger motsatsen: ett verktyg som gör exakt en sak, vet ingenting om din dator utöver mikrofoningången, och fungerar på samma sätt varje gång.

Tråkig mjukvara för människor som värdesätter förutsägbarhet.

Fallet för Tråkig Mjukvara

"Tråkig" är inte nedsättande inom mjukvaruutveckling. Tråkig betyder förutsägbar. Tråkig betyder färre överraskningar.

Tråkig mjukvara:

• Behöver inte ett konto

• Kräver inte nätverksanslutning för kärnfunktioner

• Begär inte behörigheter utöver vad som är strikt nödvändigt

• Utvecklas inte till något du inte bad om

Superwhisper började som tråkig mjukvara. Ett lokalt transkriptionsverktyg. Enkelt, snabbt, pålitligt.

Sen växte det ambitioner. Det ville vara en AI-assistent, förstå kontext, synkronisera via moln, tolka dina ord.

Vissa användare följde den utvecklingen glatt. Andra saknar vad det var.

Whisper Notes är medvetet tråkigt. Vi gör en sak: konverterar tal till text med din enhets Neural Engine. Vi övervakar inte din skärm. Vi synkroniserar inte dina data. Vi tolkar inte din avsikt. Vi bara transkriberar.

$6.99 per plattform. Inget konto. Ingen Input Monitoring. Inga prenumerationer. Inga ambitioner utöver pålitlighet.

För dem som föredrog den ursprungliga visionen om vad lokala transkriptionsverktyg kunde vara—Whisper Notes finns här.

Vanliga Frågor

Varför kräver Superwhisper Input Monitoring-behörighet?

Superwhisper använder Input Monitoring för 'kontextmedvetenhet'—att förstå vad som är på din skärm för att anpassa AI-beteendet. Denna behörighet tillåter läsning av alla tangenttryckningar i alla applikationer. Whisper Notes använder endast Tillgänglighetsbehörighet, som kan infoga text men inte kan observera din inmatning eller andra appar.

Varför gick Superwhisper över till prenumerationsprissättning?

Superwhisper driver molninfrastruktur för synkronisering, konton och vissa AI-funktioner. Prenumerationer finansierar den infrastrukturen. Men de placerade också lokala modeller (som körs på din hårdvara) bakom samma betalvägg—vilket är det prissättningsbeslut användare ifrågasätter mest.

Är Whisper Notes lika exakt som Superwhisper?

Whisper Notes erbjuder tre talmodeller. Parakeet V3 har lägre ordfelfrekvens (6.32%) än Whisper (7.44%) på FLEURS engelska benchmark, och kör 3× snabbare. För kinesiska, japanska och koreanska är Qwen3-ASR specialbyggd för dessa språk. Superwhisper erbjuder bara Whisper-varianter.

Vilka talmodeller stöder Whisper Notes?

Tre modeller: Whisper Large V3 Turbo (100+ språk, allmänt ändamål), Parakeet V3 av NVIDIA (snabbast engelska, lägst felfrekvens), och Qwen3-ASR av Alibaba (optimerad för kinesiska, japanska, koreanska och 27 andra språk med strömningsutdata). Alla körs lokalt på din enhet.

Hur mycket kostar Whisper Notes jämfört med Superwhisper?

Whisper Notes kostar $6.99 per plattform (iOS och Mac säljs separat). Superwhisper kostar $8.49/månad eller $250 livstid, med iOS-appen som kräver separat prenumeration. Under 3 år: Whisper Notes kostar $6.99 per plattform, Superwhisper månadsvis kostar $305.64.

Kan Whisper Notes synkronisera mellan enheter?

Nej, designat så. Vi driver inga molnservrar, så det finns inget att synkronisera genom. Dina inspelningar stannar på enheten där du skapade dem. Detta eliminerar synkroniseringsfel och säkerställer att dina röstdata aldrig lämnar din hårdvara. Använd AirDrop eller manuell export vid behov.

Varför kräver inte Whisper Notes ett konto?

Lokal transkription har ingen teknisk anledning att kräva identitetsverifiering. Vi tror på dataminimering—om vi inte behöver din e-post för att få mjukvaran att fungera borde vi inte be om den. Inget konto betyder inget lösenord att hantera, ingen databaspost att hacka.

Vad är skillnaden mellan Input Monitoring och Tillgänglighetsbehörigheter?

Input Monitoring kan ta emot alla tangentbords-/mushändelser systemomfattande (observation). Tillgänglighet kan infoga text och utföra UI-automation (handling). Whisper Notes använder Tillgänglighet för att skriva transkriberad text vid din markör—endast utdata, ingen observation av vad du skriver.

Tre talmodeller. $6.99 engångsbetalning.

Whisper + Parakeet V3 + Qwen3-ASR. Lokal AI-redigering. Ingen Input Monitoring. Inga prenumerationer. Inga konton.