Offline Transkription
Warum Es Endlich Funktioniert
Jahrelang bedeutete lokale Transkription langsamer und schlechter. Das hat sich geändert.

Etwas Kontext
Vor ein paar Jahren mussten Sie, wenn Sie genaue Transkription wollten, Ihr Audio auf den Server eines anderen hochladen. Lokale Optionen existierten, aber sie waren merklich schlechter. Der Kompromiss war real.
Dann passierten einige Dinge. OpenAI veröffentlichte Whisper als offenes Modell. Apple begann Chips mit dedizierter KI-Hardware zu liefern. Plötzlich konnten dieselben Modelle, die Cloud-Dienste antrieben, auf einem Laptop laufen.
Wir begannen ungefähr zu dieser Zeit Whisper Notes zu bauen, hauptsächlich weil wir es selbst brauchten. Es stellte sich heraus, dass viele Leute nach demselben suchten.
Was Sich Geändert Hat
Drei Dinge machten Cloud-Transkription zur offensichtlichen Wahl. Alle drei haben sich geändert.
Rechenleistung
Die KI-Modelle, die Transkription machen, sind groß—hunderte Millionen Parameter. Sie zu betreiben war langsam und verbrauchte Akku auf Verbraucher-Hardware.
Apples Neural Engine hat das geändert. Es ist ein dedizierter Chip für KI-Arbeitslasten, und er ist in jedem M-Serie Mac und neueren iPhone. Whisper Large v3 Turbo läuft jetzt bequem auf einem MacBook Air.
Auf Handys verwenden wir kleinere Modelle, die für mobile Chips optimiert sind. Sie sind nicht so genau wie das große Modell, aber immer noch besser als die meisten eingebauten Diktier-Funktionen.
Genauigkeit
Das hat uns überrascht. Wir erwarteten, dass lokale Modelle "gut genug" sein würden. Sie sind tatsächlich ziemlich gut.
Whisper Large v3 hat niedrigere Wortfehlerraten als die meisten System-Diktierfunktionen. Und die Lücke zwischen lokalen und Cloud-APIs ist ziemlich klein geworden. Für die meisten Anwendungsfälle werden Sie den Unterschied wahrscheinlich nicht bemerken.
Das ändert die Rechnung. Wenn die Genauigkeit vergleichbar ist, verschwindet der Hauptgrund für das Hochladen von Audio.
Datenschutz
Wir sind nicht hier, um Ihnen Angst vor Cloud-Diensten zu machen. Die meisten gehen verantwortungsvoll mit Daten um.
Aber es gibt einen Unterschied zwischen "sie versprechen, es nicht zu missbrauchen" und "sie hatten es nie". Ihre Stimme ist biometrisch—anders als ein Passwort können Sie sie nicht ändern, wenn etwas schiefgeht.
Bei lokaler Transkription bleibt Ihr Audio auf Ihrem Gerät. Nicht verschlüsselt-dann-hochgeladen. Einfach... bleibt. Für manche Menschen ist das sehr wichtig. Für andere vielleicht nicht. Wir haben für die erste Gruppe gebaut.
Wann Was Verwenden
Lokal ist nicht immer die richtige Wahl. So denken wir darüber.
Brauchen Sie Echtzeit-Zusammenarbeit?
Cloud-Tools wie Otter sind dafür gebaut. Mehrere Personen, die dieselbe Transkription bearbeiten, brauchen einen zentralen Server. Das ist eine gute Verwendung der Cloud.
Verwenden Sie Windows oder Android?
Lokale KI ist auf diesen Plattformen schwieriger—die Hardware-Unterstützung ist noch nicht ausgereift. Dragon funktioniert für Windows. Auf Android sind Cloud-Dienste normalerweise die praktische Wahl.
Müssen Sie wissen, wer was gesagt hat?
Sprecheridentifikation (Diarisierung) erfordert zusätzliche Modelle. Cloud-Dienste wie Rev handhaben das gut. Lokale Tools holen auf, aber das ist noch ein Bereich, wo die Cloud einen Vorteil hat.
Brauchen Sie nur private, genaue Transkription?
Darauf haben wir uns konzentriert. Wenn Ihre Hauptanliegen Datenschutz und Genauigkeit sind und Sie Apple-Hardware verwenden, funktioniert lokal jetzt gut.
Was Whisper Notes Macht
Es führt Whisper Large v3 Turbo auf Ihrem Mac aus, oder ein kleineres optimiertes Modell auf Ihrem iPhone. Ihr Audio verlässt nie das Gerät.
Auf dem Mac läuft Transkription mit etwa 10-15-facher Echtzeit-Geschwindigkeit unter Verwendung der Neural Engine. Eine einstündige Aufnahme dauert ein paar Minuten. Auf dem iPhone ist es langsamer, aber praktisch für die meisten Aufnahmen.
$4.99 einmal, für beide Plattformen. Wir betreiben keine Server, also brauchen wir keine Abonnements. Das ist alles.
Kurz Gesagt
Lokale Transkription war früher ein Kompromiss. Jetzt ist es ein vernünftiger Standard für viele.
Wenn Sie Zusammenarbeit brauchen oder auf Nicht-Apple-Plattformen arbeiten, machen Cloud-Dienste noch Sinn. Wenn Sie hauptsächlich genaue, private Transkription auf Mac oder iPhone wollen, ist die lokale Option ziemlich gut geworden.
Wir selbst verwenden Whisper Notes jeden Tag. Es macht, was wir brauchten.
Probieren Sie Es Aus
Sie können im Flugmodus testen, wenn Sie überprüfen möchten, dass nichts hochgeladen wird. Alles funktioniert gleich.
App Store • $4.99 • Mac und iPhone
Ein Kauf deckt beide Plattformen ab.