Offline-Transkription

Warum es jetzt endlich funktioniert

Lange Zeit bedeutete lokale Transkription langsamer und schlechter. Das hat sich geändert.

Offline-Transkriptionssoftware

Ein bisschen Kontext

Vor ein paar Jahren mussten Sie, wenn Sie genaue Transkription wollten, Ihr Audio auf den Server eines anderen hochladen. Lokale Optionen gab es, aber sie waren merklich schlechter. Der Kompromiss war real.

Dann passierten einige Dinge. OpenAI veröffentlichte Whisper als offenes Modell. Apple lieferte Chips mit dedizierter KI-Hardware aus. Plötzlich konnten dieselben Modelle, die Cloud-Dienste antrieben, auf einem Laptop laufen.

Wir begannen etwa zu dieser Zeit Whisper Notes zu entwickeln, hauptsächlich weil wir es selbst brauchten. Es stellte sich heraus, dass viele Leute nach dem Gleichen suchten.

Was sich geändert hat

Drei Dinge machten Cloud-Transkription früher zur offensichtlichen Wahl. Alle drei haben sich verschoben.

Rechenleistung

Die KI-Modelle für Transkription sind groß—Hunderte Millionen Parameter. Sie zu betreiben war auf Consumer-Hardware langsam und batteriehungrig.

Apples Neural Engine hat das geändert. Es ist ein dedizierter Chip für KI-Workloads, und er ist in jedem M-Series Mac und neuen iPhone. Whisper Large v3 Turbo läuft jetzt komfortabel auf einem MacBook Air.

Auf Telefonen verwenden wir kleinere Modelle, die für mobile Chips optimiert sind. Sie sind nicht ganz so genau wie das große Modell, aber immer noch besser als die meisten eingebauten Diktate.

Genauigkeit

Das hat uns überrascht. Wir erwarteten, dass lokale Modelle "gut genug" wären. Sie sind tatsächlich ziemlich gut.

Whisper Large v3 hat niedrigere Wortfehlerraten als die meisten System-Diktate. Und die Lücke zwischen lokalen und Cloud-APIs ist ziemlich klein geworden. Für die meisten Anwendungsfälle werden Sie wahrscheinlich keinen Unterschied bemerken.

Das ändert die Rechnung. Wenn die Genauigkeit vergleichbar ist, verschwindet der Hauptgrund, Audio hochzuladen.

Privatsphäre

Wir sind nicht hier, um Sie vor Cloud-Diensten zu erschrecken. Die meisten gehen verantwortungsvoll mit Daten um.

Aber es gibt einen Unterschied zwischen "sie versprechen, es nicht zu missbrauchen" und "sie hatten es nie". Ihre Stimme ist biometrisch—anders als ein Passwort können Sie sie nicht ändern, wenn etwas schiefgeht.

Mit lokaler Transkription bleibt Ihr Audio auf Ihrem Gerät. Nicht verschlüsselt-dann-hochgeladen. Es bleibt einfach... da. Für manche Menschen ist das sehr wichtig. Für andere vielleicht nicht. Wir haben für die erste Gruppe gebaut.

Wann was verwenden

Lokal ist nicht immer die richtige Wahl. So denken wir darüber.

Brauchen Sie Echtzeit-Zusammenarbeit?

Cloud-Tools wie Otter sind dafür gebaut. Mehrere Personen, die dieselbe Transkription bearbeiten, brauchen einen zentralen Server. Das ist eine gute Verwendung von Cloud.

Nutzen Sie Windows oder Android?

Lokale KI ist auf diesen Plattformen schwieriger—die Hardware-Unterstützung ist noch nicht ausgereift. Dragon funktioniert für Windows. Auf Android sind Cloud-Dienste normalerweise die praktische Wahl.

Müssen Sie wissen, wer was gesagt hat?

Sprechererkennung (Diarisation) erfordert zusätzliche Modelle. Cloud-Dienste wie Rev machen das gut. Lokale Tools holen auf, aber es ist noch ein Bereich, wo Cloud einen Vorteil hat.

Brauchen Sie nur private, genaue Transkription?

Darauf haben wir uns konzentriert. Wenn Ihre Hauptanliegen Privatsphäre und Genauigkeit sind und Sie Apple-Hardware verwenden, funktioniert lokal jetzt gut.

Was Whisper Notes macht

Es führt Whisper Large v3 Turbo auf Ihrem Mac aus, oder ein kleineres optimiertes Modell auf Ihrem iPhone. Ihr Audio verlässt nie das Gerät.

Auf dem Mac läuft die Transkription mit etwa 10-15-facher Echtzeit-Geschwindigkeit unter Verwendung der Neural Engine. Eine einstündige Aufnahme dauert ein paar Minuten. Auf dem iPhone ist es langsamer, aber für die meisten Aufnahmen immer noch praktikabel.

$4,99 einmalig, für beide Plattformen. Wir betreiben keine Server, also brauchen wir keine Abonnements. Das war's.

$4.99Einmalkauf. Mac und iPhone. Keine Abos. Keine Datensammlung.
Apple App Store logoWhisper Notes holen

Die Kurzversion

Lokale Transkription war früher ein Kompromiss. Jetzt ist es für viele Menschen eine vernünftige Standardwahl.

Wenn Sie Zusammenarbeit brauchen oder auf Nicht-Apple-Plattformen arbeiten, sind Cloud-Dienste weiterhin sinnvoll. Wenn Sie hauptsächlich genaue, private Transkription auf einem Mac oder iPhone wollen, ist die lokale Option ziemlich gut geworden.

Wir nutzen Whisper Notes selbst jeden Tag. Es tut, was wir brauchten.

Probieren Sie es aus

Sie können es im Flugmodus testen, wenn Sie überprüfen möchten, dass nichts hochgeladen wird. Alles funktioniert gleich.

App Store • $4.99 • Mac und iPhone

Ein Kauf deckt beide Plattformen ab.