Transkrypcja Offline

Dlaczego wreszcie działa

Przez lata lokalna transkrypcja oznaczała wolniejszą i gorszą. To się zmieniło.

Oprogramowanie do transkrypcji offline

Trochę kontekstu

Kilka lat temu, jeśli chciałeś dokładną transkrypcję, musiałeś przesłać swoje audio na czyjś serwer. Opcje lokalne istniały, ale były wyraźnie gorsze. Kompromis był prawdziwy.

Potem wydarzyło się kilka rzeczy. OpenAI wypuściło Whisper jako otwarty model. Apple zaczęło dostarczać chipy z dedykowanym sprzętem AI. Nagle te same modele, które napędzały usługi chmurowe, mogły działać na laptopie.

Zaczęliśmy budować Whisper Notes mniej więcej w tym czasie, głównie dlatego, że sami tego potrzebowaliśmy. Okazało się, że wiele osób szukało tego samego.

Co się zmieniło

Trzy rzeczy sprawiały, że transkrypcja w chmurze była oczywistym wyborem. Wszystkie trzy się zmieniły.

Moc obliczeniowa

Modele AI wykonujące transkrypcję są duże—setki milionów parametrów. Uruchamianie ich było wolne i rozładowywało baterię na sprzęcie konsumenckim.

Neural Engine Apple'a to zmienił. To dedykowany chip dla obciążeń AI, i jest w każdym Macu serii M i nowym iPhonie. Whisper Large v3 Turbo teraz komfortowo działa na MacBooku Air.

Na telefonach używamy mniejszych modeli zoptymalizowanych dla chipów mobilnych. Nie są tak dokładne jak duży model, ale wciąż lepsze niż większość wbudowanego dyktowania.

Dokładność

To nas zaskoczyło. Spodziewaliśmy się, że lokalne modele będą "wystarczająco dobre". W rzeczywistości są całkiem dobre.

Whisper Large v3 ma niższe wskaźniki błędów słów niż większość dyktowania systemowego. A różnica między lokalnymi a chmurowymi API stała się dość mała. W większości przypadków prawdopodobnie nie zauważysz różnicy.

To zmienia kalkulację. Jeśli dokładność jest porównywalna, główny powód przesyłania audio znika.

Prywatność

Nie jesteśmy tutaj, żeby straszyć cię usługami chmurowymi. Większość odpowiedzialnie zarządza danymi.

Ale jest różnica między "obiecują, że nie nadużyją" a "nigdy tego nie mieli". Twój głos to biometria—w przeciwieństwie do hasła, nie możesz go zmienić, jeśli coś pójdzie nie tak.

Z lokalną transkrypcją twoje audio zostaje na urządzeniu. Nie zaszyfrowane-potem-przesłane. Po prostu... zostaje. Dla niektórych ludzi to bardzo ważne. Dla innych może nie. Budowaliśmy dla pierwszej grupy.

Kiedy używać czego

Lokalne nie zawsze jest właściwym wyborem. Tak o tym myślimy.

Potrzebujesz współpracy w czasie rzeczywistym?

Narzędzia chmurowe jak Otter są do tego stworzone. Wiele osób edytujących tę samą transkrypcję potrzebuje centralnego serwera. To dobre zastosowanie chmury.

Używasz Windows lub Android?

Lokalne AI jest trudniejsze na tych platformach—wsparcie sprzętowe nie jest jeszcze dojrzałe. Dragon działa dla Windows. Na Androidzie usługi chmurowe są zwykle praktycznym wyborem.

Musisz wiedzieć, kto co powiedział?

Identyfikacja mówców (diaryzacja) wymaga dodatkowych modeli. Usługi chmurowe jak Rev dobrze to robią. Lokalne narzędzia doganiają, ale to wciąż obszar, gdzie chmura ma przewagę.

Potrzebujesz tylko prywatnej, dokładnej transkrypcji?

Na tym się skupiliśmy. Jeśli twoje główne troski to prywatność i dokładność, i używasz sprzętu Apple, lokalne teraz działa dobrze.

Co robi Whisper Notes

Uruchamia Whisper Large v3 Turbo na twoim Macu lub mniejszy zoptymalizowany model na iPhonie. Twoje audio nigdy nie opuszcza urządzenia.

Na Macu transkrypcja działa około 10-15 razy szybciej niż w czasie rzeczywistym używając Neural Engine. Godzinne nagranie zajmuje kilka minut. Na iPhonie jest wolniej, ale praktyczne dla większości nagrań.

$4.99 raz, dla obu platform. Nie prowadzimy serwerów, więc nie potrzebujemy subskrypcji. To wszystko.

$4.99Jednorazowy zakup. Mac i iPhone. Bez subskrypcji. Bez zbierania danych.
Apple App Store logoPobierz Whisper Notes

W skrócie

Lokalna transkrypcja kiedyś była kompromisem. Teraz to rozsądny domyślny wybór dla wielu osób.

Jeśli potrzebujesz współpracy lub pracujesz na platformach innych niż Apple, usługi chmurowe wciąż mają sens. Jeśli głównie chcesz dokładnej, prywatnej transkrypcji na Macu lub iPhonie, opcja lokalna stała się całkiem dobra.

Sami używamy Whisper Notes każdego dnia. Robi to, czego potrzebowaliśmy.

Wypróbuj

Możesz przetestować w trybie samolotowym, jeśli chcesz sprawdzić, że nic nie jest przesyłane. Wszystko działa tak samo.

App Store • $4.99 • Mac i iPhone

Jeden zakup obejmuje obie platformy.