Çevrimdışı Transkripsiyon
Neden Sonunda Çalışıyor
Yıllarca yerel transkripsiyon daha yavaş ve daha kötü demekti. Bu değişti.

Biraz Bağlam
Birkaç yıl önce, doğru transkripsiyon istiyorsanız, sesinizi birinin sunucusuna yüklemek zorundaydınız. Yerel seçenekler vardı, ama belirgin şekilde daha kötüydü. Ödün gerçekti.
Sonra birkaç şey oldu. OpenAI, Whisper'ı açık model olarak yayınladı. Apple, özel AI donanımına sahip çipler üretmeye başladı. Birden bulut hizmetlerini çalıştıran aynı modeller bir dizüstü bilgisayarda çalışabilir hale geldi.
Whisper Notes'u o sıralarda inşa etmeye başladık, çoğunlukla kendimiz için ihtiyacımız olduğundan. Bir çok insanın aynı şeyi aradığı ortaya çıktı.
Ne Değişti
Üç şey bulut transkripsiyonunu bariz seçim yapıyordu. Üçü de değişti.
Hesaplama Gücü
Transkripsiyon yapan AI modelleri büyük—yüz milyonlarca parametre. Bunları çalıştırmak tüketici donanımında yavaş ve pil tüketiyordu.
Apple'ın Neural Engine'i bunu değiştirdi. AI iş yükleri için özel bir çip ve her M serisi Mac ve yeni iPhone'da var. Whisper Large v3 Turbo artık bir MacBook Air'de rahatça çalışıyor.
Telefonlarda, mobil çipler için optimize edilmiş daha küçük modeller kullanıyoruz. Büyük model kadar doğru değiller, ama yine de çoğu yerleşik dikteden daha iyi.
Doğruluk
Bu bizi şaşırttı. Yerel modellerin "yeterince iyi" olmasını bekliyorduk. Aslında oldukça iyiler.
Whisper Large v3, çoğu sistem diktesinden daha düşük kelime hata oranlarına sahip. Ve yerel ile bulut API'ları arasındaki fark oldukça küçüldü. Çoğu kullanım durumu için muhtemelen farkı fark etmeyeceksiniz.
Bu hesaplamayı değiştiriyor. Doğruluk karşılaştırılabilirse, ses yüklemenin ana nedeni kayboluyor.
Gizlilik
Sizi bulut hizmetleriyle korkutmak için burada değiliz. Çoğu veriyle sorumlu bir şekilde ilgileniyor.
Ama "kötüye kullanmayacaklarına söz veriyorlar" ile "hiç sahip olmadılar" arasında bir fark var. Sesiniz biyometrik—bir şifreden farklı olarak, bir şeyler ters giderse değiştiremezsiniz.
Yerel transkripsiyon ile sesiniz cihazınızda kalıyor. Şifrelendi-sonra-yüklendi değil. Sadece... kalıyor. Bazı insanlar için bu çok önemli. Diğerleri için belki değil. İlk grup için inşa ettik.
Ne Zaman Ne Kullanılır
Yerel her zaman doğru seçim değil. İşte nasıl düşünüyoruz.
Gerçek zamanlı işbirliğine mi ihtiyacınız var?
Otter gibi bulut araçları bunun için yapıldı. Aynı transkripsiyonu düzenleyen birden fazla kişi merkezi bir sunucuya ihtiyaç duyar. Bu bulutun iyi bir kullanımı.
Windows veya Android mi kullanıyorsunuz?
Bu platformlarda yerel AI daha zor—donanım desteği henüz olgun değil. Dragon Windows için çalışıyor. Android'de bulut hizmetleri genellikle pratik seçim.
Kimin ne dediğini bilmeniz mi gerekiyor?
Konuşmacı tanımlama (diyarizasyon) ek modeller gerektirir. Rev gibi bulut hizmetleri bunu iyi yapıyor. Yerel araçlar yetişiyor, ama hala bulutun avantajlı olduğu bir alan.
Sadece özel, doğru transkripsiyon mu istiyorsunuz?
Biz buna odaklandık. Ana endişeleriniz gizlilik ve doğruluksa ve Apple donanımındaysanız, yerel artık iyi çalışıyor.
Whisper Notes Ne Yapar
Mac'inizde Whisper Large v3 Turbo'yu veya iPhone'unuzda daha küçük optimize edilmiş bir modeli çalıştırır. Sesiniz asla cihazı terk etmez.
Mac'te transkripsiyon Neural Engine kullanarak gerçek zamandan yaklaşık 10-15 kat hızlı çalışır. Bir saatlik kayıt birkaç dakika sürer. iPhone'da daha yavaş, ama çoğu kayıt için pratik.
Her iki platform için bir kez $4.99. Sunucu çalıştırmıyoruz, bu yüzden aboneliğe ihtiyacımız yok. Hepsi bu.
Kısaca
Yerel transkripsiyon eskiden bir ödündü. Şimdi birçok insan için makul bir varsayılan.
İşbirliğine ihtiyacınız varsa veya Apple dışı platformlarda çalışıyorsanız, bulut hizmetleri hala mantıklı. Çoğunlukla Mac veya iPhone'da doğru, özel transkripsiyon istiyorsanız, yerel seçenek oldukça iyi hale geldi.
Whisper Notes'u kendimiz her gün kullanıyoruz. İhtiyacımız olanı yapıyor.
Deneyin
Hiçbir şeyin yüklenmediğini doğrulamak istiyorsanız uçak modunda test edebilirsiniz. Her şey aynı çalışıyor.
App Store • $4.99 • Mac ve iPhone
Tek satın alma her iki platformu da kapsar.