Versiyon 1.3.2'den itibaren, Whisper Notes for Mac varsayilan konusma motoru olarak NVIDIA Parakeet TDT 0.6B ile geliyor. Ingilizce icin Whisper Large V3 Turbo'dan 10 kat daha hizli ve daha dogru. Baska dillere ihtiyacin varsa Whisper modelleri hala mevcut.
Varsayilani Neden Degistirdik
Whisper harika, ama genel amacli bir model olarak tasarlandi. 100'den fazla dil destekliyor, ceviri yapiyor, zaman damgasi uretiyor — tam bir Isvicre cakisi. Bunun bedeli hiz. Ingilizce dikte icin, sadece kelimelerin ekranda hizla belirmesini istedigin durumlarda, gereksiz yere agir kaliyor.
Beni hep rahatsiz eden bir sey vardi: Fn tusuna basarak sistem genelinde dikte yaparken Whisper ile yaklasik 1 dakika konustuktan sonra transkriptin gelmesi 3-5 saniye suruyordu. Bu duraklama akisi bozuyor. Konusmayi birakiyorsun, bekliyorsun, imlece bakiyorsun — sesle yazmanin buyusu kayboluyor.
Parakeet bunu tamamen degistirdi. Hiz o kadar yuksek ki, konusmayi biraktigin an transkript beliriyor. Konusuyorsun ve kelimeler aninda orada. Bu hissi bir kere yasadiktan sonra — o kesintisiz, sifir-bekleme akisi — Whisper'a geri donmek gercekten zor.
Parakeet V3 Ne Kadar Hizli?
Rakamlar kelimelerden daha etkili. Iste ayni Mac'te 35 dakikalik bir ses dosyasiyla gercek dunya karsilastirmasi:
| Model | 35 dk Ses |
|---|---|
| Whisper Large V3 Turbo | 3 dakika |
| Parakeet TDT 0.6B v3 | 18 saniye |
10 kat daha hizli. Ve model daha kucuk oldugu icin (600M vs 800M parametre), daha az bellek ve daha az pil tuketiyor.
Parakeet v3'u Bu Kadar Hizli Yapan Ne
Whisper sesi, sesli kitap okur gibi dinliyor — kelime kelime, kare kare, hic atlamadan. Sessizlik sirasinda bile islemeye devam ediyor, sonraki ne olacak diye tahmin ediyor. Bu kapsamli, ama yavas.
Parakeet temelden farkli bir yaklasim benimsiyor. Islemeden once ses sinyalini 8 kat sikistiriyor, boylece model sadece onemli olani goruyor. Sonra her kareyi tek tek islemek yerine, sadece hangi kelimeyi soyledigini degil, o kelimenin ne kadar surdigunu de tahmin ediyor — ve ileriye atliyor. Sessizlik mi? Tamamen atlanir. Uzun bir unlu mu? Onlarca yerine tek bir tahmin.
Sonuc: konusmayi beynin gibi islayan bir model — kelimelere odaklanan, bosluklari gormezden gelen. 10 kat daha hizli olmasinin, daha az parametreyle daha yuksek dogruluk saglamasinin nedeni bu.
Karsilastirmalar: Parakeet v3 vs Whisper
Parakeet v3, FLEURS, CoVoST ve MLS karsilastirmalarinda kendisinden 2-4 kat buyuk modellere esit ya da daha iyi performans gosteriyor
Hugging Face Open ASR Leaderboard'da Parakeet v3, sadece 600M parametreyle listenin basinda — Whisper Large V3'un 1.55B'sinin yarisindan az:
| Model | Parametre | Ort. WER | Hiz (RTFx) |
|---|---|---|---|
| Parakeet TDT 0.6B v3 | 0.6B | 6.32% | 3,333x |
| Canary 1B v2 | 1.0B | 7.15% | 749x |
| Whisper Large V3 | 1.55B | 7.44% | 146x |
| Whisper Large V3 Turbo | 0.8B | 7.6% | 350x |
Dusuk WER = daha az hata. Yuksek RTFx = daha hizli. Parakeet ikisinde de kazaniyor. 600M parametreyle, listedeki en kucuk model ayni zamanda — bu da Apple Silicon'da minimum bellek ve pil tuketimiyle harika calistiği anlamina geliyor.
Artik Halusinasyon Yok
Whisper'i dikte icin kullandiysan, sessizlikte halusinasyon yaptigini gormusundur — cumleler tekrarlanir, kelimeler uydurulur, ya da bir anda "Subtitles by Amara.org" cikiverir. Bunun nedeni Whisper'in otoregresif kod cozucusunun, cevrilecek bir sey olmasa bile her zaman metin uretmeyi beklemesi.
NVIDIA, Parakeet'i 36.000 saatlik saf konusma-disi seste (arka plan gurultusu, oksuruk, sessizlik) bos dize hedefleriyle egitti. Model sessizligin neye benzedigini ogrendi ve sessiz kaliyor. "Her zaman acik" sistem genelinde dikte icin bu bir devrim — dusunmek icin durdugunuzda artik cop metin belirmiyor.
Parakeet'in Destekledigi Diller
Parakeet v3, 25 dili destekliyor: Bulgarca, Hirvatca, Cekce, Danca, Felemenkce, Ingilizce, Estonca, Fince, Fransizca, Almanca, Yunanca, Macarca, Italyanca, Letonca, Litvanca, Maltaca, Lehce, Portekizce, Romence, Rusca, Slovakca, Slovence, Ispanyolca, Isvecce ve Ukraynaca.
Bu Avrupa'nin buyuk bolumunu kapsiyor, ama Cince, Japonca, Korece, Arapca veya Hintce desteklemiyor. Bu yuzden Whisper modellerini indirilebilir secenekler olarak tuttuk. Japonca veya Mandarin Cince dikte ediyorsan, model seciciden Whisper Large V3 Turbo'yu sec. Ingilizce ve Avrupa dilleri icin Parakeet v3 cok daha iyi bir motor.
Model secici: Parakeet V3 (varsayilan), Whisper Small ve Whisper Large V3 Turbo — hepsi yerel olarak calisiyor
Whisper Notes'ta Model Secici
Modeller arasinda gecis yapmak icin Ayarlar'i ac:
- Parakeet V3 (varsayilan) — En hizli, Ingilizce ve Avrupa dilleri icin en iyi
- Whisper Small — Hafif, 100+ dil
- Whisper Large V3 Turbo — En dogru cok dilli model
Tum modeller Mac'inde %100 yerel olarak calisiyor. Internet yok, bulut yok, verin cihazindan cikmiyor.
Dene
Parakeet v3 su an Mac surumunde mevcut — en son DMG'yi indirmen yeterli. Geri bildirimler olumlu olursa, gelecek bir guncellemede Parakeet'i iOS surumune de getirecegiz.
Soru veya geri bildirim mi var? E-posta gonder: support@whispernotes.app.