Parakeet V3 vs Whisper: 10 kat daha hızlı, daha yüksek doğruluk (Kıyaslama)

7 Mart 2026
·
6 min read
·Whisper Notes Team

TL;DR

Parakeet V3 Whisper Large V3
Hız 10×
Desteklenen diller 25 100+
İngilizce hata oranı (WER) 6.32% 7.44%
Ort. hata oranı 25 dil (WER) 12.0% 12.6%
Halüsinasyonlar Yok Sessizlikte
En uygun İngilizce ve Avrupa dilleri Asya, Arapça, 100+

* Hız: 35 dk ses, Apple Silicon. İngilizce WER: Open ASR Leaderboard. Ort. 25 dil: FLEURS benchmark.

Versiyon 1.3.2'den itibaren, Whisper Notes for Mac varsayilan konusma motoru olarak NVIDIA Parakeet TDT 0.6B ile geliyor. Ingilizce icin Whisper Large V3 Turbo'dan 10 kat daha hizli ve daha dogru. Baska dillere ihtiyacin varsa Whisper modelleri hala mevcut.

Varsayilani Neden Degistirdik

Whisper harika, ama genel amacli bir model olarak tasarlandi. 100'den fazla dil destekliyor, ceviri yapiyor, zaman damgasi uretiyor — tam bir Isvicre cakisi. Bunun bedeli hiz. Ingilizce dikte icin, sadece kelimelerin ekranda hizla belirmesini istedigin durumlarda, gereksiz yere agir kaliyor.

Beni hep rahatsiz eden bir sey vardi: Fn tusuna basarak sistem genelinde dikte yaparken Whisper ile yaklasik 1 dakika konustuktan sonra transkriptin gelmesi 3-5 saniye suruyordu. Bu duraklama akisi bozuyor. Konusmayi birakiyorsun, bekliyorsun, imlece bakiyorsun — sesle yazmanin buyusu kayboluyor.

Parakeet bunu tamamen degistirdi. Hiz o kadar yuksek ki, konusmayi biraktigin an transkript beliriyor. Konusuyorsun ve kelimeler aninda orada. Bu hissi bir kere yasadiktan sonra — o kesintisiz, sifir-bekleme akisi — Whisper'a geri donmek gercekten zor.

Parakeet V3 Ne Kadar Hizli?

Rakamlar kelimelerden daha etkili. Iste ayni Mac'te 35 dakikalik bir ses dosyasiyla gercek dunya karsilastirmasi:

Model 35 dk Ses
Whisper Large V3 Turbo 3 dakika
Parakeet TDT 0.6B v3 18 saniye

10 kat daha hizli. Ve model daha kucuk oldugu icin (600M vs 800M parametre), daha az bellek ve daha az pil tuketiyor.

Parakeet v3'u Bu Kadar Hizli Yapan Ne

Whisper sesi, sesli kitap okur gibi dinliyor — kelime kelime, kare kare, hic atlamadan. Sessizlik sirasinda bile islemeye devam ediyor, sonraki ne olacak diye tahmin ediyor. Bu kapsamli, ama yavas.

Parakeet temelden farkli bir yaklasim benimsiyor. Islemeden once ses sinyalini 8 kat sikistiriyor, boylece model sadece onemli olani goruyor. Sonra her kareyi tek tek islemek yerine, sadece hangi kelimeyi soyledigini degil, o kelimenin ne kadar surdigunu de tahmin ediyor — ve ileriye atliyor. Sessizlik mi? Tamamen atlanir. Uzun bir unlu mu? Onlarca yerine tek bir tahmin.

Sonuc: konusmayi beynin gibi islayan bir model — kelimelere odaklanan, bosluklari gormezden gelen. 10 kat daha hizli olmasinin, daha az parametreyle daha yuksek dogruluk saglamasinin nedeni bu.

Karsilastirmalar: Parakeet v3 vs Whisper

Kelime Hata Orani karsilastirmasi: Parakeet TDT 0.6B v3 vs Whisper Large V3 vs Seamless M4T, birden fazla karsilastirma veri setinde

Parakeet v3, FLEURS, CoVoST ve MLS karsilastirmalarinda kendisinden 2-4 kat buyuk modellere esit ya da daha iyi performans gosteriyor

Hugging Face Open ASR Leaderboard'da Parakeet v3, sadece 600M parametreyle listenin basinda — Whisper Large V3'un 1.55B'sinin yarisindan az:

Model Parametre Ort. WER Hiz (RTFx)
Parakeet TDT 0.6B v3 0.6B 6.32% 3,333x
Canary 1B v2 1.0B 7.15% 749x
Whisper Large V3 1.55B 7.44% 146x
Whisper Large V3 Turbo 0.8B 7.6% 350x

Dusuk WER = daha az hata. Yuksek RTFx = daha hizli. Parakeet ikisinde de kazaniyor. 600M parametreyle, listedeki en kucuk model ayni zamanda — bu da Apple Silicon'da minimum bellek ve pil tuketimiyle harika calistiği anlamina geliyor.

Cok Dilli WER: Tum 25 Dil

Yukaridaki siralama yalnizca Ingilizceyi kapsiyor. Iste tam tablo — Whisper Notes'ta bulunan uc modelin, Parakeet'in destekledigi 25 dilin tumunde nasil performans gosterdigini FLEURS benchmarki uzerinden olcuyoruz. Dusuk WER = daha az transkripsiyon hatasi. Her satirda Large V3 ile Parakeet arasindaki en iyi deger vurgulanmistir:

Dil Whisper Small Whisper Large V3 Parakeet V3
Bulgarca 37.3 12.9 12.6
Hirvatca 33.4 11.1 12.5
Cekce 37.6 11.3 11.0
Danca 32.8 12.6 18.4
Felemenkce 16.4 5.6 7.5
Ingilizce 6.1 4.3 4.9
Estonca 51.3 19.1 17.7
Fince 24.0 7.7 13.2
Fransizca 15.0 6.3 5.2
Almanca 10.2 4.3 5.0
Yunanca 30.8 27.0 20.7
Macarca 38.9 14.1 15.7
Italyanca 9.8 2.3 3.0
Letonca 53.2 18.3 22.8
Litvanca 65.6 22.3 20.4
Maltaca 92.2 68.9 20.5
Lehce 14.7 4.7 7.3
Portekizce 7.3 3.7 4.8
Romence 29.8 8.2 12.4
Rusca 11.4 4.2 5.5
Slovakca 33.3 8.4 8.8
Slovence 49.3 19.9 24.0
Ispanyolca 5.6 3.1 3.5
Isvecce 20.8 7.9 15.1
Ukraynaca 19.3 6.5 6.8
Ortalama 29.8 12.6 12.0

WER (%) FLEURS uzerinde. Whisper Small verileri Radford ve ark.'ndan; Large V3 ve Parakeet V3 verileri NVIDIA Canary-1B-v2 makalesinden.

Whisper Large V3, cogu bireysel dilde biraz onde — sonucta 2,5 kat daha buyuk. Ama Parakeet V3, ortalamada ayni seviyeyi tutuyor (12,0% vs 12,6%), Yunanca, Fransizca, Estonca ve Maltacada kesin bir sekilde onde ve Whisper Small'i her alanda eziyor (ortalamada %60 daha az hata). Asil hikaye WER'de binde birlik bir fark degil — asil onemli olan toplam paket: Large V3 seviyesinde dogruluk 23 kat hizda, %40 bellek kullanimiyla, sifir halusinasyon ve her sey Mac'inde yerel olarak calisiyor.

Artik Halusinasyon Yok

Whisper'i dikte icin kullandiysan, sessizlikte halusinasyon yaptigini gormusundur — cumleler tekrarlanir, kelimeler uydurulur, ya da bir anda "Subtitles by Amara.org" cikiverir. Bunun nedeni Whisper'in otoregresif kod cozucusunun, cevrilecek bir sey olmasa bile her zaman metin uretmeyi beklemesi.

NVIDIA, Parakeet'i 36.000 saatlik saf konusma-disi seste (arka plan gurultusu, oksuruk, sessizlik) bos dize hedefleriyle egitti. Model sessizligin neye benzedigini ogrendi ve sessiz kaliyor. "Her zaman acik" sistem genelinde dikte icin bu bir devrim — dusunmek icin durdugunuzda artik cop metin belirmiyor.

Parakeet'in Destekledigi Diller

Parakeet v3, 25 dili destekliyor: Bulgarca, Hirvatca, Cekce, Danca, Felemenkce, Ingilizce, Estonca, Fince, Fransizca, Almanca, Yunanca, Macarca, Italyanca, Letonca, Litvanca, Maltaca, Lehce, Portekizce, Romence, Rusca, Slovakca, Slovence, Ispanyolca, Isvecce ve Ukraynaca.

Bu Avrupa'nin buyuk bolumunu kapsiyor, ama Cince, Japonca, Korece, Arapca veya Hintce desteklemiyor. Bu yuzden Whisper modellerini indirilebilir secenekler olarak tuttuk. Japonca veya Mandarin Cince dikte ediyorsan, model seciciden Whisper Large V3 Turbo'yu sec. Ingilizce ve Avrupa dilleri icin Parakeet v3 cok daha iyi bir motor.

Whisper Notes Mac model secici: Parakeet V3 varsayilan olarak gorunuyor, yaninda Whisper Small ve Whisper Large V3 Turbo indirilebilir secenekler olarak

Model secici: Parakeet V3 (varsayilan), Whisper Small ve Whisper Large V3 Turbo — hepsi yerel olarak calisiyor

Whisper Notes'ta Model Secici

Modeller arasinda gecis yapmak icin Ayarlar'i ac:

  • Parakeet V3 (varsayilan) — En hizli, Ingilizce ve Avrupa dilleri icin en iyi
  • Whisper Small — Hafif, 100+ dil
  • Whisper Large V3 Turbo — En dogru cok dilli model

Tum modeller Mac'inde %100 yerel olarak calisiyor. Internet yok, bulut yok, verin cihazindan cikmiyor.

Peki Parakeet V2?

V2 kullandıysanız, nasıl karşılaştırıldığını merak ediyor olabilirsiniz. V2 yalnızca İngilizce destekleyen bir modeldi — ve İngilizce doğruluğu aslında V3'ten biraz daha iyi (WER %6,05 vs %6,32). V3 bu küçük farkı 25 dil desteğiyle değiştiriyor. Her ikisi de Whisper'dan çok daha doğru.

Parakeet V2 Parakeet V3 Whisper Large V3
İngilizce WER 6.05% 6.32% 7.44%
Diller Yalnızca İngilizce 25 100+

Kısacası: yalnızca İngilizce gerekiyorsa V2 ve V3 ikisi de mükemmel. V3, Whisper Notes'ta varsayılan olarak ayarlanmıştır çünkü çok dilli destek çoğu kullanıcı için önemlidir — ve İngilizce doğruluk farkı ihmal edilebilir düzeydedir.

Dene

Parakeet v3 su an Mac surumunde mevcut — en son DMG'yi indirmen yeterli. (Güncelleme: Parakeet artık en yeni iOS sürümünde de kullanılabilir.)

Soru veya geri bildirim mi var? E-posta gonder: support@whispernotes.app.