Mac icin cevrimdisi toplanti transkripsiyonu yaptik. Zoom, Teams ve Google Meet gorusmelerini kaydeder, Parakeet V3 ile yerel olarak transkribe eder ve Gemma 4 ile ozetler. Bulut yok, gorusmede bot yok. Tek seferlik $6.99.
Whisper Notes'ta bir Zoom gorusmesi kaydetme — "Ben" ve "Digerleri" ses kaynagina gore etiketlenir
Tipik Bir Pazartesi
Sabah 10, bir musteriye Zoom gorusmesi. Whisper Notes'u aciyorsunuz, kaydet'e tikliyorsunuz. Uygulama sistem sesini ve mikrofonunuzu ayni anda yakaliyor — toplantida kimse bir bot gormuyor, kimse bildirim almiyor, katilimci listesinde hicbir sey gorulmuyor.
Bir saat sonra gorusme bitiyor. Kaydi durduruyorsunuz. Parakeet V3, 60 dakikalik sesi yaklasik bir dakikada transkribe ediyor, tamamen Mac'inizin Neural Engine'inde. Ozetle'ye tikliyorsunuz — Gemma 4 temel noktalari cikariyor. Gorevler'e tikliyorsunuz — bahsedilen her gorevi ve son tarihi cikariyor. Toplanti notlarini musteriye gonderiyorsunuz. Ses bilgisayarinizdan hic cikmadi.
Is akisi bu kadar. Kaydet, transkribe et, ozetle. Hepsi yerel.
Ne Yapar
Kayit
Whisper Notes sistem sesini yakalar — hoparlor veya kulaklaginizdan gelen ses. Mac'inizde duyabiliyorsaniz, transkribe edebiliriz. Zoom, Teams, Google Meet, Webex, GoTo, Whereby, Jitsi, YouTube, podcastler veya baska herhangi bir uygulama. Ayni zamanda mikrofonunuzu da kaydeder, boylece konusmanin her iki tarafi yakalanir.
Gorusmeye hicbir bot katilmaz. Bu, kulaga geldiginden daha onemli. Bir Zoom gorusmesinde "Otter.ai Notetaker has joined the meeting" yazisinin ciktigini gorduyseniz, sonra ne oldugunu biliyorsunuz — birisi bunun ne oldugunu sorar, baskasi rahatsiz olur ve konusma degisir. Sistem sesi yakalama ile kayit yaptiginizi sizden baska kimse bilmez.
Transkripsiyon
Parakeet V3, CoreML araciligiyla Apple Silicon uzerinde calisir. Ingilizce ve 24 Avrupa dilini yaklasik 60× gercek zamanda isler — 60 dakikalik bir toplanti yaklasik bir dakikada biter. Cince, Japonca veya Korece icin SenseVoice, CJK'yi 52× hizda isler. Pyannote VAD, transkripsiyondan once sessizligi temizler, boylece model yalnizca gercek konusmayi isler.
Zaman damgalari ve satir ici duzenleme ile transkript — herhangi bir segmente tiklayarak sesteki o ana atlayin
AI Ozellikleri — Hepsi Yerel
Gemma 4 Mac'inizde calisir. API anahtari yok, bulut cagrisi yok, kullanim siniri yok. Transkripsiyondan sonra:
- •Ozetle — 60 dakikalik toplantinin ana noktalari, saniyeler icinde
- •Gorevler — gorevler ve son tarihler, otomatik olarak cikarilir
- •Ceviri — Apple Intelligence transkripti baska bir dile cevirir
- •Sohbet — "fiyatlandirma konusunda ne kararlastirdik?" diye sorun ve transkripte dayali bir cevap alin
Gemma 4 AI yan paneli — Ozetle, Gorevler, Ceviri ve serbest sohbet, hepsi yerel olarak calisiyor
Neden Boyle Yaptik
Toplanti sesi, bir sirketin urettigi en hassas verilerden biridir. Musteri muzakereleri, IK degerlendirmeleri, yonetim kurulu tartismalari, hukuki danismanliklar — yanlis bir sizintinin kariyerleri bitirdigi tur konusmalar.
Cogu transkripsiyon araci bu sesi bulut sunucularina yukler, orada isler ve kendi veri saklama politikalarina gore depolar. Bazilari gorusmeye herkesin gorebilecegi bir bot ekler. Bazilari kayitlarinizi "model iyilestirme" icin suresiz saklar.
Biz farkli bir yaklasim sectik: her sey Mac'inizde calisir. ASR modeli, LLM, ses depolama — hepsi yerel. Ihmal edilecek sunucu yok, okunacak veri saklama politikasi yok, ucuncu taraf celp riski yok. GDPR, HIPAA veya avukat-muvekkil ayricaligi altindaki ekipler icin bu mimari amacin kendisidir.
Karsilastirma
| Whisper Notes | Otter.ai | Fireflies | Jamie | |
|---|---|---|---|---|
| Isleme | %100 cihaz uzerinde | Bulut | Bulut | Hibrit |
| Gorusmede bot | Hayir | Evet | Evet | Hayir |
| Fiyat | Tek seferlik $6.99 | $16.99/ay (Pro) | $18/ay'dan | $24/ay |
| Cevrimdisi calisir | Evet | Hayir | Hayir | Kismi |
| AI ozet | Yerel (Gemma 4) | Bulut | Bulut | Bulut |
| Konusmaci ayrimi | Henuz yok | Evet | Evet | Evet |
Farkli Toplantilar, Farkli Diller
Toplanti dilinize uygun modeli secin:
| Ingilizce / Avrupa dilleri | Parakeet V3 — ~60× gercek zaman, 6.32% WER, sessizlikte sifir halusinasyon |
| Cince / Japonca / Korece | SenseVoice — 52× hiz, Kantonca destegi, MLX ile GPU hizlandirmasi |
| Diger diller | Whisper Large V3 Turbo — 99 dil, yuksek dogruluk, daha yavas |
Neleri Eksik
Henuz konusmaci ayrimiz yok. Su anda Whisper Notes sesi "Ben" (mikrofonunuz) ve "Digerleri" (sistem sesi) olarak etiketler — bu cogu bire bir ve kucuk grup toplantisini karsalar. Ancak kimin ne soyledigini bilmeniz gereken 10 kisilik bir gorusmede bu yeterli degil.
Bu acik bir sonraki adim ve uzerinde calisiyoruz. Hedef, Parakeet V3 ve SenseVoice ile birlikte calisan, sesi hicbir yere gondermeyen yerel konusmaci ayrimidir.