Offline Transkripcija
Zašto konačno funkcionira
Godinama je lokalna transkripcija značila sporije i lošije. To se promijenilo.

Malo konteksta
Prije nekoliko godina, ako ste htjeli točnu transkripciju, morali ste prenijeti audio na nečiji server. Lokalne opcije su postojale, ali bile su primjetno lošije. Kompromis je bio stvaran.
Onda se dogodilo nekoliko stvari. OpenAI je objavio Whisper kao otvoreni model. Apple je počeo isporučivati čipove s namjenskim AI hardverom. Odjednom su isti modeli koji su pokretali cloud usluge mogli raditi na laptopu.
Počeli smo graditi Whisper Notes otprilike u to vrijeme, uglavnom zato što smo ga sami trebali. Ispostavilo se da je mnogo ljudi tražilo isto.
Što se promijenilo
Tri stvari su nekad činile cloud transkripciju očitim izborom. Sve tri su se pomaknule.
Računalna snaga
AI modeli koji rade transkripciju su veliki—stotine milijuna parametara. Pokretanje je nekad bilo sporo i trošilo bateriju na potrošačkom hardveru.
Appleov Neural Engine je to promijenio. To je namjenski čip za AI zadatke, i nalazi se u svakom Macu M serije i novom iPhoneu. Whisper Large v3 Turbo sada ugodno radi na MacBook Airu.
Na telefonima koristimo manje modele optimizirane za mobilne čipove. Nisu toliko točni kao veliki model, ali su još uvijek bolji od većine ugrađenog diktata.
Točnost
Ovo nas je iznenadilo. Očekivali smo da će lokalni modeli biti "dovoljno dobri". Zapravo su prilično dobri.
Whisper Large v3 ima niže stope pogrešaka riječi od većine sistemskog diktata. I razlika između lokalnih i cloud API-ja postala je prilično mala. Za većinu slučajeva uporabe, vjerojatno nećete primijetiti razliku.
To mijenja kalkulaciju. Ako je točnost usporediva, glavni razlog za prijenos audija nestaje.
Privatnost
Nismo ovdje da vas plašimo cloud uslugama. Većina ih odgovorno rukuje podacima.
Ali postoji razlika između "obećavaju da neće zloupotrijebiti" i "nikad to nisu imali". Vaš glas je biometrijski podatak—za razliku od lozinke, ne možete ga promijeniti ako nešto pođe po zlu.
S lokalnom transkripcijom, vaš audio ostaje na vašem uređaju. Ne šifrirano-pa-preneseno. Jednostavno... ostaje. Za neke ljude to puno znači. Za druge, možda ne. Gradili smo za prvu grupu.
Kada koristiti što
Lokalno nije uvijek pravi izbor. Evo kako razmišljamo o tome.
Trebate suradnju u stvarnom vremenu?
Cloud alati poput Ottera su za to napravljeni. Više ljudi koji uređuju istu transkripciju treba centralni server. To je dobra uporaba clouda.
Koristite Windows ili Android?
Lokalni AI je teži na tim platformama—hardverska podrška nije tako zrela. Dragon radi za Windows. Na Androidu su cloud usluge obično praktičan izbor.
Trebate znati tko je što rekao?
Identifikacija govornika (dijarizacija) zahtijeva dodatne modele. Cloud usluge poput Reva to dobro rješavaju. Lokalni alati sustižu, ali to je još uvijek područje gdje cloud ima prednost.
Samo trebate privatnu, točnu transkripciju?
Na to smo se fokusirali. Ako su vam glavne brige privatnost i točnost, i koristite Apple hardver, lokalno sada dobro radi.
Što radi Whisper Notes
Pokreće Whisper Large v3 Turbo na vašem Macu, ili manji optimizirani model na vašem iPhoneu. Vaš audio nikad ne napušta uređaj.
Na Macu, transkripcija radi otprilike 10-15 puta brže od stvarnog vremena koristeći Neural Engine. Snimka od sat vremena traje nekoliko minuta. Na iPhoneu je sporije, ali još uvijek praktično za većinu snimaka.
$4.99 jednom, za obje platforme. Ne vodimo servere, pa ne trebamo pretplate. To je to.
Ukratko
Lokalna transkripcija je nekad bila kompromis. Sada je razuman zadani izbor za mnogo ljudi.
Ako trebate suradnju ili radite na platformama koje nisu Apple, cloud usluge još uvijek imaju smisla. Ako uglavnom želite točnu, privatnu transkripciju na Macu ili iPhoneu, lokalna opcija je postala prilično dobra.
Sami koristimo Whisper Notes svaki dan. Radi ono što nam je trebalo.
Isprobajte
Možete testirati u zrakoplovnom načinu ako želite provjeriti da se ništa ne prenosi. Sve radi jednako.
App Store • $4.99 • Mac i iPhone
Jedna kupnja pokriva obje platforme.