Whisper Notes hiện hỗ trợ Whisper Large-v3 Turbo. Độ chính xác phiên âm giống nhau, nhanh hơn 5×. Hiện có sẵn trên Mac với Apple Silicon.
Điểm khác biệt
1. Nhanh hơn 5×
Turbo xử lý âm thanh nhanh gấp năm lần so với mô hình Whisper tiêu chuẩn. Trên thực tế:
- •iPhone 15 Pro: 10 phút âm thanh được phiên âm trong ~82 giây (trước đây là 425)
- •MacBook M2: 10 phút trong ~63 giây (trước đây là 316)
- •Tiết kiệm pin 60%
2. Độ chính xác giống nhau
Turbo không hy sinh chất lượng để đổi lấy tốc độ:
- •Độ chính xác giống hệt mô hình tiêu chuẩn
- •Độ chính xác dấu thời gian giống nhau
- •Hỗ trợ tất cả 100+ ngôn ngữ—nhận diện ngôn ngữ tự động hoạt động giống nhau
3. Vẫn 100% ngoại tuyến
Turbo chạy trên thiết bị của bạn giống như mô hình tiêu chuẩn:
- •Mọi thứ được xử lý cục bộ—âm thanh của bạn không bao giờ rời khỏi thiết bị
- •Không có giao tiếp máy chủ
- •Hoạt động hoàn toàn ngoại tuyến
Yêu cầu thiết bị
Hiện tại, Whisper Large-v3 Turbo có sẵn trên Mac với Apple Silicon (M1/M2/M3/M4 hoặc mới hơn).
Chúng tôi đang theo dõi chặt chẽ các bản cập nhật mô hình trong tương lai để hỗ trợ iPhone và iPad. Khi các mô hình AI trở nên hiệu quả hơn, chúng tôi hy vọng sẽ đưa Turbo đến các thiết bị di động.
Tại sao có giới hạn? Whisper Notes hoàn toàn ngoại tuyến—người dùng không thể tải xuống mô hình sau khi cài đặt ứng dụng. Điều này có nghĩa là chúng tôi cung cấp một mô hình phải cân bằng hiệu suất trên các thiết bị chính thống trong khi vẫn duy trì độ chính xác. Chúng tôi cam kết tìm ra sự cân bằng phù hợp giữa tốc độ và độ chính xác.
So sánh: Thời gian xử lý 10 phút âm thanh
| Thiết bị | Whisper Standard | Whisper Large-v3 Turbo | Cải thiện |
|---|---|---|---|
| iPhone 15 Pro | 425 seconds | 82 seconds | Nhanh hơn 5.2× |
| iPad Pro M2 | 380 seconds | 71 seconds | Nhanh hơn 5.4× |
| MacBook Pro M2 | 316 seconds | 63 seconds | Nhanh hơn 5.0× |
10 phút âm thanh hiện được phiên âm trong khoảng một phút trên phần cứng mới. Độ chính xác giống nhau, nhanh hơn nhiều.
Phiên bản Mac
Mac Whisper Notes sử dụng mô hình Turbo trên Mac Apple Silicon. Chip dòng M xử lý tốc độ xử lý nhanh hơn rất tốt—tốc độ phiên âm khớp với các con số trên.