النسخ السحابي ميت. لكنه لا يعرف ذلك بعد.
لقد كنت أملي على مدار العقد الماضي—رسائل البريد الإلكتروني، الملاحظات، المسودات الأولى لكل شيء. جربت كل خدمة كبيرة. وإليك ما تعلمته: اللحظة التي ينتقل فيها تحويل الكلام إلى نص من الخوادم الخارجية إلى جهازك الخاص، يتوقف عن كونه "ميزة" ويصبح امتداداً لطريقة تفكيرك.
هذا ليس كلام تسويقي. إنه تقرير عما تغير فعلاً.
Whisper Notes: نسخ احترافي بدون اتصال
زمن الاستجابة يغير السلوك، ليس السرعة فقط
التجربة المعتادة مع النسخ السحابي تسير هكذا: تتكلم، تنتظر، وبعد ثانيتين إلى خمس ثوانٍ يظهر النص. أحياناً أطول إذا تعثر الاتصال.
هذا التأخير يبدو صغيراً في العرض التوضيحي. في الاستخدام الفعلي، هو كل شيء. ثانيتان كافيتان لتفقد سلسلة أفكارك. كافيتان للتردد قبل بدء جملتك التالية. كافيتان لجعل الإملاء يبدو كعمل واعٍ بدلاً من مجرد... التحدث.
المعالجة المحلية—200 إلى 500 مللي ثانية—مختلفة. إنها سريعة بما يكفي لأن دماغك لا يسجلها كـ"انتظار". تتكلم والنص موجود. دماغك لا يعاملها كخطوة منفصلة.
اتضح أن هذا يغير سلوك الناس. بدلاً من حجز الإملاء لـ"المحتوى المُملى"—الرسائل الرسمية، المستندات الطويلة—يستخدمه الناس لكل شيء. الأفكار السريعة. أنصاف الأفكار. الفوضى التي تضيع عادة بين رأسك ولوحة المفاتيح.
مسألة الهندسة المعمارية
كل جهاز له قوة حوسبة مختلفة، لذا نشغل نماذج مختلفة على كل منها:
على Mac: Whisper Large-v3 Turbo—809 مليون معامل. إنه النموذج الكامل، وأجهزة Mac الحديثة تتعامل معه بشكل جيد.
على iPhone: نموذج أصغر محسن للأجهزة، مُعد للحدود الحرارية للهاتف المحمول والبطارية. الهواتف الأحدث تشغل إصدارات أكثر قدرة؛ الأجهزة الأقدم تحصل على نماذج أخف لا تسخن.
هذه المقايضة مقصودة. نموذج يسخن هاتفك أو يستنزف بطاريتك في ساعة سيعيق النسخ الوظيفي، بغض النظر عن مدى دقته.
دون اتصال بالكامل: استيراد الصوت والنسخ مباشرة
الخصوصية من خلال الغياب
معظم نقاشات الخصوصية تتعلق بالسياسات. من يمكنه الوصول إلى بياناتك؟ كم من الوقت يتم تخزينها؟ ما هي الشروط؟
الجواب الأقوى معماري: لا توجد بيانات للحماية.
عندما لا يغادر الصوت جهازك أبداً، لا يوجد سؤال مراقبة، لا خطر تسرب بيانات، لا إمكانية لإساءة استخدام من طرف ثالث. أنت لا تعتمد على سياسة شخص ما لا تتغير أو تُنفذ بشكل صحيح. لا شيء للتسريب لأنه لا شيء يُرسل.
هذا مهم بشكل خاص للأشخاص الذين ينسخون محادثات حساسة—قضايا قانونية، ملاحظات طبية، مصادر سرية. "لن نسيء استخدام بياناتك" أكثر هشاشة من "لم نمتلك بياناتك أبداً".
ما يفعله السحاب أفضل (حتى الآن)
يجب أن أكون صادقاً بشأن المقايضات. الخدمات السحابية لا تزال أفضل لـ:
- التحرير التعاوني—عدة أشخاص يعملون على نفس النسخ
- الصوت الطويل جداً—ساعات من التسجيل، حيث يصبح تسخين الجهاز عاملاً
- الأجهزة القديمة—أجهزة أقدم لا تستطيع تشغيل نماذج جيدة
- التكاملات المدمجة—اتصالات مباشرة مع Notion، Google Docs، إلخ.
إذا كانت متطلبات سير عملك تشمل أياً من هذه، فقد تكون الخدمات السحابية لا تزال الخيار الصحيح.
الدقة في الممارسة
Whisper Large-v3 Turbo مقارن بأفضل الخدمات السحابية للكلام الواضح. إذا كنت تتحدث بميكروفون معقول في بيئة هادئة بشكل معقول، لن ترى فرقاً كبيراً.
أين يعاني: المفردات المتخصصة. الأسماء الخاصة، مصطلحات المنتجات، المصطلحات الطبية/القانونية. النموذج يخمن خطأ ما لم تخبره ماذا يتوقع.
هذا قابل للحل. نسمح بتعليمات أولية—يمكنك إعطاء سياق موجز ("هذا إملاء طبي عن أمراض القلب") والنموذج يعطي الأولوية لتلك المصطلحات. بضع دقائق من الإعداد لمجالك توفر وقت تصحيح كبير لاحقاً.
الاقتصاد البسيط
الخدمات السحابية تفرض رسوماً متكررة لأن تكاليفها متكررة. كل دقيقة نسخ تكلف وقت خادم، تخزين، عرض نطاق.
المعالجة المحلية ليس لها تكلفة هامشية. قوة الحوسبة التي تستخدمها هي أجهزة تمتلكها بالفعل. لذا يمكن أن يكون نموذج التسعير لمرة واحدة.
لا "وصلت للحد"، لا تجديدات شهرية، لا قرارات سنوية لمواصلة الدفع. معاملة واحدة.
الميزات العملية المهمة
الميزات المحددة في Whisper Notes موجودة لأن أنماط الاستخدام الحقيقية تطلبتها:
أداة شاشة القفل
للأشخاص الذين يلتقطون الأفكار طوال اليوم، فتح قفل الهاتف ← فتح التطبيق ← النقر على تسجيل بطيء جداً. الأداة تتيح لك بدء التسجيل من شاشة القفل.
وصول فوري للتسجيل من شاشة القفل
التعليمات الأولية
أخبر النموذج مصطلحاتك. إذا كنت تنسخ إملاء طبي، أعطه ذلك السياق. إذا كان لديك اسم منتج يخمنه خطأ، أضفه. خمس دقائق إعداد، أسابيع من التصحيحات الموفرة.
قم بتكوين التعليمات الأولية لتحسين التعرف على المصطلحات
فقرات بطوابع زمنية
النسخ الطويلة صعبة التصفح. التقسيم التلقائي إلى فقرات، مع طوابع زمنية اختيارية، يجعل ساعات من التسجيلات قابلة للإشارة إليها. يمكنك النقر للانتقال إلى الصوت لأي جزء.
تنسيق احترافي للنسخ الطويلة
التصدير المجمع
إذا جمعت الكثير من التسجيلات، تحتاج طريقة لنقلها. صدّر كل شيء مرة واحدة—شهر من النسخ، ملاحظات المشروع، الأرشيفات.
إدارة وتصدير نسخ متعددة مرة واحدة
80+ لغة
نماذج Whisper مدربة على بيانات متعددة اللغات، لذا دعم اللغات مدمج. التطبيق يكتشف اللغة تلقائياً وينسخ وفقاً لذلك.
الجودة تختلف حسب اللغة—الإنجليزية، الإسبانية، الألمانية، الفرنسية، الماندرين، اليابانية تعمل الأفضل. اللغات الأقل تمثيلاً أقل دقة. لمعظم اللغات الرئيسية، الاستخدام اليومي ممتاز.
التفاصيل التقنية
Device requirements: iPhone 12+ (شريحة A14) أو Mac مع شريحة M-series.
Models: Parakeet V3 (103x الوقت الحقيقي، 6.32% WER للإنجليزية). SenseVoice Small (52x الوقت الحقيقي للصينية واليابانية والكورية والكانتونية). Whisper Large V3 Turbo (100+ لغة). الثلاثة تعمل محلياً على Mac.
Speed: Parakeet V3: 35 دقيقة صوت في 20 ثانية على M4 Pro. SenseVoice: 27 دقيقة بودكاست صيني في 14 ثانية. Whisper Turbo: 35 دقيقة في ~3 دقائق.
AI Editing: Gemma 4 على الجهاز يصحح علامات الترقيم، يزيل كلمات الحشو (أم، آه)، يولد العناوين، ويجيب على أسئلة حول النسخ.
Price: $6.99 مرة واحدة. نسخة تجريبية مجانية على Mac. بدون اشتراك لأننا لا نشغل خوادم.
الأسئلة الشائعة
هل يمكن النسخ بدون اتصال بالإنترنت؟
نعم. Whisper Notes هو برنامج نسخ يعمل بالكامل على جهازك دون اتصال. جميع نماذج الذكاء الاصطناعي الثلاثة — Parakeet V3 و SenseVoice و Whisper — تعالج الصوت محلياً باستخدام Neural Engine في Mac أو شريحة A-series في iPhone. لا يتم تحميل أي بيانات ولا الاتصال بأي خادم. يمكنك اختبار ذلك بتفعيل وضع الطيران.
هل يعمل OpenAI Whisper بدون إنترنت؟
نعم. أصدرت OpenAI نموذج Whisper كمصدر مفتوح، مما يعني أنه يمكن تشغيله محلياً على جهازك. Whisper Notes يحزم Whisper Large V3 Turbo للعمل على Apple Silicon عبر CoreML/Metal — بدون Python أو سطر أوامر أو إنترنت. يدعم التعرف على الكلام بدون اتصال بأكثر من 100 لغة.
هل Whisper Notes متاح لنظام Windows أو Android؟
ليس بعد. يدعم Whisper Notes حالياً Mac (M-series) و iPhone (12+). لنظام Windows، تشمل البدائل faster-whisper (سطر الأوامر) أو Buzz (واجهة رسومية). قد ندعم منصات أخرى مستقبلاً، لكن Neural Engine في Apple Silicon يوفر أفضل تجربة تحويل كلام إلى نص محلية لمستخدمي Mac.
هل يوجد تطبيق نسخ مجاني يعمل بدون اتصال؟
يقدم Whisper Notes نسخة تجريبية مجانية على Mac — حمّل ملف DMG وجربه بدون حد زمني. الشراء الكامل هو $6.99 مرة واحدة (بدون اشتراك). للمقارنة، خدمات النسخ السحابية مثل Otter.ai تكلف $10-20/شهرياً. خلال ثلاث سنوات، هذا يعني $360-720 مقابل $6.99 مرة واحدة.
كيف يقارن Whisper Notes مع MacWhisper أو faster-whisper؟
MacWhisper هو واجهة Whisper لنظام Mac فقط. faster-whisper هو أداة سطر أوامر. Whisper Notes يتضمن ثلاثة نماذج (Parakeet V3, SenseVoice, Whisper)، يدعم Mac و iPhone، يوفر إملاء على مستوى النظام بمفتاح Fn، أدوات شاشة القفل، تحرير AI على الجهاز، وتصدير مجمع — كل ذلك بسعر شراء واحد $6.99.