Typeless বিকল্প: Fn চাপুন, বলুন। আপনার ভয়েস আপনার ডিভাইসেই থাকে।

Typeless আপনার ভয়েস ক্লাউড সার্ভারে আপলোড করে এবং $30/মাস নেয়। Whisper Notes Neural Engine-এ চলে, $4.99 শুধু একবার।

Whisper Notes Fn key ভয়েস ইনপুট সেটআপ ইন্টারফেস - Fn key শর্টকাট ফাংশনালিটি টেস্ট

Typeless এবং Whisper Notes একই সমস্যা সমাধান করে: Fn চাপুন, বলুন, ছাড়ুন, টেক্সট কার্সরে চলে আসে।

পার্থক্যটা আর্কিটেকচারে।

Typeless: ভয়েস → ইন্টারনেট → ক্লাউড LLM → ইন্টারনেট → টেক্সট ($30/মাস)

Whisper Notes: ভয়েস → Neural Engine → টেক্সট ($4.99 একবার)

আমার Typeless পছন্দ, কিন্তু…

Typeless একটি চমৎকার প্রোডাক্ট। আমি কয়েক মাস ব্যবহার করেছি, এবং অভিজ্ঞতা খুবই মসৃণ—নির্ভুল রিকগনিশন, এবং LLM পলিশ ক্যাজুয়াল কমিউনিকেশনকে পরিষ্কার ও পেশাদার করে তোলে। Fn চাপুন, বলুন, ছাড়ুন, এবং এটি স্বয়ংক্রিয়ভাবে "আ" এবং "উম" সরিয়ে দেয়, পাঠানোর জন্য তৈরি টেক্সট দেয়। এই নিরবচ্ছিন্ন অভিজ্ঞতা সত্যিই দারুণ।

কিন্তু ব্যবহারের সময় আমি তিনটি সমস্যা খুঁজে পেলাম যা উপেক্ষা করা সম্ভব নয়:

1. ভয়েস আপলোড ডিলিট করা যায় না

প্রতিবার আপনি Fn চাপলে, আপনার ভয়েস ক্লাউড সার্ভারে যায়। Typeless জিরো ডেটা রিটেনশনের দাবি করে, কিন্তু এটি পলিসির প্রতিশ্রুতি, আর্কিটেকচারাল গ্যারান্টি নয়। আইনি নোট, মেডিকেল রেকর্ড, গোপনীয় ব্যবসায়িক আইডিয়া—যেকোনো পরিস্থিতি যেখানে সম্পূর্ণ প্রাইভেসি প্রয়োজন—ক্লাউড আপলোড গ্রহণযোগ্য নয়।

Whisper Notes আপনার Mac-এর Neural Engine বা iPhone চিপে OpenAI-এর Whisper large-v3-turbo লোকালি চালায়। অডিও কখনো আপনার ডিভাইস ছেড়ে যায় না। এটি পলিসি নয়—এটি ফিজিক্যাল রিয়ালিটি।

2. ধীর গতি—ASR-এর পর LLM প্রসেসিংয়ের জন্য অপেক্ষা

Typeless-এর ওয়ার্কফ্লো: স্পিচ রিকগনিশন (ASR) → ক্লাউডে আপলোড → LLM পলিশ → টেক্সট ফেরত। এই প্রক্রিয়ায় সময় লাগে।

20 সেকেন্ড ভয়েস ইনপুট (M4 Pro) প্রসেসিং টাইম
Typeless 7-10 সেকেন্ড
Whisper Notes 2.5 সেকেন্ড

Whisper Notes সরাসরি Neural Engine-এ ট্রান্সক্রাইব করে, প্রায় 10-12x রিয়েল-টাইম স্পিডে। কোনো নেটওয়ার্ক লেটেন্সি নেই। কোনো সার্ভার কিউ নেই। 60 সেকেন্ডের রেকর্ডিং প্রায় 5 সেকেন্ডে শেষ হয়।

ট্রেড-অফ: Typeless ধীর কিন্তু পলিশড টেক্সট দেয়; Whisper Notes দ্রুত কিন্তু হুবহু শব্দানুবাদ।

3. $30/মাস সাবস্ক্রিপশন

ব্যবহারের সময়কাল Typeless Whisper Notes
প্রথম বছর $360 $4.99
তৃতীয় বছর $1,080 $4.99
পঞ্চম বছর $1,800 $4.99

Typeless ক্লাউড ইনফ্রাস্ট্রাকচার পরিচালনা করে—সার্ভার, থার্ড-পার্টি LLM API—যার খরচ ক্রমাগত আসে। সাবস্ক্রিপশন সেই ইনফ্রাস্ট্রাকচারের অর্থায়ন করে। ক্লাউড সার্ভিসের জন্য এটি যুক্তিসঙ্গত মূল্য নির্ধারণ।

Whisper Notes-এর কোনো ক্লাউড ব্যাকএন্ড নেই। কম্পিউটেশন আপনার হার্ডওয়্যারে হয়, আপনার বিদ্যুতে। কোনো রিকারিং খরচ নেই মানে কোনো রিকারিং ফি নেই। সফটওয়্যার যা আপনার নিজের ডিভাইসে চলে, ওপেন-সোর্স মডেল (Whisper) ব্যবহার করে—এটি ভাড়া নেওয়ার বদলে কেনা উচিত নয় কি?

Fn Key ডিক্টেশনের বাইরে

দুটি অ্যাপই Fn key সিস্টেম-ওয়াইড ডিক্টেশন সাপোর্ট করে। এটি মূল ফিচার।

Whisper Notes এর বাইরেও দেয়:

অডিও ফাইল ইমপোর্ট: আগে থেকে রেকর্ড করা অডিও বা ভিডিও ফাইল ড্র্যাগ করুন। ইন্টারভিউ, মিটিং, লেকচার—যেকোনো কিছু যা আগেই ক্যাপচার করা হয়েছে, ট্রান্সক্রাইব করুন। Typeless শুধু লাইভ ডিক্টেশনে ফোকাস করে।

মডেল ফ্লেক্সিবিলিটি: বর্তমানে Whisper large-v3-turbo চালায়। ভবিষ্যত আপডেটে অতিরিক্ত মডেল (Parakeet, Gemini-ভিত্তিক স্পিচ মডেল) সাপোর্ট আসতে পারে। Typeless প্রোপ্রাইটারি ক্লাউড LLM ব্যবহার করে।

এক্সপোর্ট ফরম্যাট: Text, SRT, VTT, JSON। আপনার যদি সাবটাইটেল বা স্ট্রাকচার্ড ডেটা দরকার হয়, Whisper Notes সামলে নেয়। Typeless কার্সরে টেক্সট ইনসার্শনের জন্য অপটিমাইজ করে।

আপনার ওয়ার্কফ্লো যদি শুধু মেসেজ ও ইমেইলের জন্য লাইভ ডিক্টেশন হয়, দুটি অ্যাপই কাজ করে। আপনার যদি ব্যাচ ট্রান্সক্রিপশন, সাবটাইটেল জেনারেশন, বা মডেল চয়েস দরকার, Whisper Notes বেশি ইউজ কেস কভার করে।

Whisper Notes অ্যাপ ইন্টারফেস - Fn key ডিক্টেশন এবং অডিও ফাইল ট্রান্সক্রিপশন ফিচার

Typeless কখন সঠিক পছন্দ

Typeless-এর কিছু প্রকৃত শক্তি আছে যা নির্দিষ্ট ব্যবহারকারীদের জন্য এটিকে ভালো পছন্দ করে তোলে:

পলিশড ক্যাজুয়াল কমিউনিকেশন: আপনার প্রধান ব্যবহার যদি Slack মেসেজ এবং দ্রুত ইমেইল হয়, Typeless-এর LLM ক্লিনআপ উল্লেখযোগ্যভাবে পরিষ্কার আউটপুট দেয়। এটি স্বয়ংক্রিয়ভাবে ফিলার শব্দ সরিয়ে দেয়। যারা শব্দানুবাদ সঠিকতার চেয়ে পলিশকে বেশি গুরুত্ব দেন, তাদের জন্য এটি সত্যিকারের সুবিধা।

Windows সাপোর্ট: Whisper Notes শুধু Mac/iOS-এ পাওয়া যায়। আপনি Windows-এ কাজ করলে, Typeless সেই কয়েকটি উচ্চ-মানের অপশনের একটি যা দুটি প্ল্যাটফর্মই কভার করে।

Context-Aware ফরম্যাটিং: Typeless টার্গেট অ্যাপ্লিকেশন অনুযায়ী টোন ও স্ট্রাকচার অ্যাডজাস্ট করে। Slack-এ ক্যাজুয়াল ফরম্যাটিং; Gmail-এ প্রফেশনাল ফরম্যাটিং। এটি উন্নত সফটওয়্যার ইঞ্জিনিয়ারিং।

ফ্রি টিয়ার: Typeless প্রতি সপ্তাহে 4,000 শব্দ বিনামূল্যে দেয়। হালকা ব্যবহারকারী হলে ফ্রি টিয়ারই যথেষ্ট হতে পারে। Whisper Notes-এর প্রাথমিক মূল্য $4.99 (খুবই কম, কিন্তু বিনামূল্যে নয়)।

আপনি ক্লাউড প্রসেসিংয়ে বিশ্বাস করলে, AI পলিশড আউটপুট চাইলে, এবং ক্রস-প্ল্যাটফর্মে কাজ করলে, Typeless ভালোভাবে তৈরি সফটওয়্যার। এটি নিম্নমানের নয়; এটি আর্কিটেকচারালভাবে ভিন্ন।

ভবিষ্যত পরিকল্পনা: লোকাল LLM পলিশ

আমরা ঐচ্ছিক লোকাল LLM পোস্ট-প্রসেসিং যোগ করার কথা ভাবছি—লোকাল ASR → লোকাল LLM পলিশ। ডিভাইসে মডেল (যেমন Llama বা Mistral) ব্যবহার করে, আপনি প্রাইভেসি বজায় রেখেই পলিশড ক্যাজুয়াল স্পিচ পেতে পারবেন। ভয়েস বা টেক্সট কিছুই আপলোড হবে না। এটি দুই জগতের সেরা সংমিশ্রণ হবে: পলিশড আউটপুট + আর্কিটেকচারাল প্রাইভেসি গ্যারান্টি।

যে ট্রেড-অফ আমরা সৎভাবে মেনে নিই

Whisper Notes আপনার কথা পরিষ্কার করে না। আপনি বারবার "আ" এবং "উম" বললে, ট্রান্সক্রিপ্টে সেগুলো থাকবে। এটি হুবহু শব্দানুবাদ।

পেশাদার ডকুমেন্টেশনের জন্য—আইনি সাক্ষ্য, মেডিকেল নোট, সাংবাদিকতার ইন্টারভিউ—শব্দানুবাদই একমাত্র গ্রহণযোগ্য পদ্ধতি। যা বলা হয়েছে তা ট্রান্সক্রিপ্টে হুবহু থাকতে হবে।

ক্যাজুয়াল যোগাযোগের জন্য, শব্দানুবাদ কিছুটা অমসৃণ লাগতে পারে। আপনি যদি বলেন "তো, উম, মানে, আমি মনে করি আমাদের, আ, হয়তো এটা চেষ্টা করা উচিত," ঠিক তাই পাবেন। Typeless এটিকে "আমি মনে করি আমাদের এটা চেষ্টা করা উচিত" তে পরিণত করত।

ভবিষ্যত বিবেচনা: আমরা ঐচ্ছিক লোকাল LLM পোস্ট-প্রসেসিং (অন-ডিভাইস, Llama বা Mistral-এর মতো মডেল) যোগ করতে পারি সেই ব্যবহারকারীদের জন্য যারা ক্লাউড আপলোড ছাড়া ক্লিনআপ চান। এটি প্রাইভেসি বজায় রেখে পলিশ যোগ করবে। কিন্তু এখনো বাস্তবায়িত হয়নি।

বর্তমান বাস্তবতা: পলিশড ক্যাজুয়াল আউটপুট চাইলে Typeless ভালো UX দেয়। শব্দানুবাদ সঠিকতা চাইলে বা ক্লাউড আপলোড না চাইলে, Whisper Notes যুক্তিসঙ্গত পছন্দ।

আমরা প্রাইভেসি ও গতি অপটিমাইজ করতে বেছে নিয়েছি। এর মানে ক্যাজুয়াল ব্যবহারে কম পলিশড আউটপুট মেনে নেওয়া। সৎ কৌশল: আমরা সুবিধার বদলে ডেটা সার্বভৌমত্ব বেছে নিই।

সাধারণ প্রশ্নাবলী

Typeless কি অফলাইনে কাজ করে?

না। Typeless-এর সমস্ত প্রসেসিংয়ের জন্য ইন্টারনেট দরকার। Whisper Notes এয়ারপ্লেন মোডেও কাজ করে কারণ Whisper মডেল Neural Engine-এ লোকালি চলে।

Whisper Notes-এ কি আমার ভয়েস সত্যিই প্রাইভেট থাকে?

আপনার অডিও কখনো আপনার ডিভাইস ছেড়ে যায় না। এটি কোনো পলিসির প্রতিশ্রুতি নয়—এটি আর্কিটেকচারাল বাস্তবতা। Whisper মডেল আপনার Mac-এর Neural Engine বা iPhone চিপে জিরো নেটওয়ার্ক রিকোয়েস্টে চলে। Typeless প্রতিবার আপনি বলার সময় অডিও ক্লাউড সার্ভারে পাঠায়।

Typeless $30/মাস কেন, আর Whisper Notes $4.99 একবার কেন?

Typeless ক্লাউড ইনফ্রাস্ট্রাকচার চালায়—সার্ভার, থার্ড-পার্টি LLM API—যার খরচ ক্রমাগত আসে। সাবস্ক্রিপশন সেই ইনফ্রাস্ট্রাকচারের অর্থায়ন করে। Whisper Notes-এর কোনো ক্লাউড ব্যাকএন্ড নেই। প্রসেসিং আপনার হার্ডওয়্যারে আপনার বিদ্যুতে চলে। কোনো রিকারিং খরচ নেই মানে কোনো রিকারিং ফি নেই।

Whisper Notes কি Typeless-এর মতো ফিলার শব্দ পরিষ্কার করে?

না। Whisper Notes হুবহু শব্দানুবাদ দেয়। আপনি 'উম' এবং 'আ' বললে, ট্রান্সক্রিপ্টে সেগুলো থাকবে। Typeless ক্লাউড LLM দিয়ে ফিলার শব্দ সরায় এবং আউটপুট পলিশ করে। এতে পরিষ্কার ক্যাজুয়াল টেক্সট পাওয়া যায়, কিন্তু আউটপুট আপনি ঠিক যা বলেছেন তা নাও হতে পারে। আইনি, মেডিকেল বা সাংবাদিকতার কাজে, যেখানে সঠিক ডকুমেন্টেশন আবশ্যক, শব্দানুবাদই একমাত্র গ্রহণযোগ্য পদ্ধতি।

কোনটা দ্রুত, Typeless না Whisper Notes?

Whisper Notes ডিজাইন অনুযায়ী দ্রুত। এটি আপনার Neural Engine-এ চলে, কোনো নেটওয়ার্ক লেটেন্সি নেই। M-Series Mac-এ, ট্রান্সক্রিপশন প্রায় 10-12x রিয়েল-টাইম স্পিডে হয়। Typeless-এ ইন্টারনেট রাউন্ড-ট্রিপ সময় এবং ক্লাউড LLM প্রসেসিং যোগ হয়। ট্রেড-অফ: Whisper Notes দ্রুত কিন্তু হুবহু শব্দানুবাদ দেয়; Typeless ধীর কিন্তু টেক্সট পলিশ করে।

Whisper Notes কি ভয়েস মেমো বা মিটিং রেকর্ডিংয়ের মতো অডিও ফাইল ইমপোর্ট করতে পারে?

হ্যাঁ। Whisper Notes আগে থেকে রেকর্ড করা অডিও ও ভিডিও ফাইল ইমপোর্ট করে। ইন্টারভিউ, মিটিং, লেকচার—যেকোনো কিছু যা আগেই ক্যাপচার করা হয়েছে, ড্র্যাগ করুন। Typeless শুধু লাইভ Fn key ডিক্টেশনে ফোকাস করে এবং বিদ্যমান ফাইলের ব্যাচ ট্রান্সক্রিপশন সাপোর্ট করে না।

Whisper Notes কি Windows-এ কাজ করে?

না। Whisper Notes শুধু Mac এবং iOS-এ পাওয়া যায় (Apple Silicon অপটিমাইজেশন)। Windows সাপোর্ট দরকার হলে, Typeless সেই অপশনগুলোর একটি যা Mac ও Windows উভয়ই কভার করে।

Whisper Notes কি ক্যাজুয়াল স্পিচের জন্য LLM ক্লিনআপ যোগ করবে?

সম্ভবত। আমরা ঐচ্ছিক লোকাল LLM পোস্ট-প্রসেসিং (অন-ডিভাইস মডেল যেমন Llama বা Mistral) বিবেচনা করছি সেই ব্যবহারকারীদের জন্য যারা ক্লাউড আপলোড ছাড়া ক্লিনআপ চান। এটি প্রাইভেসি বজায় রেখে পলিশ যোগ করবে। কিন্তু এখনো বাস্তবায়িত হয়নি। বর্তমান বাস্তবতা: Whisper Notes শুধু হুবহু শব্দানুবাদ দেয়।

লোকাল প্রসেসিং ব্যবহার করে দেখুন

$4.99 একবার। Fn চাপুন, বলুন, ছাড়ুন। আপনার ভয়েস কখনো আপলোড হয় না। কোনো সাবস্ক্রিপশন নেই। কোনো ক্লাউড সার্ভার নেই।