جوجل تدخل مضمار تطبيقات التدوين الصوتي الذكية
في خطوة هادئة تعكس استراتيجيتها لتعزيز أدوات الإنتاجية الشخصية، أطلقت شركة جوجل تطبيقًا جديدًا مخصصًا لنظام iOS تحت اسم “Google AI Edge Eloquent”. يهدف التطبيق إلى منافسة لاعبين صاعدين في هذا المجال مثل Wispr Flow وSuperWhisper، من خلال تقديم تجربة تدوين صوتي تعتمد كليًا على الذكاء الاصطناعي ومعالجة البيانات محليًا على الجهاز.
تحويل الكلام إلى نصوص احترافية عبر نماذج Gemma
يعتمد التطبيق على نماذج Gemma الخاصة بجوجل للتعرف التلقائي على الكلام (ASR). وما يميز Eloquent عن تطبيقات الإملاء التقليدية هو قدرته على فهم المعنى المقصود وليس مجرد كتابة الكلمات حرفيًا. يقوم التطبيق تلقائيًا بتنقية النصوص من “كلمات الحشو” مثل (um) و(ah)، وتصحيح الجمل المتعثرة ليخرج النص النهائي بأسلوب مهني دقيق وجاهز للنشر.
يوفر التطبيق خيارات متعددة لتعديل صياغة النص بعد نسخه، وتشمل:
- النقاط الرئيسية (Key points): لتلخيص الحديث في نقاط محددة.
- الأسلوب الرسمي (Formal): لتحويل الكلام العفوي إلى لغة أعمال رصينة.
- القصير والطويل: للتحكم في حجم النص بناءً على الغرض منه.
الخصوصية والعمل دون اتصال بالإنترنت
يركز Google AI Edge Eloquent بشكل أساسي على الخصوصية؛ حيث يمكن للمستخدمين تفعيل وضع المعالجة المحلية بالكامل، مما يضمن عدم خروج البيانات الصوتية من الجهاز. وفي حال تفعيل “وضع السحاب” (Cloud Mode)، يستخدم التطبيق نماذج Gemini المتقدمة لتحسين النصوص وتنسيقها بشكل أكثر تعقيدًا.
كما يتكامل التطبيق مع حساب Gmail (اختياريًا) لاستيراد الكلمات المفتاحية والأسماء والمصطلحات التقنية الخاصة بالمستخدم لضمان دقة أعلى في التعرف على الكلام، مع إمكانية إضافة كلمات مخصصة يدويًا.
التوفر ومستقبل التطبيق على أندرويد
رغم أن التطبيق متاح حاليًا بشكل أساسي على متجر تطبيقات آبل (iOS)، إلا أن التسريبات الأولية في وصف المتجر أشارت إلى وجود نسخة أندرويد قادمة. ومن المتوقع أن يقدم التطبيق على أندرويد تكاملًا أعمق، حيث يمكن تعيينه كلوحة مفاتيح افتراضية للنظام، مما يتيح ميزات الإملاء الذكي عبر كافة التطبيقات والمجالات النصية.
يعد إطلاق هذا التطبيق التجريبي إشارة واضحة من جوجل على رغبتها في الهيمنة على سوق تطبيقات تحويل الكلام إلى نص المدعومة بالذكاء الاصطناعي، وهو سوق يشهد نموًا متسارعًا مع تحسن دقة النماذج اللغوية الكبيرة وقدرتها على فهم سياقات اللغة البشرية المعقدة.
المصدر: TechCrunch


اترك تعليقاً