“جيميني” من جوجل.. إنجاز جديد يسهل التصفح للمكفوفين والصم

أعلنت جوجل عن سلسلة تحسينات جديدة في إطار مبادرة “جيميني” (Gemini) لدعم إمكانية الوصول الرقمي، تهدف إلى تسهيل تجربة تصفح الويب لمستخدمي الأجهزة الذكية من ذوي التحديات البصرية أو السمعية.
وتشمل التحديثات مزايا مبتكرة تدمج الذكاء الاصطناعي لتعزيز التفاعل مع المحتوى المرئي والصوتي.
وصف تفاعلي للصور عبر الذكاء الاصطناعي
تعتمد جوجل على تقنية “جيميني” لترقية ميزة “توكباك” (TalkBack) – القارئ الشاشة المدمج في أجهزة أندرويد – حيث بات بإمكان المستخدمين الآن الحصول على أوصاف مفصلة للصور عبر الذكاء الاصطناعي، وطرح أسئلة متابعة عنها.
على سبيل المثال، إذا تلقى المستخدم صورة لعبة غيتار من صديقه، يمكنه سؤال “جيميني” عن ماركتها أو لونها، أو حتى الاستفسار عن تفاصيل أخرى في الخلفية.
وتم دمج زر “وصف الشاشة” (Describe Screen) ضمن قائمة “توكباك”، مما يسمح بتحليل المحتوى المعروض (ككتالوج أزياء) والإجابة على استفسارات مثل: “أي فستان يناسب ليلة شتوية باردة؟”، أو “ما الصلصة المثالية للساندويتش؟”، مع إبراز تفاصيل المنتج أو العروض التخفيضية إن وُجدت.
تعزيز الترجمة النصية
في متصفح “كروم”، أطلقت جوجل ميزة “الترجمة التعبيرية” (Expressive Captions) التي تُضفي نبرة عاطفية على النصوص المُولدة تلقائيًا لمقاطع الفيديو، بدلًا من الاكتفاء بنقل الكلام حرفيًا. فعند مشاهدة مباراة كرة قدم، ستتحول كلمة “هدف” إلى “جووووول” تعكس حماسة التعليق.
كما تغطي الترجمة الأصوات المهمة مثل الصفارات أو التصفيق، وحتى السعال.
وستتوفر هذه الميزة أولًا في الولايات المتحدة والمملكة المتحدة وكندا وأستراليا، على الأجهزة العاملة بنظام أندرويد 15 فما فوق.
تكبير النصوص دون تشويه تنسيق الصفحات
أضافت جوجل أيضًا ميزة “التكيف التلقائي لحجم النص” (Adaptive Text Zoom) في متصفح كروم، والتي تتيح تكبير النصوص دون التأثير على تنسيق الصفحة.
ويمكن للمستخدمين ضبط مستوى التكبير عبر شريط تمرير في أسفل الشاشة، وتطبيق الإعدادات على جميع الصفحات أو صفحات محددة.
تُعد هذه التحديثات جزءًا من استراتيجية جوجل لتعميم التكنولوجيا الشاملة، التي تدمج الذكاء الاصطناعي لتمكين الفئات الأكثر احتياجًا من التفاعل بشكل طبيعي مع العالم الرقمي بكفاءة ومرونة وسلاسة.
جدير بالذكر أن “جيميني” (Gemini)، نظام الذكاء الاصطناعي المتطور من جوجل، الذي يُمثل نقلة نوعية في معالجة البيانات وفهم المحتوى بطريقة أكثر ذكاءً وتفاعلاً.
وأطلقت جوجل “جيميني” كجزء من استراتيجيتها لتعزيز التطبيقات المدعومة بالذكاء الاصطناعي، مستهدفة تحسين التفاعل بين المستخدمين والتكنولوجيا الرقمية، خاصة للأشخاص ذوي الاحتياجات الخاصة. كان الهدف الأساسي هو دمج الذكاء الاصطناعي في الأنظمة اليومية، بحيث يكون أكثر قدرة على تفسير المعلومات المرئية والصوتية بطرق تتجاوز الوظائف التقليدية.
بدأ “جيميني” كأداة لمساعدة المستخدمين على وصف الصور باستخدام الذكاء الاصطناعي، حيث تم دمجه في ميزة TalkBack، وهي أداة قارئ الشاشة المتاحة على أجهزة أندرويد التي تخدم المستخدمين الذين يعانون من ضعف البصر. مع مرور الوقت، تطورت هذه الميزة، فأصبح بإمكان المستخدمين طرح أسئلة تفاعلية حول الصور، مثل الاستفسار عن تفاصيل العناصر الظاهرة، مما يفتح أفقًا جديدًا من التفاعل الذكي.
التقنيات المتقدمة التي يعتمد عليها “جيميني”
يعتمد “جيميني” على تقنيات التعلم العميق والشبكات العصبية لتحليل الصور والنصوص والصوت بطريقة تحاكي فهم الإنسان. ومن خلال التعلم المستمر من البيانات، أصبح قادرًا على إدراك المحتوى بشكل أكثر دقة، مما يُساعد المستخدمين على فهم الصور والوسائط المتعددة بشكل أكثر تفصيلاً.
إحدى أبرز الميزات التي أضافتها جوجل إلى “جيميني” هي إمكانية التحليل الذكي للصور، حيث لم يعد النظام يكتفي بوصف العناصر المرئية، بل بات يُجيب عن استفسارات مثل: “ما نوع هذه الدراجة؟” أو “ما لون السترة في الصورة؟”، مما يعزز إمكانيات الوصول الرقمي للمستخدمين الذين يعانون من تحديات بصرية.
إلى جانب تحسين تجربة تصفح الصور، عززت جوجل تجربة المستخدمين من خلال تطوير ميزتين رئيسيتين:
العناوين التوضيحية التعبيرية (Expressive Captions) في متصفح Chrome، قدمت جوجل تحديثًا جديدًا للعناوين التوضيحية التلقائية، حيث لم يعد النظام يكتفي بنقل الكلام فقط، بل يُضفي طابعًا تعبيريًا يعكس نبرة الصوت. فعلى سبيل المثال، إذا كان المعلق في مباراة كرة القدم يُعبر عن فرحته بالهدف، فإن الترجمة لن تعرض “هدف” فقط، بل ستظهر “جوووول”، مما يُوفر تجربة أكثر غنىً للأشخاص الذين يعانون من مشكلات سمعية.
التكبير الذكي للنصوص (Adaptive Text Zoom) لمساعدة الأشخاص الذين يحتاجون إلى قراءة نصوص بحجم أكبر، أطلقت جوجل ميزة التكبير الذكي للنصوص في متصفح “كروم”، والتي تتيح للمستخدمين تكبير المحتوى النصي دون تشويه تنسيق الصفحة.
مع التقدم المستمر في الذكاء الاصطناعي، يتوقع أن تُواصل جوجل تطوير “جيميني” ليشمل تطبيقات أكثر تعقيدًا، مثل تحليل مقاطع الفيديو، تحسين فهم اللغات الطبيعية، وربما تقديم دعم صوتي أكثر ذكاءً لمساعدة المستخدمين في عمليات البحث والتصفح.
يمكن القول إن “جيميني” ليس مجرد أداة، بل هو خطوة نحو جعل التكنولوجيا أكثر شمولًا وإنسانية، حيث يُمكّن الأفراد من التفاعل مع المحتوى الرقمي بسهولة أكبر، بغض النظر عن التحديات التي يواجهونها. ومع استمرار التطوير، لا شك أن الذكاء الاصطناعي سيُحدث تحولات غير مسبوقة في طريقة استخدام التكنولوجيا، مما يجعل العالم الرقمي أكثر اتصالًا واستيعابًا للجميع.