إطلاق أحدث نسخة من شات جي بي تي للأعمال فائقة الدقة

إطلاق أحدث نسخة من شات جي بي تي للأعمال فائقة الدقة

كشفت OpenAI عن سلسلة نماذج GPT-4.1 – GPT-4.1، وGPT-4.1 mini، وGPT-4.1 nano – محققةً قفزة نوعية في الأداء مقارنةً بالإصدارات السابقة مثل GPT-4o.

 صُممت هذه النماذج لتتفوق في البرمجة، واتباع التعليمات، وفهم السياقات الطويلة، مع دعم لما يصل إلى مليون رمز.

صرح سام ألتمان، الرئيس التنفيذي لشركة OpenAI، قائلًا: “المعايير قوية، لكننا ركزنا على الفائدة في العالم الحقيقي، ويبدو المطورون سعداء للغاية”.

 أحدث نسخة من شات جي بي تي

حقق GPT-4.1 نسبة 54.6% في اختبار SWE-bench Verified، وهو تحسن بنسبة 21.4% مقارنةً بـ GPT-4o، مما يجعله الخيار الأمثل لمهام هندسة البرمجيات.

 كما حقق نسبة 38.3% في اختبار Scale’s MultiChallenge و72.0% في اختبار Video-MME، مُرسيًا بذلك معايير جديدة في متابعة التعليمات والفهم متعدد الوسائط.

تقترن مكاسب الأداء بالكفاءة: يُخفّض GPT-4.1 mini زمن الوصول إلى النصف تقريبًا ويُخفّض التكاليف بنسبة 83% مقارنةً بـ GPT-4o. ورغم صغر حجمه، فإنه يتفوق غالبًا على GPT-4o من حيث السرعة والجودة.

لا يزال GPT-4.1 nano، وهو النموذج الأكثر إحكامًا، يُحقق نتائج قوية بنسبة 80.1% في MMLU، مع الحفاظ على دعم كامل لنافذة سياقية تضم مليون رمز. وهو مناسب بشكل خاص للمهام السريعة والفعّالة من حيث التكلفة، مثل التصنيف والإكمال التلقائي وتشغيل وكلاء الذكاء الاصطناعي.

صُممت النماذج للاستخدام العملي، مع مراعاة ملاحظات المطورين لتحسين موثوقيتها في التطبيقات العملية. أفادت شركات مثل Windsurf وQodo بتحقيق زيادة تصل إلى 60% في كفاءة الترميز وجودة مراجعة الكود.

يتألق GPT-4.1 أيضًا في السياقات القانونية والمالية، حيث شهدت شركة تومسون رويترز (المدرجة في بورصة نيويورك زيادة بنسبة 17% في دقة مراجعة المستندات المتعددة، وأفادت شركة كارلايل بتحسن بنسبة 50% في استخراج البيانات المالية.