News

Anthropic تُطلق Opus 4.5: الأول الذي يتجاوز >80% على SWE-Bench Verified، بالإضافة إلى تطبيقات Chrome/Excel و'المحادثة بلا نهاية' للسياق الطويل

يتجاوز Opus 4.5 نسبة 80% على SWE-Bench Verified ويُطلق تطبيقات Chrome/Excel. ماذا يعني ذلك للشركات الناشئة في المغرب، والشركات الصغيرة والمتوسطة، والخدمات العامة.
Nov 26, 2025·4 min read
Anthropic تُطلق Opus 4.5: الأول الذي يتجاوز >80% على SWE-Bench Verified، بالإضافة إلى تطبيقات Chrome/Excel و'المحادثة بلا نهاية' للسياق الطويل
## نظرة عامة أصدرت Anthropic نموذج Opus 4.5 في 24 نوفمبر 2025. إنه النموذج الرائد ضمن عائلة Claude 4.5. تتضمن التشكيلة الآن Sonnet 4.5 من سبتمبر وHaiku 4.5 من أكتوبر. تُشير تقارير TechCrunch إلى نتائج رائدة في معايير البرمجة، استخدام الأدوات، والاستدلال. إنجازٌ رئيسي يلفت الأنظار. Opus 4.5 هو أول نموذج يتجاوز 80% على SWE-Bench Verified. وتُبرز Anthropic كذلك قدرات أقوى في "استخدام الكمبيوتر" ومهارات الجداول. التركيز منصبّ على سير عمل عملي تطبيقي. منتجات جديدة توسّع الوصول. يجري طرح Claude for Chrome تدريجيًا لمستخدمي Max. ويُتاح Claude for Excel لفئات Max وTeam وEnterprise. تُظهر هذه المنتجات الترميز القائم على الوكلاء والعمل على الجداول في مهام فعلية. تحت الغطاء، تغييرات الذاكرة تستهدف عمليات السياق الطويل. تشير TechCrunch إلى "المحادثة بلا نهاية" الجديدة لمستخدمي Claude المدفوعين. عند الاقتراب من حدّ السياق، يقوم Opus 4.5 بضغط السجل والاحتفاظ بالنقاط البارزة تلقائيًا. تتجنّب المحادثات القطع الحادّ دون جهدٍ يدوي. تضع Anthropic Opus 4.5 كوكيلٍ قائد. يمكنه تنسيق أساطيل من الوكلاء الفرعيين، غالبًا Haiku 4.5. يساعد ذلك في المهام متعددة الخطوات مثل استكشاف قواعد الأكواد، التراجع، وإعادة فحص المستندات الكبيرة. مخطط الذاكرة العاملة يدعم هذا السلوك. الضغط التنافسي قوي. أطلقت OpenAI GPT-5.1 في 12 نوفمبر. وتبعتها Google بـ Gemini 3 في 18 نوفمبر. يُبرز عرض Anthropic تحسينات في الترميز، استخدام الأدوات، وسلوك الذاكرة لأجل سير عمل موثوق للوكلاء. ## لماذا يُعد Opus 4.5 مهمًّا للمغرب ترغب الفرق المغربية في ذكاءٍ اصطناعي يعتمد عليه للعمل اليومي. تحتاج إلى أدوات تُبسّط البرمجة والجداول والمهام داخل المتصفح. يستهدف Opus 4.5 هذه الاحتياجات بسلوك وكيل أقوى وواجهات عملية. يمكن للشركات الناشئة التحرك أسرع بمساعدة البرمجة والاختبارات الآلية. يمكن للشركات الصغيرة والمتوسطة تنظيم الجداول ومطابقة البيانات بأخطاء أقل. يمكن للوكالات العامة تجربة سير عمل موجّه للمواطنين مع الحفاظ على الرقابة على استخدام البيانات. سلوك النموذج في السياق الطويل يُناسب الملفات الكبيرة وملفات السياسات. ## المعايير، شرح موجز يقيس SWE-Bench Verified مهام هندسة البرمجيات من طرف إلى طرف. تحقيق 80% يدل على حلّ القضايا بشكلٍ متسق عبر المستودعات. يُقيّم Terminal-Bench الكفاءة في سطر الأوامر. تشير هذه النتائج إلى دعمٍ قوي للبرمجة. مجالٌ آخر هو استخدام الأدوات. تذكر TechCrunch نتائج عبر tau2-bench وMCP Atlas. تستكشف تلك الاختبارات مدى جودة تخطيط النماذج واستدعائها للأدوات الخارجية. استخدام الأدوات بشكلٍ موثوق مهم لسير العمل الواقعي. تحسّن الاستدلال العام أيضًا. يُعد ARC-AGI 2 وGPQA Diamond تقييماتٍ متطلبة. تشير الدرجات الأعلى إلى استدلالٍ أقوى تحت الضغط. يساعد ذلك في العمل المعقّد متعدد الخطوات. ## Chrome وExcel: قنوات عملية للفرق المغربية يمكّن Claude for Chrome نموذج Opus 4.5 من العمل داخل المتصفح. يمكنك قراءة الصفحات، تلخيصها، وأتمتة الخطوات المتكررة. هذا مفيد للبحث، المشتريات، وفحوصات الامتثال. يستهدف Claude for Excel الجداول مباشرة. يساعد في تنظيف البيانات، بناء الصيغ، وتدقيق النماذج. مع وصول Team وEnterprise، يمكن للأقسام إضفاء الطابع الرسمي على حوكمة الجداول والمراجعات. يمكن للشركات الصغيرة والمتوسطة الانتقال من الفحوصات اليدوية إلى بوابات جودة مؤتمتة. قنوات المتصفح والجداول مألوفة في المغرب. لا تزال العديد من سير العمل تعتمد على Excel ونماذج الويب. نموذج قادر على العمل في تلك البيئات يُقصّر زمن التدريب. كما يُشجّع الاعتماد التدريجي. ## المحادثة بلا نهاية: العمل مع الملفات الطويلة ملفات السياسات والعطاءات لها تاريخٌ طويل. السياق الطويل ضروري للاستمرارية. ميزة "المحادثة بلا نهاية" تضغط السجل دون عمليات إعادة تعيين قاسية. يحصل مستخدمو Claude المدفوعون على ضغطٍ تلقائي للذاكرة عند الاقتراب من الحدود. يحتفظ Opus 4.5 بالنقاط البارزة والقرارات السابقة. تتفادى فقدان السياق في منتصف المشروع. يُقلّل ذلك عبء الإشراف أثناء المراجعات الممتدة. هذا السلوك يفيد الفرق القانونية، المدققين، وموظفي المشتريات. وهو مفيد أيضًا في دعم العملاء مع ملاحظات قضايا طويلة. يمكن للنموذج الحفاظ على الاستمرارية عبر مناقشات فصلٍ كامل. يُحسّن ذلك الاتساق والمساءلة. ## سير العمل القائم على الوكلاء والوكلاء الفرعيين تُؤطّر Anthropic Opus 4.5 كمنسّقٍ رئيسي. يمكنه إسناد المهام إلى وكلاء فرعيين، غالبًا Haiku 4.5. هذا التقسيم يساعد في التوسّع والسرعة. قد يبدو التدفق النموذجي على النحو التالي: - يضع Opus 4.5 خطة المشروع ويحدّد الأهداف. - يفحص Haiku 4.5 مجلدات الشفرة ويستخرج الملفات الأساسية. - يراجع Opus 4.5 الفروقات، يقترح إصلاحات، ويكتب اختبارات. - يعيد Haiku 4.5 تشغيل الفحوصات ويلخّص التغييرات. هذا النمط يتماشى مع مراجعات المستندات متعددة الخطوات. يلائم تدقيق الجداول الكبيرة والتنظيف المرحلي. كما يناسب مهام البحث عبر العديد من مصادر الويب. مخطط الذاكرة يدعم تسلسل الأفكار. ## استخدامات عملية في القطاع الخاص في المغرب يمكن للشركات الناشئة استخدام Opus 4.5 لبناء هياكل الشفرة وإعادة الهيكلة. يمكنه توليد اختبارات للوحدات القائمة. يجب على الفرق أن تُشغّل خطوط CI وتُبقي على المراجعات اليدوية. استخدموا النموذج لاقتراح الإصلاحات وتوثيق التغييرات. يمكن لشركات التكنولوجيا المالية الصغيرة والمتوسطة أتمتة المطابقة في Excel. يمكنها وضع علامات على الشذوذ والقيم الخارجة في سجلات المعاملات. يمكن للنموذج بناء جداولٍ محورية وقواعد تحقق. يمكن للموظفين اعتماد التغييرات قبل النشر. يمكن لفرق التجزئة واللوجستيات تنظيف جداول جرد المخزون. يمكن للنموذج استنتاج القيم المفقودة وتوحيد أسماء المنتجات. يمكنه توليد خرائط الفئات لأغراض التقارير. يجب أن تكون فحوصات الجودة إلزامية قبل التحديثات. يمكن لدعم العملاء الاستفادة داخل المتصفح. استخدموا Claude for Chrome لتلخيص التذاكر وصياغة الردود. حافظوا على مكتبة من القوالب المعتمدة. اشترطوا موافقة بشرية لعمليات التصعيد والاسترداد. ## سيناريوهات القطاع العام والتعليم يمكن للوكالات العامة تجربة مراجعة المستندات بسياقٍ طويل. يمكن لـ Opus 4.5 إجراء مراجع متقاطعة للقرارات السابقة والمسودات الحالية. يمكنه اقتراح عدم الاتساقات لمراجعة بشرية. أبقِ البيانات الحساسة تحت السيطرة ومجهولة الهوية. يمكن لبرامج التعليم استكشاف مساعدي البرمجة في المختبرات. يمكن للطلاب تعلم ممارسات تصحيح الأخطاء والاختبار. يمكن للمدرّسين تصميم واجبات تمزج مساعدة الذكاء الاصطناعي والعمل اليدوي. يجب أن تتطلب معايير التقييم الشرح وقابلية التكرار. يمكن للخدمات البلدية تجربة أسئلة شائعة للمواطنين. يمكن للنموذج صياغة ردود من قواعد معرفة معتمدة. استخدموا ضوابط صارمة وتسجيلًا. أبقوا النشر النهائي تحت سيطرة الموظفين. ## الحوكمة، حماية البيانات، وإدارة المخاطر لدى المغرب إشرافٌ نشط على حماية البيانات. على المؤسسات مواءمة استخدام الذكاء الاصطناعي مع اللوائح المحلية والسياسات الداخلية. استخدموا الأسماء المستعارة للبيانات الشخصية حيث أمكن. تجنّبوا إرسال المعرّفات الحسّاسة إلى خدمات خارجية. استخدموا وصولًا قائمًا على الأدوار لواجهات Claude. احتفظوا بسجلات تدقيق للمطالبات والمخرجات والموافقات. راجعوا المخرجات للتحيّز والدقة. حدّدوا خطوطًا حمراء للموضوعات والإجراءات الخاضعة للتنظيم. بالنسبة لتجارب القطاع العام، ضمَنوا شفافية المشتريات. انشروا معايير التقييم وتقييمات المخاطر. اشترطوا خطط رجوع واضحة. تواصلوا نطاق التجربة ومقاييس الأداء. ## دليل اعتماد للفرق المغربية ابدؤوا صغيرًا بتجربةٍ محدودة. اختاروا سير عمل قابلًا للقياس مع مقاييس نجاح واضحة. درّبوا الموظفين على ضبط المطالبات وقوائم المراجعة. وثّقوا المخاطر المتكررة وخطوات التخفيف. ادمجوا مع الأدوات القائمة. للمطورين، حافظوا على المستودعات وCI وفحص الأمان. للجداول، حدّدوا قواعد جودة مؤسسية وفحوصات مؤتمتة. وائموا المخرجات مع متطلبات التدقيق. قيسوا القيمة باستمرار. تتبّعوا الوقت المُوفَّر، معدلات الأخطاء، وإعادة العمل. قارنوا بخط أساس يدوي. أوقفوا أو وسّعوا بناءً على الأدلة. خطّطوا للتوسيع. أضفوا الطابع الرسمي على الوصول والحوكمة والتدريب. أنشئوا مركز تميّز. شاركوا أدلة التشغيل عبر الأقسام والمواقع. ## السياق التنافسي وإرشادات المشترين وصل GPT-5.1 من OpenAI وGemini 3 من Google في وقتٍ مبكّر من نوفمبر. جميع المورّدين يستهدفون سير عملٍ موثوق للوكلاء. تُفرّق المعايير وسلوك الذاكرة بين المنتجات. على المشترين في المغرب الاختبار على مجموعات بياناتهم وأدواتهم. ركّزوا على مجموعتكم التقنية والقيود. أجروا تجارب sandbox مع مستودعاتكم وجداولكم. قيّموا أداء السياق الطويل باستخدام ملفاتٍ حقيقية. لاحظوا مدى جودة تعامل النموذج مع استدعاءات الأدوات والتراجع. انظروا إلى ملاءمة المورّد للمشتريات والامتثال. راجعوا شروط العقود وميزات التسجيل. وضّحوا توقعات الدعم ومسارات التصعيد. طالبوا بتقارير تقييم شفافة. ## الآفاق لنظام الذكاء الاصطناعي في المغرب يجلب Opus 4.5 مكاسب عملية في مجالات العمل السائدة في المغرب اليوم. يهيمن سير العمل عبر المتصفح والجداول على العديد من المكاتب. يساعد دعم البرمجة القوي المطوّرين المحليين والشركات الناشئة. تدعم ذاكرة السياق الطويل فرق السياسات والتدقيق. تُظهر النتائج التي أبلغت عنها TechCrunch تقدّمًا في الأداء. سلوك الوكيل في النموذج يناسب الاعتماد التدريجي. يمكن للمؤسسات المغربية المضيّ قدمًا بتجارب منظّمة. الهدف هو أتمتة موثوقة تحت إشراف. إن أثبتت التجارب قيمتها، فوسّعوا بحذر. حافظوا على حوكمةٍ محكمة وتدريبٍ فعّال. قيسوا التأثيرات على الدقة والتكلفة. ابنوا قدرة داخلية بدلًا من الاستعانة الخارجية بكلّ الحكم. ## الخلاصات الرئيسية - يتجاوز Opus 4.5 نسبة 80% على SWE-Bench Verified، ما يشير إلى أداء قوي في البرمجة. - منتجات Chrome وExcel الجديدة تُقدّم سير عمل عملي قائمًا على الوكلاء. - "المحادثة بلا نهاية" تدعم الملفات الطويلة والمحادثات المستقرة. - تنسيق الوكلاء الفرعيين يمكّن المهام متعددة الخطوات عبر الشفرة والمستندات. - على الفرق المغربية أن تبدأ بتجارب بضوابط حوكمة صارمة وأهداف قابلة للقياس.

تحتاج مساعدة في مشروع ذكاء اصطناعي؟

سواء كنت تبحث عن تنفيذ حلول الذكاء الاصطناعي، أو تحتاج استشارة، أو تريد استكشاف كيف يمكن للذكاء الاصطناعي تحويل عملك، أنا هنا للمساعدة.

لنناقش مشروع الذكاء الاصطناعي الخاص بك ونستكشف الإمكانيات معاً.

الاسم الكامل *
عنوان البريد الإلكتروني *
نوع المشروع
تفاصيل المشروع *

Related Articles

featured
J
Jawad
·Dec 4, 2025

UNDP: طفرة الذكاء الاصطناعي في آسيا والمحيط الهادئ قد توسّع عدم المساواة—ملايين الوظائف معرّضة للخطر رغم أن مكاسب تقارب ~$1T تلوح في الأفق

featured
J
Jawad
·Dec 3, 2025

TechCrunch: تفوّق الذكاء الاصطناعي لدى Google هو التخصيص الفائق—Gemini يستفيد من بياناتك في Gmail وDrive وغيرهما، مع تسميات وعناصر تحكّم جديدة ‘personalized’

featured
J
Jawad
·Dec 2, 2025

ثلاث سنوات من ChatGPT: من تطبيقٍ فيروسي إلى محرّك للسوق—محطات، مكاسب، وتحذيرات من فقاعة”

featured
J
Jawad
·Dec 1, 2025

يعيد الذكاء الاصطناعي كتابة دليل GTM: Google و OpenAI تقولان 'أنجز المزيد بموارد أقل'—لكن الحِرفة والفضول والدقة لا تزال تنتصر