Anthropic présente Claude Sonnet 4.5 : codage autonome à long horizon, victoires sur les benchmarks et un nouveau Agent SDK

أعلنت شركة أنثروبيك عن إطلاق كلود سونيت 4.5 في 29 سبتمبر 2025، وهو ما يمثل نقطة تحوّل في فهمنا لـ"نماذج الترميز". بدلاً من ملاحقة الدرجات العالية في مؤشرات الاختبار من طلب واحد، تم تصميم سونيت 4.5 بوضوح للاستقلالية الدائمة: تدفقات عمل وكيل متعددة المراحل تمتد لأيام كاملة تخطط، وتتصرف، وتتكرر، وتسلم برمجيات ذات جودة إنتاجية بأقل إشراف بشري. متاح حالياً عبر API كلود وروبوت المحادثة كلود بنفس سعر سونيت 4 (3 دولارات لكل مليون رمز دخولي، و15 دولارًا لكل مليون رمز صادر)، يجمع سونيت 4.5 بين المطالبات بالأداء في المؤشرات التقليدية وتركيز جديد على الأفق الطويل والسلامة للوكلاء الذين يتعاملون مع بنى تحتية حقيقية.

ما الجديد ولماذا يهم

تضع أنثروبيك سونيت 4.5 باعتباره أكثر نماذجها تطوراً حتى الآن للترميز و"استخدام الكمبيوتر". تؤكد التغطية العامة على موضوعين مترابطين: الانتصارات في المؤشرات والاستقلالية طويلة الأفق. على الورق، تفيد أنثروبيك بتحقيق نتائج رائدة في تقييمات الترميز بما في ذلك SWE-Bench Verified؛ والأهم للمهندسين العمليين، تجادل الشركة بأن لوحات المتصدرين التقليدية تقلل من قدرات النماذج على تدفقات العمل المطولة والمعتمدة على بعضها البعض. تجارب داخلية أشارت إليها تقارير مثل TechCrunch وتقارير مستقلة من وسائل إعلام مثل The Verge تصف سونيت 4.5 وهو ينفذ بشكل مستقل جلسات تصل إلى 30 ساعة. خلال تلك الجلسات، لم يقتصر دور الوكيل على توليد مقتطفات برمجية فقط: بل قام بإنشاء قواعد بيانات، توفير موارد سحابية، شراء نطاقات، تنفيذ اختبارات التكامل، وحتى إكمال مهام الامتثال الإجرائية المماثلة لأجزاء من تدقيق SOC 2.

هذا التراكم من القدرات — التخطيط، تنسيق الأدوات، التصحيح التكراري، والتعامل الآمن مع بيانات الاعتماد — مهم لأن تسليم البرمجيات الحقيقية ليس حالة اختبار معزولة. هي سلسلة مهام متعاقبة غالباً ما تمتد لعدة أيام. فرضية أنثروبيك هي أن حصة السوق الأكبر في أدوات المطورين ستذهب للنماذج التي تستطيع الحفاظ على العمل عبر هذه الآفاق الطويلة، بدلاً من النماذج المحسنة لدقة الدور الواحد فقط.

المنافسة ومكانة سونيت

يأتي الإصدار في ظل تجدد المنافسة من GPT-5 من OpenAI ونماذج حدودية أخرى. تصف TechCrunch قصة سونيت 4.5 كرد على سباق التسابق في المؤشرات، حيث تؤكد أنثروبيك أنه بينما تنشر المنافسون درجات مبهرة لنقاط زمنية محددة، يتصدر سونيت 4.5 في السيناريوهات التي يجب فيها على الوكلاء التخطيط والتنفيذ والتكرار عبر ساعات طويلة. يبرز Axios وآخرون التحول من أفق استقلالية يبلغ حوالي سبع ساعات في النماذج الحدودية السابقة إلى الآفاق اليومية التي تظهرها تجارب أنثروبيك. عمليًا، قد يغير ذلك كيف توزع فرق الهندسة المهام: من التعامل مع نماذج الذكاء الاصطناعي كلوازم ترميز مساعدة إلى التعامل معها كأعضاء مؤتمتة في خط تسليم البرمجيات.

التحقق من المطورين والأدوات

التحقق من الشركاء يكتسب أهمية. أخبر الرؤساء التنفيذيون لشركتي Cursor وWindsurf، وهما بيئتا تطوير متكاملتان تركزان على الذكاء الاصطناعي، TechCrunch أن سونيت 4.5 يمثل قفزة في مهام الترميز طويلة الأفق — موثوقية أفضل عبر حلقات التخطيط → التنفيذ → التحسين، وليس فقط إكمالات نقطة زمنية. لتمكين هذا النوع من السلوك الوكلي للمطورين الخارجيين، أطلقت أنثروبيك أيضاً حزمة تطوير برامج وكلاء كلود Agent SDK. تكشف هذه الحزمة عن نفس مركب تنسيق الأدوات المتعدد الذي يدعم Claude Code، مما يتيح للفرق بناء وكلاء مخصصين يجمعون بين التصفح، وصول الشيل، التوفير السحابي، وواجهات برمجة التطبيقات الخارجية. للمؤسسات التي تختبر وكلاء مستقلين يجب عليهم التفاعل مع المستودعات، التكامل المستمر/التسليم المستمر، وحسابات السحابة، هذه البنية التحتية تمثل القطعة المفقودة.

تطبيق Imagine with Claude، وهو معاينة بحثية لمشتركي Max، يوضح توليد البرمجيات في الوقت الحقيقي وعلى الفور — إشارة أخرى على أنثروبيك تميل نحو تجارب وكلاء تفاعلية سائلة تتطور خلال الجلسات الطويلة.

السلامة والمحاذاة للجلسات الطويلة

من المخاطر المركزية مع وكلاء الذين يتعاملون مع الأسرار والمستودعات والموارد السحابية هي السلامة. تسوق أنثروبيك سونيت 4.5 صراحة باعتباره أكثر النماذج الحدودية محاذاة حتى الآن، مع تحسينات في مقاومة حقن الموجهات، ميل أقل للتملق والسلوك الخادع، وقيود محكمة حول العمليات الخطرة أو غير المصرح بها. تبرز TechCrunch هذه التحسينات إلى جانب مكاسب الترميز؛ عملياً، سيتوجب على المؤسسات التحقق من هذه المطالبات عبر اختبارات الاختراق وتقييمات الفرق الحمراء قبل السماح لوكلاء يعملون لفترات طويلة بالتدخل في بيئات الإنتاج.

التسعير والتوفر

سونيت 4.5 متاح الآن في محادثة كلود على الويب والموبايل وعبر API كلود بنفس أسعار الرموز التي كانت لسونيت 4 — 3 دولارات لكل مليون رمز دخولي، و15 دولارًا لكل مليون رمز صادر. عدم زيادة السعر يلفت الانتباه: يبدو أنثروبيك تزيل عقبة تكلفة للفرق التي ترغب في تجربة تدفقات عمل طويلة الأفق وتتحدى اللاعبين الحاليين في الأداء والاقتصاد العملي.

ماذا يعني هذا لمنظومة الذكاء الاصطناعي في المغرب

بالنسبة للمغرب، قد يكون سونيت 4.5 وأدوات تطوير وكلاء كلود ذات أثر كبير عبر الحكومة والشركات الناشئة والصناعة.

تحديث الحكومة والخدمات الرقمية: استثمر القطاع العام في المغرب في مبادرات الحوكمة الإلكترونية والهوية الرقمية في السنوات الأخيرة. يمكن للوكلاء ذوي الأفق الطويل أتمتة تطوير بوابات مواجهة للمواطن من البداية للنهاية، من المتطلبات، الهندسة، النشر وفحوصات الامتثال. بفضل قدرة سونيت 4.5 المعلنة على مهام متعددة المراحل، يمكن للوزارات المغربية تسريع نمذجة وإنتاج الخدمات مع استخدام SDK لفرض التحكم في القابلية للتدقيق والسيادة على البيانات محلياً.

الشركات الناشئة ومطورو البرمجيات كخدمة: المشاهد الناشئة في الدار البيضاء والرباط، مع مجالات مثل التكنولوجيا المالية، الصحة، التكنولوجيا الزراعية والتجارة الإلكترونية، ستستفيد من وكلاء يمكنهم تقليل وقت الوصول للسوق. يمكن لشركة تكنولوجيا مالية مغربية مثلاً إسناد مهمة بناء خدمات خلفية، وربط بوابات الدفع، وتنفيذ فحوصات الأمان في جلسة طويلة واحدة. للفرق الناشئة ذات الموارد الهندسية المحدودة، يمكن لسونيت 4.5 تقليص أشهر من العمل إلى مجموعة من عمليات الوكلاء القابلة للتحقق، شريطة التحقق من الأمان والامتثال.

التكنولوجيا الزراعية والتوطين: الوكلاء الذين يستطيعون الاستمرار عبر تدفقات عمل طويلة مفيدون لتطبيقات متخصصة مثل حلول التكنولوجيا الزراعية التي تتطلب تكاملات مع شبكات المستشعرات، خطوط تحليلات وواجهات تطبيقات للهواتف بالفرنسية والعربية. قد يسرع Agent SDK تطوير الواجهات المحلية وخطوط معالجة البيانات التي تحترم قواعد البيانات الإقليمية والاحتياجات اللغوية.

تطوير المواهب والتعليم: يمكن لجامعات المغرب ومعسكرات التدريب على البرمجة دمج استخدام وكلاء الأفق الطويل ضمن المناهج لتعليم تدفقات عمل هندسة البرمجيات المتوافقة مع الصناعة. سيتعلم الطلاب كيف يخطط الوكلاء عبر مراحل تطوير متعددة وكيفية إعداد ضوابط للأمان والامتثال — مهارات ستكون مطلوبة إذا تبنت الفرق وكلاء سونيت المستقلين.

التحديات والاعتبارات للمستخدمين المغاربة

سيادة البيانات ومحلية السحابة: ستحتاج المؤسسات المغربية لتقييم مكان حدوث الاستدلال ومعالجة البيانات. حتى مع SDK، من المتوقع أن تطالب المؤسسات بخيارات استدلال داخلية أو مستضافة إقليمياً مع ضوابط صارمة على التعامل مع بيانات الاعتماد.

الأطر التنظيمية والامتثال: مع منح الوكلاء صلاحيات العمل المستقل، ستحتاج الأطر التنظيمية في المغرب ومنطقة الشرق الأوسط وشمال إفريقيا لمعالجة المسؤولية، التدقيق، وشهادات تسليم البرمجيات المدفوعة بالذكاء الاصطناعي — خصوصاً في قطاعات مثل المالية والرعاية الصحية.

التكامل مع النظم المحلية: لاستخلاص القيمة العملية، يجب على وكلاء سونيت التكامل مع مزودي الدفع المحليين، مشغلي الاتصالات، وواجهات برمجة التطبيقات الحكومية. يخفف SDK من العوائق، لكن النجاح يتطلب جهداً هندسياً لربط الأدوات وفرض السياسات المحلية.

الخلاصة

يعيد سونيت 4.5 من أنثروبيك صياغة الحديث من مكاسب الاختبارات المعزولة إلى واقع هندسة تسليم البرمجيات. بالنسبة للمغرب، يجمع مزيج التفكير طويل الأفق، وكيل أدوات التطوير SDK، ونموذج التسعير الثابت بين الحواجز التقنية والاقتصادية أمام التجريب من قبل الحكومات، الشركات الناشئة والمؤسسات التعليمية. الخطوات الحاسمة القادمة للمستخدمين المغاربة هي اختبار سونيت 4.5 في بيئات مراقبة، التحقق من سلامة وامتثال الادعاءات، والاستثمار في التكاملات التي تحترم سيادة البيانات واللوائح المحلية. إذا ما تعمم تجارب أنثروبيك التي استمرت 30 ساعة إلى ما بعد الأمثلة المختارة، فقد يغير سونيت 4.5 توقعات الفرق من نماذج الترميز — محولاً إياها من مساعدين إلى مساهمين مستقلين داخل البنية التحتية التقنية المغربية.

أنثروبيك تطلق كلود سونيت 4.5: ترميز ذاتي طويل الأمد، انتصارات في المؤشرات، وأدوات تطوير جديدة لوكلاء الذكاء الاصطناعي

تحتاج مساعدة في مشروع ذكاء اصطناعي؟

Related Articles

أدوات الذكاء الاصطناعي البصري ووكلاء Atlassian Confluence

فوز Matei Zaharia (Databricks) بجائزة ACM Computing Prize AGI

جوجل تطلق بهدوء تطبيق إملاء يعمل دون اتصال على iOS

اتفاق حوسبة Anthropic مع Google وBroadcom وTPUs

الذكاء الاصطناعي المغرب، المحدودة

روابط سريعة

اتصل بنا