
أعلنت شركة أنثروبيك عن إطلاق كلود سونيت 4.5 في 29 سبتمبر 2025، وهو ما يمثل نقطة تحوّل في فهمنا لـ"نماذج الترميز". بدلاً من ملاحقة الدرجات العالية في مؤشرات الاختبار من طلب واحد، تم تصميم سونيت 4.5 بوضوح للاستقلالية الدائمة: تدفقات عمل وكيل متعددة المراحل تمتد لأيام كاملة تخطط، وتتصرف، وتتكرر، وتسلم برمجيات ذات جودة إنتاجية بأقل إشراف بشري. متاح حالياً عبر API كلود وروبوت المحادثة كلود بنفس سعر سونيت 4 (3 دولارات لكل مليون رمز دخولي، و15 دولارًا لكل مليون رمز صادر)، يجمع سونيت 4.5 بين المطالبات بالأداء في المؤشرات التقليدية وتركيز جديد على الأفق الطويل والسلامة للوكلاء الذين يتعاملون مع بنى تحتية حقيقية.
ما الجديد ولماذا يهم
تضع أنثروبيك سونيت 4.5 باعتباره أكثر نماذجها تطوراً حتى الآن للترميز و"استخدام الكمبيوتر". تؤكد التغطية العامة على موضوعين مترابطين: الانتصارات في المؤشرات والاستقلالية طويلة الأفق. على الورق، تفيد أنثروبيك بتحقيق نتائج رائدة في تقييمات الترميز بما في ذلك SWE-Bench Verified؛ والأهم للمهندسين العمليين، تجادل الشركة بأن لوحات المتصدرين التقليدية تقلل من قدرات النماذج على تدفقات العمل المطولة والمعتمدة على بعضها البعض. تجارب داخلية أشارت إليها تقارير مثل TechCrunch وتقارير مستقلة من وسائل إعلام مثل The Verge تصف سونيت 4.5 وهو ينفذ بشكل مستقل جلسات تصل إلى 30 ساعة. خلال تلك الجلسات، لم يقتصر دور الوكيل على توليد مقتطفات برمجية فقط: بل قام بإنشاء قواعد بيانات، توفير موارد سحابية، شراء نطاقات، تنفيذ اختبارات التكامل، وحتى إكمال مهام الامتثال الإجرائية المماثلة لأجزاء من تدقيق SOC 2.
هذا التراكم من القدرات — التخطيط، تنسيق الأدوات، التصحيح التكراري، والتعامل الآمن مع بيانات الاعتماد — مهم لأن تسليم البرمجيات الحقيقية ليس حالة اختبار معزولة. هي سلسلة مهام متعاقبة غالباً ما تمتد لعدة أيام. فرضية أنثروبيك هي أن حصة السوق الأكبر في أدوات المطورين ستذهب للنماذج التي تستطيع الحفاظ على العمل عبر هذه الآفاق الطويلة، بدلاً من النماذج المحسنة لدقة الدور الواحد فقط.
المنافسة ومكانة سونيت
يأتي الإصدار في ظل تجدد المنافسة من GPT-5 من OpenAI ونماذج حدودية أخرى. تصف TechCrunch قصة سونيت 4.5 كرد على سباق التسابق في المؤشرات، حيث تؤكد أنثروبيك أنه بينما تنشر المنافسون درجات مبهرة لنقاط زمنية محددة، يتصدر سونيت 4.5 في السيناريوهات التي يجب فيها على الوكلاء التخطيط والتنفيذ والتكرار عبر ساعات طويلة. يبرز Axios وآخرون التحول من أفق استقلالية يبلغ حوالي سبع ساعات في النماذج الحدودية السابقة إلى الآفاق اليومية التي تظهرها تجارب أنثروبيك. عمليًا، قد يغير ذلك كيف توزع فرق الهندسة المهام: من التعامل مع نماذج الذكاء الاصطناعي كلوازم ترميز مساعدة إلى التعامل معها كأعضاء مؤتمتة في خط تسليم البرمجيات.
التحقق من المطورين والأدوات
التحقق من الشركاء يكتسب أهمية. أخبر الرؤساء التنفيذيون لشركتي Cursor وWindsurf، وهما بيئتا تطوير متكاملتان تركزان على الذكاء الاصطناعي، TechCrunch أن سونيت 4.5 يمثل قفزة في مهام الترميز طويلة الأفق — موثوقية أفضل عبر حلقات التخطيط → التنفيذ → التحسين، وليس فقط إكمالات نقطة زمنية. لتمكين هذا النوع من السلوك الوكلي للمطورين الخارجيين، أطلقت أنثروبيك أيضاً حزمة تطوير برامج وكلاء كلود Agent SDK. تكشف هذه الحزمة عن نفس مركب تنسيق الأدوات المتعدد الذي يدعم Claude Code، مما يتيح للفرق بناء وكلاء مخصصين يجمعون بين التصفح، وصول الشيل، التوفير السحابي، وواجهات برمجة التطبيقات الخارجية. للمؤسسات التي تختبر وكلاء مستقلين يجب عليهم التفاعل مع المستودعات، التكامل المستمر/التسليم المستمر، وحسابات السحابة، هذه البنية التحتية تمثل القطعة المفقودة.
تطبيق Imagine with Claude، وهو معاينة بحثية لمشتركي Max، يوضح توليد البرمجيات في الوقت الحقيقي وعلى الفور — إشارة أخرى على أنثروبيك تميل نحو تجارب وكلاء تفاعلية سائلة تتطور خلال الجلسات الطويلة.
السلامة والمحاذاة للجلسات الطويلة
من المخاطر المركزية مع وكلاء الذين يتعاملون مع الأسرار والمستودعات والموارد السحابية هي السلامة. تسوق أنثروبيك سونيت 4.5 صراحة باعتباره أكثر النماذج الحدودية محاذاة حتى الآن، مع تحسينات في مقاومة حقن الموجهات، ميل أقل للتملق والسلوك الخادع، وقيود محكمة حول العمليات الخطرة أو غير المصرح بها. تبرز TechCrunch هذه التحسينات إلى جانب مكاسب الترميز؛ عملياً، سيتوجب على المؤسسات التحقق من هذه المطالبات عبر اختبارات الاختراق وتقييمات الفرق الحمراء قبل السماح لوكلاء يعملون لفترات طويلة بالتدخل في بيئات الإنتاج.
التسعير والتوفر
سونيت 4.5 متاح الآن في محادثة كلود على الويب والموبايل وعبر API كلود بنفس أسعار الرموز التي كانت لسونيت 4 — 3 دولارات لكل مليون رمز دخولي، و15 دولارًا لكل مليون رمز صادر. عدم زيادة السعر يلفت الانتباه: يبدو أنثروبيك تزيل عقبة تكلفة للفرق التي ترغب في تجربة تدفقات عمل طويلة الأفق وتتحدى اللاعبين الحاليين في الأداء والاقتصاد العملي.
ماذا يعني هذا لمنظومة الذكاء الاصطناعي في المغرب
بالنسبة للمغرب، قد يكون سونيت 4.5 وأدوات تطوير وكلاء كلود ذات أثر كبير عبر الحكومة والشركات الناشئة والصناعة.
التحديات والاعتبارات للمستخدمين المغاربة
الخلاصة
يعيد سونيت 4.5 من أنثروبيك صياغة الحديث من مكاسب الاختبارات المعزولة إلى واقع هندسة تسليم البرمجيات. بالنسبة للمغرب، يجمع مزيج التفكير طويل الأفق، وكيل أدوات التطوير SDK، ونموذج التسعير الثابت بين الحواجز التقنية والاقتصادية أمام التجريب من قبل الحكومات، الشركات الناشئة والمؤسسات التعليمية. الخطوات الحاسمة القادمة للمستخدمين المغاربة هي اختبار سونيت 4.5 في بيئات مراقبة، التحقق من سلامة وامتثال الادعاءات، والاستثمار في التكاملات التي تحترم سيادة البيانات واللوائح المحلية. إذا ما تعمم تجارب أنثروبيك التي استمرت 30 ساعة إلى ما بعد الأمثلة المختارة، فقد يغير سونيت 4.5 توقعات الفرق من نماذج الترميز — محولاً إياها من مساعدين إلى مساهمين مستقلين داخل البنية التحتية التقنية المغربية.
سواء كنت تبحث عن تنفيذ حلول الذكاء الاصطناعي، أو تحتاج استشارة، أو تريد استكشاف كيف يمكن للذكاء الاصطناعي تحويل عملك، أنا هنا للمساعدة.
لنناقش مشروع الذكاء الاصطناعي الخاص بك ونستكشف الإمكانيات معاً.