Lifecycle stage — Build
نادراً ما سلّم أحد نظاماً متعدد الوكلاء على نطاق الإنتاج. المسافة بين نموذج وكيل يعمل في دفتر ملاحظات ونظام يُدير عمليات مستمرة على أسطول روبوتات أو ساحة AGV أو شبكة طاقة أو شبكة تحكّم صناعية هي المكان الذي يتوقّف عنده كل فريق آخر. لمكدّسات الإلكتروني-الفيزيائية تتفاقم التحدّيات: الوكلاء لا ينسّقون مهام البرمجيات فحسب — بل ينسّقون التفاعلات مع الأنظمة الفيزيائية. أنا معمار Auralink — مليون وسبعمائة ألف سطر من كود الإنتاج، arXiv 2603.08736.
كل عرض توضيحي للوكيل يعمل في دفتر ملاحظات وينهار أول مرة يتفاعل مع نظام فيزيائي حقيقي عند تزامن الإنتاج الواقعي. يستخدم البرنامج التعليمي استدعاءات متزامنة وبيانات مستشعر وهمية ومساراً واحداً سعيداً. الإنتاج يعني عشرات جلسات الوكيل بالتوازي، كل منها يُجري استدعاءات أدوات حقيقية مقابل تيارات مستشعر حية ونقاط نهاية SCADA وAPIs MES.
منهجية التقييم من عمل LLM الأحادي الدور لا تمتدّ إلى مسارات الوكيل متعددة الخطوات التي تتفاعل مع الأنظمة الفيزيائية. يمكنك تقييم استدعاء. لا يمكنك بعد تقييم مسار تفتيش مستقل من 14 خطوة حيث اختارت الخطوة الخامسة المستشعر الخاطئ للقراءة وأرسلت الخطوة التاسعة أمر مُشغِّل استناداً إلى حالة قديمة.
تنفجر التكلفة لكل مهمة بشكل غير متوقَّع لأن كل خطوة وكيل تضاعف استهلاك الرموز المميزة واستدعاءات API للنظام الفيزيائي.
عندما يفعل وكيل شيئاً خاطئاً يؤثر على نظام فيزيائي، ليس لديك مكدّس رصد يخبرك بأي خطوة سبّبت ذلك.
يسير الالتزام في أربع مراحل ثلاثية الأسابيع. أعمل مضمَّناً في فريق الهندسة لديك — مهندسوك يبنون وأنا أُحضر قرارات الطوبولوجيا ومنهجية التقييم لتفاعلات الأنظمة الفيزيائية وأنماط الرصد من Auralink.
أتعمّق في نموذجك الأولي الحالي — مخطط الوكيل ومخزون الأدوات بما فيها واجهات الأنظمة الفيزيائية (SCADA وMES وAPIs المستشعر وإدارة الأسطول ومسارات أوامر المُشغِّل) واستراتيجية إدارة الحالة وأنماط الفشل التي واجهتها بالفعل. أُنتج تصميم طوبولوجيا مكتوباً يُحدّد أي تفاعلات مع الأنظمة الفيزيائية تتطلّب تصميم قفل أمان أو تصعيداً بإشراك الإنسان.
مهندسوك يُطبّقون الطوبولوجيا. أعمل جنباً إلى جنبهم في القرارات الأصعب — عناصر التنسيق الأساسية للمهام الطويلة الأمد على الأنظمة الفيزيائية وآلة الحالة لتنسيق مستوى الأسطول ومنطق إعادة المحاولة والتعويض لفشل أوامر المُشغِّل وتساقط المستشعر ومسارات التصعيد بإشراك الإنسان.
تقييم مستوى المسار لأنظمة الوكيل الإلكترونية-الفيزيائية — التقييم خطوةً بخطوة لدقة قراءة المستشعر وصحة أمر المُشغِّل وتماسك حالة الأسطول وسلامة تفاعل SCADA. تقييم حتمي قائم على التأكيدات لمكوّنات تفاعل الأنظمة الفيزيائية.
مكدّس الرصد الذي سيستخدمه مهندس الاستعداد وفريق العمليات — آثار المسار المرتبطة بأحداث الأنظمة الفيزيائية وقراءات المستشعر وأوامر المُشغِّل المُسجَّلة خطوةً بخطوة وفوارق حالة الأسطول وسجلات تفاعل SCADA.
الشركات المصنّعة التي تنشر وكلاء ذكاء الأسطول على خلايا الروبوتات أو ساحات AGV. شركات الطاقة التي تبني وكلاء مراقبة الشبكة المستقلين أو تفتيش محطة التحويل المجاورين لـSCADA. مشغّلو الخدمات اللوجستية الذين ينشرون أنظمة وكلاء رؤية المستودع وتحسين المسار. هذا ليس للفرق التي ليس لها خبرة إنتاج LLM أو ليس لها قاعدة بيانات أنظمة فيزيائية للتكامل معها.
ليس كثيراً. الإطار وسيلة — القرارات المهمة هي الطوبولوجيا وإدارة الحالة لتفاعلات الأنظمة الفيزيائية ومنهجية التقييم للمسارات التي تلمس الأنظمة الفيزيائية والرصد. في الأسبوع الأول أقيّم ما إذا كان إطارك الحالي الوسيلة الصحيحة لعبء العمل الإنتاجي الإلكتروني-الفيزيائي.
يُدمَج قفل الأمان لتفاعلات الأنظمة الفيزيائية في الطوبولوجيا في الأسبوع الأول لا كفكرة لاحقة. يُحدّد تصميم الطوبولوجيا صراحةً أي استدعاءات أدوات الوكيل تتطلّب تأكيداً بإشراك الإنسان (أوامر المُشغِّل فوق الحدّ وعمليات الكتابة في SCADA وقرارات إعادة توجيه الأسطول التي تؤثر على مناطق السلامة).
مهندس ذكاء اصطناعي أول متاح في عام 2026 على الأرجح لم يُسلّم نظام إنتاج متعدد الوكلاء يتفاعل مع الأنظمة الفيزيائية على نطاق واسع. أنا فعلت ذلك بمليون وسبعمائة ألف سطر من الكود.
لا. طوبولوجيا الوكيل وتسخير التقييم لمسارات الأنظمة الفيزيائية والرصد كل منها مشكلة ثلاثة أسابيع عند إنجازها بشكل جيد. للأنظمة الإلكترونية-الفيزيائية، ضغط مرحلة الطوبولوجيا يُنتج نظاماً يتعامل مع المسار السعيد وينهار عند أول عطل حقيقي في النظام الفيزيائي.
استكشف خدمات أخرى تُكمّل هذا العرض
٣٠ دقيقة. أشخّص وضعك وأخبرك بصراحة ما إذا كانت هذه الخدمة مناسبة — وإن لم تكن، فأيها مناسب.