اثنا عشر أسبوعاً. نموذج خبير بالمجال مُضبّط دقيقاً على كوربيوسات وزارية أو دفاعية أو صحية ومُنشر على بنية تحتية سيادية داخل الاتحاد الأوروبي، مع توثيق الملحق الرابع لقانون الاتحاد الأوروبي للذكاء الاصطناعي مُدمَج من اليوم الأول

LLM سيادي بالمجال للقطاع العام

2البناء12 أسبوعاً — جدول ثابت، بنية تحتية سيادية من اليوم الأول

هذا ليس مختبر LLM الخبير بالمجال للقطاع الخاص. بل هو تكييفه للقطاع العام. وزارة، أو هيئة صحية إقليمية، أو وكالة دفاع، أو مشغّل سكة حديد وطني، أو برنامج مدينة ذكية، لا تستطيع استخدام الارتباط القياسي لأنه يفترض مرونة السحابة العامة واتفاقية معالجة بيانات تجارية. متغيّر القطاع العام لا يفعل. تعمل كل مرحلة من الارتباط على بنية تحتية سيادية — Scaleway، OVHcloud، Bleu، S3NS، أو وحدات GPU داخلية للمشتري. لا تغادر أي بيانات أرض الاتحاد الأوروبي. لا يكون أي مزوّد خدمات ضخم أمريكي في المسار الحرج. تبقى كوربيوسات التدريب داخل البلاد طوال الارتباط وبعده. يمتدّ الجدول الزمني إلى اثني عشر أسبوعاً لأن أربعة منها هي تدقيق السيادة، والتفاوض على اتفاقية معالجة البيانات، وعمل توثيق الملحق الرابع، وتوفير البنية الداخلية التي يتخطاها ارتباط القطاع الخاص. تُبنى حزمة التسليم لتكون جاهزة للمشتريات: النموذج، والأوزان، وإطار التقييم، والنشر الداخلي، والتوثيق الفني الكامل وفق الملحق الرابع، تُسلَّم إلى المشتري كأداة واحدة متوافقة مع المشتريات. مختبر القطاع الخاص أسرع وأرخص؛ إذا كانت حالة استخدامك تتحمّل نشراً في السحابة العامة واتفاقية معالجة بيانات تجارية، فذلك الارتباط هو الخيار الصحيح وهذا ليس كذلك.

لماذا تتعثر مشاريع الذكاء الاصطناعي في القطاع العام قبل الوصول إلى الإنتاج

لا تستطيع جهة اعتماد المشتريات الموافقة على نشر يعتمد على واجهة برمجة تطبيقات لنموذج رائد (frontier API). والحل التجاري المعتاد — بناء غلاف برمجي حول واجهة نموذج رائد، وتوقيع اتفاقية لمعالجة البيانات (DPA)، ثم النشر — لا يجتاز إجراءات مشتريات القطاع العام في معظم الدول الأعضاء في الاتحاد الأوروبي. وتتضافر إقامة البيانات، وسلسلة المعالجين الفرعيين، وتقييم أثر نقل البيانات، والمخاطر القانونية المرتبطة بحكم Schrems II عند تشغيل الاستدلال على بنية مستضافة في الولايات المتحدة، لتشكل مخاطر مشتريات لا تستطيع الجهة المشترية تحملها. ويتعثر المشروع في مراجعة الامتثال، غالبًا على مدى عدة أرباع سنوية، ويكون الحل النهائي إما استثناءً متعلقًا بالسيادة لا يقبله المورد، أو إعادة تصميم كاملة على بنية تحتية محصورة داخل الاتحاد الأوروبي. والبدء على بنية تحتية سيادية منذ اليوم الأول هو المسار الأقصر.

تدخل التزامات قانون الاتحاد الأوروبي للذكاء الاصطناعي حيز التطبيق تدريجيًا بحسب الفئة، وعبء التوثيق على الأنظمة عالية المخاطر فعلي وملموس. فالأنظمة عالية المخاطر بموجب القانون — وهي فئة تندرج ضمنها حالات استخدام كثيرة في الوزارات والرعاية الصحية والبنية التحتية الحيوية — تتطلب الوثائق التقنية المنصوص عليها في الملحق الرابع، وتقييم المطابقة، ومراقبة ما بعد طرح النظام في السوق، والتسجيل في قاعدة بيانات الاتحاد الأوروبي. وإعداد هذه الوثائق بأثر رجعي، بعد تدريب النموذج ونشره، مكلف وغالبًا ما يظل ناقصًا. أما إدماج هذا التوثيق في نطاق العمل منذ اليوم الأول فأقل تكلفة بكثير، وينشئ سجلًا توثيقيًا يصمد أمام تدقيق الجهة التنظيمية. ومعظم مشاريع القطاع الخاص لا تحتاج إلى ذلك؛ أما مشاريع القطاع العام فتحتاج إليه في الغالب الأعم.

مجموعة البيانات المملوكة هي جوهر المشروع بأكمله، ولا يمكن نقلها خارج الولاية القضائية. فالسبب في لجوء جهة في القطاع العام أصلًا إلى تطوير نموذج متخصص في مجالها هو أن مجموعة البيانات — أرشيفات وزارية مصنفة أمنيًا، وسجلات صحية وطنية، وأدلة تقنية دفاعية، وسوابق في قانون المشتريات، وبيانات القياس التشغيلي عن بُعد للسكك الحديدية — هي تحديدًا الأصل الذي لا يمكن إرساله إلى سحابة أمريكية للتدريب. ولم يكن الغلاف العام لواجهة برمجة التطبيقات ليستفيد أصلًا من هذه المجموعة؛ فالنموذج الذي خضع للضبط الدقيق على بنية تحتية سيادية هو الخيار المعماري الوحيد الذي يجعل الاستفادة منها في نظام منشور أمرًا ممكنًا. وإذا أمكن نقل مجموعة البيانات خارج الولاية القضائية، فالأرجح أن المشروع ليس بالحجم أو الحساسية اللذين يبرران الصيغة السيادية، وأن Domain-Expert LLM Lab المخصص للقطاع الخاص هو صيغة التعاون الأنسب بدلًا منها.

يتمتع الفريق الداخلي بخبرة عميقة في المجال، لكن خبرته محدودة في تعلم الآلة ضمن بيئات الإنتاج. فعادة ما تكون الفرق التقنية في القطاع العام متعمقة في مجالها — كعلماء الأوبئة في وزارة الصحة، ومهندسي حركة القطارات لدى الجهة المشغلة، والباحثين القانونيين في وزارة العدل. لكنها نادرًا ما تمتلك عمقًا مماثلًا في تعلم الآلة ضمن بيئات الإنتاج: خطوط عمل الضبط الدقيق، وبناء منظومة التقييم (eval harness)، والتكميم للاستدلال داخل مقر الجهة، وإعداد وثائق الملحق الرابع بالمستوى الذي يفرضه القانون الآن. وقد صُمم نطاق العمل بما يحترم الخبرة المتخصصة في المجال — ففريق الجهة المشترية يملك مجموعة البيانات ويضع معايير القبول — مع توفير طبقة تعلم الآلة المهيأة لبيئات الإنتاج التي يتطلبها كل من القانون وجهة اعتماد المشتريات.

اثنا عشر أسبوعاً من بنية تحتية سيادية إلى نموذج جاهز للمشتريات

الارتباط هو مرحلة البناء والنشر، موسّعة إلى اثني عشر أسبوعاً بفضل تدقيق السيادة، وإطار معالجة البيانات، وتوفير البنية الداخلية، ومسار توثيق الملحق الرابع الذي يسير بالتوازي مع العمل التقني. يعمل الارتباط تحت اتفاقية معالجة بيانات تُحدّد بنية تحتية سيادية داخل الاتحاد الأوروبي لكل مرحلة وتحظر أي نقل بيانات إلى ولاية قضائية خارج الاتحاد في أي وقت. تُشارَك فرق المشتريات والشؤون القانونية لدى المشتري منذ الأسبوع الأول، لا في النهاية.

الأسابيع 1-3: تدقيق السيادة، وDPA، وتوفير البنية التحتية

موقف سيادة مكتوب: أي أحمال عمل تعمل أين، وأي مزوّد (Scaleway، OVHcloud، Bleu، S3NS، أو داخلي)، وأي ولايات قضائية ستلمسها البيانات ولن تلمسها، وأي معالجين ثانويين في النطاق وأيهم مستبعد تحديداً. تُصاغ اتفاقية معالجة البيانات ويُتفاوض عليها مع الفريق القانوني للمشتري، وتُوفَّر بيئة التدريب السحابية السيادية أو الداخلية بموجبها. يبدأ توثيق الملحق الرابع بالتوازي — الملف التقني، وإطار إدارة المخاطر، وقسم حوكمة البيانات. بنهاية الأسبوع الثالث يكون للارتباط موقف قانوني وبنية تحتية مُعتمد تستطيع المشتريات الدعم وراءه.

الأسبوعان 4-5: تنظيم البيانات وإطار التقييم

يُدقَّق في الكوربس الاختصاصي من حيث التغطية والجودة والمصدر والأساس القانوني للاستخدام بموجب التنظيم القطاعي ذي الصلة — GDPR، قانون السجلات العامة، تصنيف الدفاع، حوكمة البيانات الصحية. يُبنى إطار التقييم مقابل تعريف المهمة الذي وقّع عليه خبراء المجال لدى المشتري، ويُجرى مرجع — حيث يُسمح قانونياً — مقابل API حدودي مُستضاف في الاتحاد الأوروبي للمقارنة. تُصبح معايير التقييم جزءاً من توثيق الملحق الرابع، لا أداة منفصلة.

الأسابيع 6-9: الضبط الدقيق على بنية تحتية سيادية

اختيار النموذج الأساسي عبر Llama 3 وMistral وQwen — كلها مفتوحة الأوزان، وكلها قابلة للنشر قانونياً على بنية تحتية سيادية دون علاقة بمورد تُعيد إدخال مشكلة إقامة البيانات. يعمل التدريب على وحدات GPU السيادية المُوفَّرة. نُجري تجارب منظّمة — LoRA مقابل الضبط الكامل، واختلافات خلط البيانات — ونُقيّم كل تشغيل مقابل مرجع الأسبوع الخامس. يُحدَّث الملف الفني وفق الملحق الرابع مع كل قرار جوهري: خيار النموذج الأساسي، وخليط البيانات، ومعاملات التدريب التشعّبية، ونتائج التقييم. التوثيق ليس إعادة بناء بأثر رجعي؛ بل سجل الارتباط وهو يحدث.

الأسابيع 10-12: النشر الداخلي، وتوثيق المطابقة، والتسليم

يُقام الاستدلال على البنية التحتية المحدّدة للمشتري — وحدات GPU داخلية، أو مستأجر مخصّص في سحابة سيادية، أو بيئة معزولة عن الشبكة لأحمال العمل المصنّفة. يُستكمل التوثيق الفني وفق الملحق الرابع، وتُجمَّع أدلة تقييم المطابقة، وتُكتب خطة المراقبة بعد طرح السوق، ويُعدّ التسجيل في قاعدة بيانات قانون الاتحاد الأوروبي للذكاء الاصطناعي. يُسار بالفريق الداخلي للمشتري عبر إطار التقييم، وخط أنابيب التدريب، وإطار التوثيق حتى يستطيعوا تشغيل النظام وتوسيع التوثيق عند إعادة تدريب النموذج. تُسلَّم النموذج والأوزان والتقييم والنشر وحزمة المطابقة الكاملة كأداة واحدة جاهزة للمشتريات.

ما الذي يُنتجه الارتباط السيادي

12 weeks

من الانطلاق إلى نموذج مُنشر جاهز للمشتريات مع حزمة الملحق الرابع

نقل بيانات خارج ولاية الاتحاد الأوروبي في أي مرحلة

Annex IV

توثيق قانون الاتحاد الأوروبي للذكاء الاصطناعي مُدمج، لا مُلحق لاحقاً

نموذج الارتباط

المدة

12 أسبوعاً — جدول ثابت، بنية تحتية سيادية من اليوم الأول

الصيغة

تدقيق السيادة وDPA ← تنظيم البيانات والتقييم ← الضبط الدقيق على وحدات GPU السيادية ← النشر الداخلي وحزمة مطابقة الملحق الرابع

ما الذي تحصل عليه

نموذج سيادي متخصص في المجال — نموذج مفتوح الأوزان (open-weight) خضع للضبط الدقيق (Llama 3 أو Mistral أو Qwen)، يُدرب ويُنشر بالكامل على بنية تحتية سيادية داخل الاتحاد الأوروبي، مع الأوزان، وشيفرة التدريب، ووصفة التدريب الكاملة

وثيقة وضع السيادة الرقمية — بيان مكتوب يوضح أعباء العمل التي نُفذت لدى كل مزود، والولايات القضائية التي شملتها المعالجة، والمعالجين الفرعيين الذين شملهم النطاق والذين استُبعدوا منه، لأغراض التدقيق ومراجعة المشتريات

Annex IV Technical File — EU AI Act conformity documentation built during the engagement: technical description, risk management framework, data governance, evaluation results, post-market monitoring plan

النشر داخل مقر الجهة — تشغيل الاستدلال على البنية التحتية التي تحددها الجهة المشترية (وحدات معالجة رسومية داخل مقر الجهة، أو حيز مستأجر في سحابة سيادية، أو بيئة معزولة عن الشبكات)، مع أدلة تشغيل يستطيع فريق عمليات الجهة المشترية استخدامها

اتفاقية معالجة البيانات — اتفاقية معالجة بيانات (DPA) يجري التفاوض عليها وإبرامها، وتحدد المعالجة السيادية لمجموعة البيانات داخل الاتحاد الأوروبي طوال مدة العمل وبعد انتهائها

منظومة التقييم — حزمة تقييم بمستوى إنتاجي، معايرة وفق معايير الاعتماد النهائي التي يضعها خبراء المجال لدى الجهة المشترية، وقابلة للاستخدام في دورات إعادة التدريب المستقبلية وفي عمليات تدقيق الجهات التنظيمية

حزمة تقييم المطابقة — مجموعة الأدلة المجمعة التي يحتاج إليها فريق الامتثال لدى الجهة المشترية للتسجيل في قاعدة بيانات الاتحاد الأوروبي بموجب قانون الذكاء الاصطناعي، ولأي مراجعة تجريها جهة تنظيمية قطاعية

مصمّم لمشتري القطاع العام في الاتحاد الأوروبي الذين لديهم تفويض سيادي وكوربس اختصاصي

الوزارات، والحكومات الإقليمية، والهيئات الصحية الوطنية، ووكالات الدفاع، ومشغّلو السكك الحديدية والنقل، ومشغّلو شبكات الطاقة، وبرامج المدن الذكية، التي لها حالة استخدام اختصاصية تتطلّب نموذجاً مُدرَّباً على كوربس لا يستطيع المشتري قانونياً أو تشغيلياً إرساله خارج ولاية الاتحاد الأوروبي. السلطات المشترية التي حدّدت عملية مشترياتها بالفعل تبعية السحابة العامة أو API الحدودي كمخاطرة مُقصية. البرامج التي تنطبق عليها تصنيفات المخاطر العالية لقانون الاتحاد الأوروبي للذكاء الاصطناعي وحيث يجب إنتاج توثيق الملحق الرابع الفني بمعيار قابل للتدقيق من جهة تنظيمية. هذا ليس لمشتري القطاع العام الذين تتحمّل حالة استخدامهم نشراً في السحابة العامة واتفاقية معالجة بيانات تجارية — فمختبر LLM الخبير بالمجال للقطاع الخاص هو نقطة الدخول الصحيحة عند ذلك الموقف من المخاطر، بجدول زمني أقصر وتكلفة أقل. وهذا ليس أيضاً للبرامج التي ليس لديها كوربس اختصاصي؛ دون أصول البيانات، لا يوجد للارتباط السيادي ميزة لا يستطيع API حدودي مطابقتها بجزء من التكلفة.

الاعتمادات التي يحتاجها مشتري القطاع العام فعلاً

سفير الذكاء الاصطناعي للحكومة الفرنسية — اعتماد مهم لمشتريات القطاع العام، حيث يحتاج المشتري إلى طرف مقابل سبق له العمل داخل النظام الإداري الفرنسي.Forbes Technology Council — مادة منشورة حول استراتيجية النماذج مفتوحة الأوزان وسيادة الاتحاد الأوروبي في مجال الذكاء الاصطناعي. وتنطلق الكتابة المنشورة من الإطار نفسه الذي يقوم عليه نطاق العمل.ملف على Hugging Face — HyperionConsultingIO — يضم مواد تقنية متاحة للعامة تُظهر ممارسة الضبط الدقيق للنماذج مفتوحة الأوزان. فمعمارية الأوزان المفتوحة هي التي تجعل النشر السيادي ممكنًا؛ أما النموذج الرائد مغلق الأوزان فلا يمكن تشغيله على عنقود حوسبة محلي معزول عن الشبكات من دون علاقة تعاقدية مع مورد تقوض وضع السيادة الرقمية.مشاريع ذكاء اصطناعي داخلية بُنيت بنماذج مفتوحة مضبوطة — سجل التنفيذ وراء مشاركة القطاع العام. النسخة السيادية تعيد استخدام نفس منهجية الضبط الدقيق على بنية تحتية سيادية، وليست منهجية مختلفة.

الأسئلة الشائعة

أي منهما، حسب الموقف التشغيلي للمشتري. الداخلي هو الجواب الصحيح لأحمال العمل المصنّفة، والبيئات المعزولة، والبرامج التي يُشغّل فيها المشتري بالفعل عنقود GPU. السحابة السيادية — Scaleway أو OVHcloud أو Bleu أو S3NS — هي الجواب الصحيح للمشترين الذين يريدون معالجة داخل ولاية الاتحاد الأوروبي دون النفقات الرأسمالية والعبء التشغيلي لامتلاك وحدات GPU. لا يتغيّر نطاق الارتباط؛ يتغيّر فقط عمل التوفير في الأسابيع 1-3. تُوثّق وثيقة موقف السيادة أي خيار اتُّخذ ولماذا، لمسار المشتريات والتدقيق.

ملف الملحق الرابع هو الطبقة الخاصة بالذكاء الاصطناعي؛ ستكون لجهتك التنظيمية القطاعية — الصحة، والمالية، والنقل، والدفاع — عادةً متطلبات توثيق وحوكمة إضافية تقف بجانبه. يبني الارتباط ملف الملحق الرابع وفق معيار القانون، وتُهيكَل أقسام حوكمة البيانات وإدارة المخاطر والتقييم لإعادة استخدامها في تقديمك القطاعي بدلاً من إعادة كتابتها. لا أُقدّم مشورة قانونية قطاعية — مستشار الامتثال الداخلي لديك يتولى ذلك — لكنني بنيت التوثيق الفني الذي يكمن تحت ما يكفي من التقديمات الموجّهة للجهات التنظيمية لأعرف ما الأدلة التي تريدها الجهات التنظيمية فعلاً، وهي عادةً مختلفة عمّا تقترحه وثائق التوجيه.

يسير الارتباط تحت أي وسيلة مشتريات يتطلبها المشتري — عقد مباشر، إطار DPS، UGAP في فرنسا، اتفاقيات إطارية على نطاق الاتحاد الأوروبي. لا يُغيّر الهيكل التجاري النطاق التقني ولا الجدول الزمني المحدّد باثني عشر أسبوعاً، رغم أن عملية المشتريات نفسها قد تُمدّد الوقت الممهد قبل بدء الارتباط. حيث لا تكون لدى فريق مشتريات المشتري وسيلة قائمة مناسبة، يمكنني العمل معهم لهيكلة واحدة.

تُغطّيها DPA صراحة. يحدث التدريب على بنية تحتية سيادية داخل الاتحاد الأوروبي بموجب اتفاقية معالجة بيانات تُحدّد الأساس القانوني والاحتفاظ وضوابط الوصول للبيانات الشخصية طوال الارتباط. يُنتَج تقييم أثر حماية البيانات كجزء من حزمة توثيق الملحق الرابع ويُراجَع مع DPO لديك. حيث يتطلّب الكوربس إخفاء الهوية أو الحجب قبل التدريب — وهو ما يتطلّبه غالباً — يكون ذلك العمل جزءاً من مرحلة تنظيم البيانات في الأسبوع الرابع، لا فكرة لاحقة. يُصمَّم الارتباط لإنتاج عملية تدريب متسقة مع GDPR، لا مجرد نموذج مُنشَر متسق مع GDPR.

لا. حزمة التسليم مكتملة عمداً: الأوزان، وإطار التقييم، وخط أنابيب التدريب، وكتاب نشر التشغيل، وإطار توثيق الملحق الرابع، كلها لك لتشغيلها. يُسار بفريقك الداخلي عبر كل منها في الأسبوعين الحادي عشر والثاني عشر حتى لا يكون التسليم نظرياً. يختار بعض مشتري القطاع العام ارتباط تحديث مُحدّد النطاق عند إطلاق نموذج أساسي أفضل جوهرياً — Llama 5، أو إصدار Mistral أقوى — لكن ذلك اختياري ومُسعّر بشكل منفصل. يخرج الارتباج نظيفاً؛ لا يتحوّل إلى عقد تحفّظي غير محدّد.

جرّب بنفسك

احسب عائد استثمارك

اطّلع على التوفير المقدّر في دقيقتين

تحقق من جاهزيتك لـ AI

احصل على درجة جاهزية مخصصة

اختبر AI لدينا

6 عروض تجريبية مباشرة، بدون التزام

لنقرر في مكالمة واحدة ما إذا كان بإمكاني المساعدة

٣٠ دقيقة. أشخّص وضعك وأخبرك بصراحة ما إذا كانت هذه الخدمة مناسبة — وإن لم تكن، فأيها مناسب.