Lifecycle stage — Build
هذا ليس مختبر LLM الخبير بالمجال المخصّص. بل هو تكييفه للشركات الصغيرة والمتوسطة. لا ينبغي لشركة صغيرة أو متوسطة لديها حالة استخدام عمودية محدّدة — مراجعة العقود، وإثراء كتالوج المنتجات، وتصنيف المصاريف — أن تدفع مقابل ثمانية أسابيع من البحث المخصّص عندما يكون خط أنابيب ذلك القطاع العمودي مبنياً بنسبة 80% بالفعل. يستخدم الارتباط المُعبّأ نموذجاً أساسياً مُنتقى، وطبقة استرجاع، وإطار تقييم جمّعته Hyperion بالفعل لمجموعة صغيرة من القطاعات العمودية المدعومة، ويُطبّقها على بياناتك الاختصاصية. تحتفظ بالأوزان وإطار التقييم؛ تحتفظ Hyperion بقالب خط الأنابيب. النتيجة نموذج خبير بالمجال يعمل على بنيتك التحتية أو مستأجر في سحابة سيادية، برسم ثابت لكل قطاع عمودي، يُسلَّم في أربعة أسابيع بدلاً من ثمانية. القطاعات العمودية المدعومة اليوم ضيّقة بالتصميم — استخراج البنود القانونية، وإثراء كتالوج التجزئة، واستخراج فواتير المحاسبة — لأن قرارات التقدير التي تجعل عرضاً مُعبّأً قابلاً للبقاء تتطلّب أن يكون نفس خط الأنابيب قد تم التحقق منه عبر عدة عملاء قبل أن يُصبح منتجاً. خارج تلك القطاعات، فإن مختبر المخصّص هو نقطة الدخول الصحيحة.
The bespoke engagement is priced for enterprises and you are not one. Eight-week fine-tuning programs with embedded ML engineers are correctly priced for companies with seven-figure AI budgets and a real ML team to absorb the knowledge transfer. For an SME with a single vertical use case and a two-person technical team, the bespoke engagement is overkill. What the SME actually needs is the 20% of the work that is unique to its data, riding on the 80% that is common across businesses in the same vertical. That economics only works if the common 80% is already built.
Frontier APIs keep getting better on general tasks and worse on yours. GPT-4 and Claude improve on broad benchmarks every quarter, and your specialist task — contract clause extraction in French commercial law, SKU-level catalogue enrichment for fashion retail, VAT-aware expense categorisation for Belgian accounting — does not move with them. You are paying a premium for general intelligence that was never going to win on your narrow task, and the gap between 'generic API output' and 'output your domain expert would sign off on' is not closing. At some point the honest answer is that your vertical requires a specialist model and the generalist API was always a stopgap.
Your team cannot build a fine-tuning pipeline from scratch and it would be a bad use of their time if they could. Fine-tuning a model correctly — data curation, base model selection, eval harness construction, quantization trade-offs, deployment — is a multi-week workstream for an experienced ML engineer. If you have that engineer, they should be building your product. If you do not, the tutorials will get you a model that looks trained but loses the eval, and you will not know why. The packaged offering collapses the multi-week workstream into a four-week fixed-fee engagement with a pre-validated recipe for your specific vertical.
You need the model to run somewhere that is not a frontier-API provider. Your clients — law firms, accountancies, regional retailers — have data residency concerns, client-confidentiality obligations, or sectoral regulation that makes sending their data to a US hyperscaler a commercial problem even when it is technically allowed. A model you own, deployed on your infrastructure or a European sovereign tenant, is a structural answer to those concerns in a way that a frontier-API vendor contract never will be. For an SME, that posture is a genuine commercial differentiator, not a compliance checkbox.
الارتباط هو مرحلة ENGINEER من Hyperion Lifecycle، مضغوطة إلى أربعة أسابيع بفضل خط الأنابيب المبني مسبقاً لقطاعك العمودي المدعوم. يُقدّم فريقك البيانات الاختصاصية وخبير الموضوع الذي يُقيّم المخرج. خط الأنابيب — النموذج الأساسي، والاسترجاع، وقالب التقييم، ومكدس الاستدلال — مجمّع بالفعل. تؤكّد المحادثة الأولى أن قطاعك العمودي ضمن المجموعة المدعومة؛ إن لم يكن، فمختبر المخصّص هو الارتباط الصحيح ولا نبدأ هذا.
تنزل بياناتك إلى خط الأنابيب. نُدقّق في التغطية والترخيص والجودة مقابل متطلبات القطاع العمودي المُعبّأ — قانوني، تجزئة، محاسبة. يُجسّد إطار التقييم مقابل تعريف مهمة قطاعك العمودي ويُجرى مرجع على API الحدودي القائم، حتى نعرف كيف يبدو الفوز قبل بدء أي تدريب. إذا كانت تغطية البيانات ضعيفة أو تعريف المهمة يقع خارج القطاع العمودي المدعوم، نتوقّف هنا ونُعيد الرصيد؛ العرض المُعبّأ لا يعمل إلا عندما تكون الملاءمة حقيقية.
النموذج الأساسي المختار مسبقاً لقطاعك العمودي — متغيّر محدّد من Llama 3 أو Mistral أو Qwen مختار لملف هذه المهمة — يُضبَّط دقيقاً على بياناتك المُنظّمة باستخدام وصفة خط الأنابيب. نُشغّل إطار التقييم كل يوم من الأسبوع ونكرّر على خليط البيانات حيث تتطلّب الأرقام ذلك. بنهاية الأسبوع الثاني إما يتفوّق النموذج على مرجع API الحدودي في تقييمك الخاص بالمهمة أو نعود إلى أفضل تركيبة بعدها ونُوثّق السقف بصراحة. العرض المُعبّأ لا يستحق الدفع إلا إذا فاز النموذج فعلاً.
يُقام الاستدلال حيث ستُشغّله فعلاً — مستأجر سحابة سيادية، أو GPU داخلي صغير، أو مزوّد استدلال مخصّص يُبقي البيانات في ولايتك القضائية. غلاف الكمون والتكلفة ثابت للقطاعات العمودية المُعبّأة، فنُعيّر مقابل هدف معروف بدلاً من استكشاف كامل فضاء التصميم. يُوقّع خبير الموضوع من جانبك على مخرج النموذج المُنشر عبر عيّنة من حالات إنتاج حقيقية؛ هذا التوقيع هو معيار القبول.
يُسار بفريقك التقني المكوّن من شخصين عبر وصفة التدريب، وإطار التقييم، وكتاب نشر التشغيل. النموذج، والأوزان، وخط أنابيب البيانات، والتقييم — كلها لك تحتفظ بها. قالب خط الأنابيب — السقالة عبر العملاء التي جعلت جدول الأربعة أسابيع ممكناً — يظل ملكية فكرية لـ Hyperion؛ أنت تدفع مقابل التطبيق المتخصّص له على بياناتك، لا مقابل الإطار الأساسي. عندما يُطلق نموذج أساسي أفضل، يستطيع فريقك إعادة تشغيل الوصفة على النموذج الجديد في أقل من أسبوع دون ارتباط إضافي.
الشركات الصغيرة والمتوسطة في الخدمات القانونية، أو التجزئة، أو المحاسبة — القطاعات العمودية الثلاثة التي يدعمها خط الأنابيب المُعبّأ اليوم — التي لها مهمة محدّدة (استخراج بنود العقود، وإثراء الكتالوج، وتصنيف الفواتير أو المصاريف) ومجموعة بيانات اختصاصية كبيرة بما يكفي على الأقل للضبط الدقيق عليها. الفرق التي وصل فيها حلّ API الحدودي القائم إلى هضبة على جودة المجال وتكون التكلفة ملموسة عند الحجم الحالي. الشركات التي تجعل فيها إقامة البيانات أو سرّية العميل نموذجاً مستضافاً ذاتياً أو سحابة سيادية تفضيلاً تجارياً حقيقياً بدلاً من تمرين وضع علامات. هذا ليس للشركات الصغيرة والمتوسطة التي تقع حالة استخدامها خارج القطاعات العمودية المدعومة — فمختبر LLM الخبير بالمجال المخصّص هو نقطة الدخول الصحيحة لتلك الارتباطات، بجدوله الزمني وتسعيره الخاصين. وهذا ليس أيضاً للفرق التي ليست لديها بيانات اختصاصية؛ دون أصول البيانات، لا يوجد لنموذج عمودي مُضبَّط دقيقاً ميزة دائمة على API الحدودي، وتدقيق الجاهزية هو المحادثة الأولى الصحيحة.
ليس بوصفه العرض المُعبّأ، لا. القطاعات العمودية الثلاثة المدعومة مدعومة لأن خط الأنابيب تم التحقق منه عبر ما يكفي من الارتباطات السابقة ليُسعَّر كمنتج. خارج تلك القطاعات، فإن مختبر LLM الخبير بالمجال المخصّص هو الارتباط الصحيح — ثمانية أسابيع، ضبط دقيق مخصّص، مُسعَّر وفقاً لذلك. إذا كانت مهمتك قريبة من قطاع عمودي مدعوم لكن ليست داخله تماماً، فالمحادثة الأولى مجانية وسأخبرك بصراحة ما إذا كان خط الأنابيب المُعبّأ ينطبق أم أن المختبر المخصّص هو الملاءمة الصحيحة.
لأن خط الأنابيب المبني مسبقاً لقطاعك العمودي — اختيار النموذج الأساسي، وطبقة الاسترجاع، وقالب التقييم، ومكدس الاستدلال — مُجمّع بالفعل من ارتباطات سابقة. في المختبر المخصّص، تُتَّخذ تلك القرارات طازجة لكل عميل، وهو ما يُسعَّر بشكل صحيح للمؤسسات ذات المهام الجديدة. في العرض المُعبّأ، يُعاد استخدام تلك القرارات، وهو ما يُسعَّر بشكل صحيح للشركات الصغيرة والمتوسطة التي تشبه مهامها الأنماط التي بُني عليها خط الأنابيب. الأسابيع الأربعة التي تدفع مقابلها هي التطبيق المتخصّص على بياناتك، والتقييم مقابل مرجعك، والنشر على بنيتك التحتية — لا الإطار الأساسي.
نكتشف ذلك في الأسبوع الثاني، وإذا كانت الإجابة لا، ينتهي الارتباط عند تلك النقطة ويُعاد لك الرصيد. خط الأنابيب المبني مسبقاً لقطاع عمودي مدعوم له معدّل نجاح معروف على بيانات تمثيلية؛ تقييم الأسبوع الثاني هو صراحةً نقطة التحقق حيث نؤكّد أن النمط يصمد لبياناتك المحدّدة. إذا كانت البيانات رقيقة جداً، أو كانت المهمة خارج النطاق المُتحقَّق منه لخط الأنابيب، أو كان API الحدودي بالفعل عند السقف الذي تسمح به مهمتك، سأقول ذلك كتابياً. العرض المُعبّأ مُسعَّر على افتراض أن الملاءمة حقيقية؛ عندما لا تكون كذلك، النتيجة الصادقة هي التوقّف بدلاً من فرض نتيجة.
عادةً لا. للقطاعات العمودية المُعبّأة، يكون الاستدلال صغيراً بما يكفي للعمل على GPU متواضع في مستأجر سحابة سيادية أوروبية — Scaleway أو OVHcloud أو ما شابه — أو على مزوّد استدلال مخصّص مثل Together أو Fireworks يُبقي البيانات في المنطقة. يُجرى التدريب على وحدات GPU مؤجّرة ولا يتطلّب شراء عتاد. يشمل التسعير برسم ثابت غلاف تكلفة للاستدلال بأحجام الشركات الصغيرة والمتوسطة النموذجية؛ تدفع أحمال العمل الأثقل النموذج نحو وحدات GPU داخلية، لكن ذلك استثناء لا الافتراضي.
ليس عادةً. يمتلك فريقك إطار التقييم، وخط أنابيب البيانات، والوصفة، ما يعني أن إعادة تشغيل التدريب على نموذج أساسي جديد — Llama 5 عندما يأتي، أو إصدار Mistral جديد، أو متغيّر Qwen أقوى — هو تمرين داخلي يُشغّله فريقك دون ارتباط إضافي من Hyperion. تُدخل معظم الشركات الصغيرة والمتوسطة إعادة التدريب داخلياً بعد الارتباط الأول؛ يختار البعض تشغيل ارتباط تحديث قصير مع Hyperion عندما يكون النموذج الأساسي الجديد أفضل جوهرياً، لكن ذلك اختياري ومُسعَّر بشكل منفصل. موقف الملكية مقصود: العرض المُعبّأ ارتباط واحد، لا عقد تحفّظي.
٣٠ دقيقة. أشخّص وضعك وأخبرك بصراحة ما إذا كانت هذه الخدمة مناسبة — وإن لم تكن، فأيها مناسب.