这不是面向私营部门的领域专家 LLM Lab,而是它针对公共部门的改造版。一个部委、一个区域卫生主管机构、一个国防机构、一个国家铁路运营商,或一项智慧城市计划,无法使用标准交付方案,因为标准方案预设了公有云的灵活性和一份商业数据处理协议。公共部门变体则不然。交付的每一个阶段都运行在主权基础设施之上——Scaleway、OVHcloud、Bleu、S3NS,或采购方自有的本地 GPU。没有任何数据离开欧盟领土,关键路径上没有任何美国超大规模云服务商。训练语料在整个交付过程中以及之后都保留在境内。时间线延长至十二周,是因为其中四周用于主权审计、数据处理协议谈判、附件四(Annex IV)文档工作,以及私营部门交付所省略的本地环境部署。交付包的设计目标是可直接用于采购:模型、权重、评测框架、本地部署,以及完整的附件四(Annex IV)技术文档,作为单一的、符合采购要求的成果交付给采购方。私营部门的 Lab 更快、更便宜;如果你的使用场景能够接受公有云部署和商业 DPA,那么那项交付才是正确选择,而本项则不是。
采购关卡无法批准前沿 API 部署。标准的商业答案——封装一个前沿 API、签署一份 DPA、完成部署——在大多数欧盟成员国都无法通过公共部门采购。数据驻留、子处理者链条、传输影响评估,以及美国托管推理带来的 Schrems II 风险敞口,共同构成了采购机构无法承受的采购风险。项目卡在合规审查中,往往长达数个季度,而最终的结果要么是供应商不会接受的主权豁免条款,要么是在欧盟专属基础设施上彻底重新设计。从第一天起就在主权基础设施上启动,是更短的路径。
EU AI Act 的义务现已生效,文档负担是实实在在的。该法案下的高风险 AI 系统——涵盖了大多数部委、医疗和关键基础设施的使用场景——要求提供附件四(Annex IV)技术文档、合格评定、上市后监测,以及在欧盟数据库中的注册登记。在模型已完成训练并部署之后再回溯性地编制这些文档,代价高昂且往往不完整。从第一天起就将其整合进交付,成本明显更低,并且能产生一条经得起监管审计的文档轨迹。大多数私营部门交付并不需要这一点;公共部门交付几乎总是需要。
专有语料才是全部意义所在,而它无法离开司法管辖区。一个公共部门机构之所以要做领域模型,原因恰恰在于其语料——涉密部委档案、国家健康记录、国防技术手册、采购法判例、铁路运营遥测数据——正是那种不能为了训练而发送到美国云端的资产。一个通用 API 封装从来就用不上这些语料;在主权基础设施上微调的模型,是唯一能让该语料可部署的架构。如果语料可以离开司法管辖区,那么该项目很可能规模不够大或敏感度不够高,不足以证明采用主权变体的必要性,此时私营部门的 Lab 才是正确的交付方案。
内部团队在领域上很强,但在生产级 ML 上很薄弱。公共部门的技术团队通常在领域上造诣深厚——卫生部里的流行病学家、运营商里的铁路运行工程师、司法部门里的法律学者。他们很少在生产级 ML 上有深厚积累:微调流水线、评测框架构建、面向本地推理的量化,以及该法案现在所要求水准的附件四(Annex IV)文档。本交付的结构设计旨在尊重领域专长——采购方团队拥有语料和验收标准——同时提供该法案和采购关卡都要求的生产级 ML 层。
本交付是 Hyperion Lifecycle 的 ENGINEER 阶段,因主权审计、数据处理框架、本地环境部署,以及与技术工作并行推进的附件四(Annex IV)文档轨道而延长至十二周。交付在一份数据处理协议下运作,该协议为每一个阶段指定使用欧盟主权基础设施,并禁止在任何时点向任何非欧盟司法管辖区进行任何数据传输。采购方的采购和法务团队从第一周起即参与其中,而非在最后才介入。
书面的主权态势:哪些工作负载在何处运行、采用哪家供应商(Scaleway、OVHcloud、Bleu、S3NS,或本地)、数据将会和不会触及哪些司法管辖区、哪些子处理者在范围之内以及哪些被明确排除。数据处理协议与采购方法务团队共同起草并谈判,主权云或本地训练环境在该协议下完成部署。附件四(Annex IV)文档同步开始——技术文件、风险管理框架、数据治理章节。到第三周结束时,交付已具备一套采购可以背书的、获批的法律与基础设施态势。
依据相关行业法规——GDPR、公共记录法、国防保密分级、医疗数据治理——对专有语料的覆盖范围、质量、来源出处和使用的合法依据进行审计。评测框架依照采购方领域专家已签署确认的任务定义构建,并在法律允许的范围内,对照一个欧盟托管的前沿 API 运行基线以作比较。评估标准成为附件四(Annex IV)文档的一部分,而非独立的成果。
在 Llama 3、Mistral 和 Qwen 中进行基座模型选型——它们都是开放权重的,都可以在主权基础设施上合法部署,而无需引入会重新带来数据驻留问题的供应商关系。训练在已部署的主权 GPU 上运行。我们开展结构化实验——LoRA 对比全量微调、数据配比消融——并将每一次运行对照第五周的基线进行评估。附件四(Annex IV)技术文件随每一项重大决策更新:基座模型选择、数据配比、训练超参数、评估结果。该文档不是事后的重构,而是交付随其发生而留下的记录。
推理在采购方指定的基础设施上搭建——本地 GPU、专属的主权云租户,或面向涉密工作负载的气隙隔离环境。附件四(Annex IV)技术文档定稿、合格评定证据汇集、上市后监测计划编写完成,EU AI Act 数据库注册准备就绪。采购方内部团队会被带着走过评测框架、训练流水线和文档框架,以便他们能够运行该系统,并在模型重新训练时扩展文档。模型、权重、评测、部署,以及完整的合格包,作为单一的可直接采购的成果完成交付。
部委、区域政府、国家卫生主管机构、国防机构、铁路与交通运营商、能源电网运营商,以及智慧城市计划,它们拥有一个需要在某语料上训练模型的领域使用场景,而采购方在法律上或运营上无法将该语料发送到欧盟司法管辖区之外。采购机构的采购流程已将公有云或前沿 API 依赖识别为足以取消资格的风险。适用 EU AI Act 高风险分类、且附件四(Annex IV)技术文档必须达到监管机构可审计水准的项目。本项不适合那些使用场景能够接受公有云部署和商业数据处理协议的公共部门采购方——在那种风险态势下,私营部门的领域专家 LLM Lab 才是正确的切入点,时间线更短、成本更低。它同样不适合没有专有语料的项目;没有数据资产,主权交付便没有任何前沿 API 不能以一小部分成本匹敌的优势。
两者皆可,取决于采购方的运营态势。对于涉密工作负载、气隙隔离环境,以及采购方已经运营 GPU 集群的项目,本地是正确答案。主权云——Scaleway、OVHcloud、Bleu、S3NS——则适合那些希望获得欧盟司法管辖处理、又不想承担拥有 GPU 所带来的资本开支和运营负担的采购方。交付范围不会改变;只有第一周到第三周的部署工作会有所不同。主权态势文档会记录做出了哪种选择以及原因,用于采购和审计轨迹。
附件四(Annex IV)文件是 AI 专属的那一层;你的行业监管机构——医疗、金融、交通、国防——通常会有与之并存的额外文档和治理要求。本交付将附件四(Annex IV)文件构建到该法案的标准,并将数据治理、风险管理和评估章节构建为可在你的行业申报中复用,而非重新撰写。我不提供行业法律意见——那归你的内部合规法务负责——但我已为足够多的面向监管机构的申报构建过其底层的技术文档,因而知道监管机构真正想要的是什么证据,而这通常与指导文件所建议的不同。
本交付在采购方所要求的任何采购载体下运作——直接合同、DPS 框架、法国的 UGAP、欧盟范围的框架协议。商业结构不会改变技术范围或十二周的时间线,尽管采购流程本身可能会延长交付启动前的前置时间。如果采购方的采购团队没有现成且合适的载体,我可以与他们合作来构建一个;这正是 France Num AI 大使资质专门为之而设的用途之一。
DPA 明确涵盖了这一点。训练在欧盟主权基础设施上、在一份数据处理协议下进行,该协议规定了在整个交付期间针对个人数据的合法依据、保留期和访问控制。一份 DPIA 作为附件四(Annex IV)文档包的一部分编制,并与你的 DPO 一同审查。在语料需要于训练前进行假名化或脱敏之处——这种情况很常见——该工作属于第四周数据梳理阶段的一部分,而非事后补救。本交付的设计目标是产出一个符合 GDPR 的训练流程,而不仅仅是一个符合 GDPR 的已部署模型。
不需要。交付包刻意做到完整:权重、评测框架、训练流水线、部署操作手册,以及附件四(Annex IV)文档框架,全部归你运行。你的内部团队会在第十一周和第十二周被带着走过其中每一项,因此交接不是纸上谈兵。一些公共部门采购方会在一个明显更优的基座模型发布时——Llama 5、一个更强的 Mistral 版本——选择一项限定范围的刷新交付,但那是可选的,并单独定价。本交付干净利落地结束;它不会转变为一份无限期的保留协议。
30 分钟。我会诊断你的处境,坦诚告诉你这项服务是否合适——如果不合适,什么才合适。