Lifecycle stage — Build
これは民間セクターのDomain-Expert LLM Labではありません。その公共セクター適応版です。省庁、地域保健当局、防衛機関、国鉄運営者、またはスマートシティプログラムは標準エンゲージメントを使えません——標準エンゲージメントはパブリッククラウドの柔軟性と商業データ処理契約を前提としているからです。公共セクター版はそうではありません。エンゲージメントの各フェーズはソブリンインフラ——Scaleway、OVHcloud、Bleu、S3NS、または購入者独自のオンプレミスGPU——上で実行されます。データはEU領土を離れません。US ハイパースケーラーはクリティカルパスにいません。訓練コーパスはエンゲージメント中およびその後も国内に留まります。タイムラインは12週間に延長されます——そのうち4週間は、民間セクターエンゲージメントが飛ばすソブリンティ監査、データ処理契約交渉、付属書IV文書作業、オンプレミス調達だからです。成果物パックは調達対応可能に構築されます: モデル、ウェイト、評価ハーネス、オンプレミスデプロイメント、そして完全な付属書IV技術文書が、単一の調達互換アーティファクトとして購入者に引き渡されます。民間セクターのLabはより速く安価です——ユースケースがパブリッククラウドデプロイメントと商業DPAを許容できる場合、そのエンゲージメントが正しい選択であり、こちらはそうではありません。
調達ゲートはフロンティアAPIデプロイメントを承認できません。標準的な商業的回答——フロンティアAPIをラップし、DPAに署名し、デプロイする——は、ほとんどのEU加盟国で公共セクター調達をクリアしません。データレジデンシー、副処理者チェーン、転送影響評価、USホスト推論でのSchrems II露出が組み合わさって、購入機関が吸収できない調達リスクになります。プロジェクトはコンプライアンスレビューで停滞し、しばしば四半期単位で、最終的な答えはベンダーが受け入れないソブリンティカーブアウトか、EU専用インフラでの完全な再設計のいずれかです。初日からソブリンインフラで始めるのが短い道です。
EU AI法義務は現在運用可能で、文書化負担は現実的です。同法の高リスクAIシステム——ほとんどの省庁、医療、クリティカルインフラのユースケースをカバー——は付属書IV技術文書、適合性評価、市販後モニタリング、EUデータベースへの登録を要求します。モデルが訓練・デプロイされた後に遡及的にその文書を作成するのは高価で、しばしば不完全です。初日からエンゲージメントに統合することで実質的に安く、規制当局の監査を生き延びる文書証跡が生み出されます。ほとんどの民間セクターエンゲージメントではこれは不要です——公共セクターエンゲージメントではほぼ常に必要です。
独自コーパスこそポイントで、法域を離れることができません。公共セクター機関がドメインモデルを行う理由そのものは、コーパス——機密省庁アーカイブ、国民健康記録、防衛技術マニュアル、調達法判例、鉄道運用テレメトリ——が訓練のためにUSクラウドに送れない資産だからです。汎用APIラッパーはこのコーパスを使うことは決してありません——ソブリンインフラ上のファインチューニング済みモデルが、コーパスをデプロイ可能にする唯一のアーキテクチャです。コーパスが法域を離れることができる場合、プロジェクトはおそらくソブリン版を正当化するほど大きくも繊細でもなく、民間セクターLabが代わりに正しいエンゲージメントです。
社内チームはドメインに強いが本番MLには薄いです。公共セクター技術チームは通常ドメインに深い——保健省の疫学者、運営者の鉄道交通エンジニア、司法省の法学者。本番MLには深くないことがほとんどです: ファインチューニングパイプライン、評価ハーネス構築、オンプレミス推論向け量子化、同法が今や要求するレベルの付属書IV文書。エンゲージメントは、ドメイン専門性を尊重する形で構造化されています——購入者のチームがコーパスと受け入れ基準を所有する——一方で、同法と調達ゲートの両方が要求する本番ML層を提供します。
エンゲージメントはLifecycleのENGINEERフェーズで、ソブリンティ監査、データ処理フレームワーク、オンプレミス調達、技術作業と並行して走る付属書IV文書トラックによって12週間に延長されます。エンゲージメントは、全フェーズでEUソブリンインフラを指定し、いかなる時点でも非EU法域へのデータ転送を禁止するデータ処理契約の下で運用されます。購入者の調達および法務チームは、終わりではなく第1週から関与します。
書面のソブリンティ姿勢: どのワークロードがどこで動作するか、どのプロバイダー(Scaleway、OVHcloud、Bleu、S3NS、またはオンプレミス)、データがどの法域に触れどこに触れないか、どの副処理者が範囲内でどれが具体的に除外されるか。データ処理契約は購入者の法務チームと起草・交渉され、その下でソブリンクラウドまたはオンプレミス訓練環境が調達されます。付属書IV文書は並行して開始します——技術ファイル、リスク管理フレームワーク、データガバナンスセクション。第3週末までに、エンゲージメントは調達が支持できる承認済みの法的・インフラ姿勢を持ちます。
独自コーパスを、関連するセクター規制——GDPR、公文書法、防衛分類、医療データガバナンス——下での使用の適法根拠、カバレッジ、品質、来歴について監査します。評価ハーネスは購入者のドメインエキスパートが承認したタスク定義に対して構築され、ベースラインは——法的に許される場合——比較のためEUホストのフロンティアAPIに対して実行されます。評価基準は別アーティファクトではなく付属書IV文書の一部になります。
Llama 3、Mistral、Qwenにわたるベースモデル選定——すべてオープンウェイトで、データレジデンシー問題を再導入するベンダー関係なしにソブリンインフラに法的にデプロイ可能。訓練は調達されたソブリンGPU上で実行されます。構造化実験——LoRA対フルファインチューン、データミックスアブレーション——を実行し、すべての実行を第5週のベースラインに対して評価します。付属書IV技術ファイルは、重要な判断のたびに更新されます: ベースモデル選定、データミックス、訓練ハイパーパラメータ、評価結果。文書は事後再構成ではなく——エンゲージメントが起きている時の記録です。
推論は購入者の指定インフラ——オンプレミスGPU、専用ソブリンクラウドテナント、または機密ワークロード向けエアギャップ環境——で立ち上げられます。付属書IV技術文書が最終化され、適合性評価エビデンスが組み立てられ、市販後モニタリング計画が書かれ、EU AI法データベース登録が準備されます。購入者の社内チームは評価ハーネス、訓練パイプライン、文書フレームワークを歩かされ、システムを運用し、モデル再訓練時に文書を拡張できるようになります。モデル、ウェイト、評価、デプロイメント、完全な適合性パックが、単一の調達対応可能アーティファクトとして引き渡されます。
購入者がEU法域外に送ることが法的または運用的に不可能なコーパスで訓練されたモデルを要するドメインユースケースを持つ、省庁、地域政府、国民健康当局、防衛機関、鉄道・交通運営者、エネルギーグリッド運営者、スマートシティプログラム。調達プロセスが既にパブリッククラウドまたはフロンティアAPI依存を失格リスクとして特定した購入機関。EU AI法高リスク分類が適用され、付属書IV技術文書が規制当局が監査できる基準で作成される必要があるプログラム。ユースケースがパブリッククラウドデプロイメントと商業データ処理契約を許容できる公共セクター購入者向けではありません——そのリスク姿勢での正しい入口は、より短いタイムラインとより低コストの民間セクターDomain-Expert LLM Labです。独自コーパスを持たないプログラム向けでもありません——データ資産なしでは、ソブリンエンゲージメントはフロンティアAPIが数分の一のコストで提供できる優位性を持ちません。
どちらでも、購入者の運用姿勢によります。オンプレミスは機密ワークロード、エアギャップ環境、既にGPUクラスタを運営する購入者向けのプログラムに正しい答えです。ソブリンクラウド——Scaleway、OVHcloud、Bleu、S3NS——は、GPUを所有するCapExと運用負担なしにEU法域的取り扱いを望む購入者向けの正しい答えです。エンゲージメントスコープは変わらず——第1〜3週の調達作業のみが変わります。ソブリンティ姿勢ドキュメントは、調達および監査証跡のため、どの選択がなぜ行われたかを記録します。
付属書IVファイルはAI固有の層です——セクター規制当局——医療、金融、交通、防衛——は通常、それと並ぶ追加の文書およびガバナンス要件を持ちます。エンゲージメントは付属書IVファイルを同法の基準で構築し、データガバナンス、リスク管理、評価セクションは書き直すのではなくセクター提出書類で再利用されるよう構造化されます。セクター法的助言は提供しません——社内コンプライアンス顧問がそれを所有します——しかし、規制当局向け提出書類の下に入る技術文書を十分に構築してきたので、規制当局が実際に何のエビデンスを望むかを知っています——ガイダンス文書が示唆するものとしばしば異なります。
エンゲージメントは購入者が要求する調達ビークル下で実行されます——直接契約、DPSフレームワーク、フランスのUGAP、EU全体のフレームワーク合意。商業構造は技術スコープまたは12週間のタイムラインを変えませんが、調達プロセス自体はエンゲージメント開始前のリードタイムを延ばす可能性があります。購入者の調達チームが適合する既存ビークルを持たない場合、一緒に構造化する作業ができます——これはFrance Num AIアンバサダー資格が特に構築されたものの一部です。
DPAが明示的にカバーします。訓練は、エンゲージメント全体を通じて個人データの適法根拠、保持、アクセス制御を指定するデータ処理契約下で、EUソブリンインフラ上で行われます。DPIAは付属書IV文書パックの一部として生み出され、御社DPOとレビューされます。コーパスが訓練前に仮名化またはリダクションを要求する場合——しばしばそうです——その作業は後知恵ではなく第4週のデータキュレーションフェーズの一部です。エンゲージメントは、GDPR準拠のデプロイ済みモデルだけでなく、GDPR準拠の訓練プロセスを生み出すよう設計されています。
いいえ。成果物パックは意図的に完全です: ウェイト、評価ハーネス、訓練パイプライン、デプロイランブック、付属書IV文書フレームワークはすべて御社が運用するものです。社内チームは第11週と第12週にそれぞれを歩かされるので、引き継ぎは理論的ではありません。一部の公共セクター購入者は、実質的により良いベースモデル——Llama 5、より強力なMistralリリース——が出荷された時にスコープ付き更新エンゲージメントを選択しますが、それはオプションで、別料金です。エンゲージメントは綺麗に終了します——無期限リテイナーに変換されません。
30分で状況を診断し、このサービスが合うかどうか正直にお伝えします。合わなければ、何が合うかも。