Lifecycle stage — Build
物理システム内で動作するAIは、クラウドで動作するAIとは異なるエンジニアリング問題です。製造ラインのPLC、車両のECU、または変電所のコンピュートノードにデプロイされたモデルは、リアルタイムSLAを保持し、ネットワーク分断を生き延び、認証エンジニアがレビューする安全エンベロープを尊重し、運用会計が承認するコストをクリアするハードウェア上で動作する必要があります。汎用クラウドAIコンサルタンシーはこの作業を行えません——参照アーキテクチャは適用されず、チームは安全エンジニアに会ったことがありません。これは物理システム向けに適合されたDEPLOYメソッドのPILOTおよびLAUNCHフェーズ: エッジAIパイロットを安全発見、制約ハードウェア向けモデル設計、産業または車両スタックとの統合、そして運用引き継ぎまで通す16週間の組み込みエンゲージメントです。金融・ビジネスデジタルトランスフォーメーション担当フランス政府AIアンバサダーとして——これはソブリンおよび防衛隣接作業に重要な指定です——自律システムへの作業を含む8つのAIベンチャーを出荷してきました。成果物は運用チームが運用するデプロイメントであり、データチームが放棄するデモではありません。
クラウドファーストのデータプラットフォームは、PLC、車両ECU、変電所コンピュートノードにモデルをプッシュするよう設計されていません——そしてそれを後付けするのは単独で3四半期のプロジェクトです。チームが構築したMLOpsスタックは、弾力的クラウド推論、ネットワーク接続、オーバープロビジョン可能なハードウェアを前提としています。エッジではどの前提も成立しません。データチームが訓練したモデルは、MLOpsパイプラインが表現できない制約で、運用チームが管理するハードウェア上で動作します。後付けがそれ自体プログラムになり、元のAIプロジェクトが届けるはずだったタイムラインを食い尽くします。
安全および認証エンジニアが拒否権を持ち、彼らが必要とするエビデンスを生み出すプロセスがありません。モデルはシミュレーションで動作します。安全エンジニアはハザード分析、故障モードカバレッジ、エンベロープ違反テスト、認証レビューを生き延びるエビデンスチェーンを求めてきます——そしてデータチームはそれらのアーティファクトのいずれも生み出したことがありません。プロジェクトはデータチームが第10週まで存在を知らなかったレビューで停滞します。誰も間違っていません——規制対象の物理システムにAIを出荷したことがないため、ML工学と安全工学の間の引き継ぎが御社で設計されたことがなかったのです。
AIチームと運用チームは異なる言語を使い、チケットシステムが会話しません。データサイエンティストはF1スコア、検証セット、モデルカードの言語で話します。運用エンジニアはOEE、MTBF、PLCスキャンサイクル、車両バスタイミングの言語で話します。2つのグループは四半期ステアリングコミッティで会い、具体的な何も合意せずに別れます。共有言語と共有運用リズムなしでは、チームが提供したモデルは、それを運用しなければならない運用チームに受け入れられません。プロジェクトは技術的には失敗せず——社会的に失敗します。
モデルはベンチ規模で動作し、誤ったキャリブレーションドリフトを持つ実センサーに初めて出会った時に倒れます。訓練データはクリーンでした。検証データはクリーンでした。本番センサーには誰もモデル化しなかった熱バイアス、チームが知らなかったファームウェアバージョン、運用チームが6年間許容してきた断続的電気故障があります。モデルの精度はパイロット3日目に崩壊し、モデルが壊れているのか、センサーが壊れているのか、統合が壊れているのかを誰も判断できません。その曖昧さこそ、エッジAIプロジェクトが死にに行く場所です。
エンゲージメントは4週間×4フェーズで進みます。最初と最後のフェーズはオンサイトで、間はリモートで組み込み作業します。御社のエンジニアリング、安全、運用チームすべてに割り当てられた時間があります——これはデータチームが単独で運ぶ提供物ではありません。出力は、安全体制の下、運用スタックと統合された、本番ハードウェア上で動作するデプロイメントです。
安全エンジニアリングチーム、認証リード、システムを運用する運用エンジニア、パイロットを構築したMLチームとの構造化セッション。安全エンベロープ、重要な故障モード、必要な認証アーティファクト、ハードウェア制約(計算、メモリ、熱、電力)、ネットワークトポロジーと分断挙動、モデルが満たす必要のある運用SLAを文書化します。第4週末までに、安全エンジニアが署名し、MLチームが向けて構築できる書面の制約ドキュメントがあります。このフェーズはほとんどのプロジェクトがスキップするもので——スキップすることがほとんどのプロジェクトが失敗する理由です。
モデルアーキテクチャと訓練レシピはハードウェアと安全エンベロープに合わせて再設計されます。量子化戦略、レイテンシ予算、メモリフットプリント、安全が要求する場合の決定論的挙動、センサー故障下での緩やかな劣化。実ハードウェア上で、シミュレーションではなくアブレーションを実行します。また、認証レビューが要求するエビデンスチェーン——ハザード分析、故障モードカバレッジ、エンベロープ違反テスト——を構築します。このフェーズで生み出されるモデルはデプロイされるモデルです——認証エビデンスが構築された後に再アーキテクチャはしません。
モデルは実ハードウェア上で産業または車両スタックと統合されます——PLCプログラミング環境、OTネットワーク、車両バス、SCADA、または変電所自動化。運用チームのチケットシステムはモデルが生み出すアラートを受け取ります。ファームウェア更新経路、モデルロールバック機構、オーバーザエア(またはオーバーザワイヤー)デプロイパイプラインが構築・テストされます。第12週末までに、モデルは管理されたパイロットゾーン——1つの製造ライン、1台の車両、1つの変電所——で本番ハードウェア上で動作しており、安全体制の下、運用チームによってモニタリングされます。
運用チームがデプロイメントを所有します。彼らが使用するランブック、既存の運用リズムに合うアラート閾値、ML訓練なしで読めるモデルパフォーマンスダッシュボード、ファームウェア更新が午前2時に失敗した時のロールバックプレイブックを構築します。パイロットゾーンから第1週に合意された本番フットプリント——ラインごと、車両ごと、拠点ごと——に拡大し、各拡大を安全エンジニアが承認します。私が去る時、運用チームがシステムを運用しています。MLチームはモデル更新について相談を受けますが、日常オペレーションについては相談を受けません。
エッジ——工場内、車両内、変電所、またはソブリンインフラ拠点内——でパイロットAIプロジェクトを持つ製造業者、自動車OEM、エネルギー公益事業者、公共セクター機関。クラウドAIとフィジカルAIのギャップが実在することを既に知っているエンジニアリング責任者のいる組織。プロジェクトがクリアする必要のある認証・安全体制を持ち、物理システムにAIを出荷したことのある外部の声を必要とする組織。防衛隣接または戦略産業作業にAIアンバサダー資格を持つパートナーを要するソブリンインフラプログラム。純粋なソフトウェア企業向けではありません——彼らはエージェンティックシステム・エンジニアリングサービスを必要とします。パイロットがまだ動作していない組織向けでもありません——エンゲージメントは既存のモデルと、それを引き継ぐ運用チームの存在を前提としています。
彼らと並走します、明確なスコープ境界で。御社のオートメーションパートナーはPLCプログラミング環境、OTネットワーク、運用統合層を所有します——それが彼らのコアコンピテンスで、そこに拡大しようとはしません。私はモデルアーキテクチャ、エッジ推論デプロイメント、認証エビデンスチェーン、安全プロセスを所有します。エンゲージメント中、作業成果物が整合するよう毎週ミーティングします。大手産業オートメーション企業と並走してこれを行ってきましたが、双方がそれを尊重する時、境界は綺麗に機能します。
はい——そしてしばしばそうする必要があります。車両ECU、遠隔変電所、断続的接続の工場ゾーンで動作するモデルは、ネットワーク分断中に動作し、リンクが戻った時に状態を同期する必要があります。アーキテクチャはこれを明示的に扱います: デバイス上推論、ローカル状態管理、テレメトリが中央プラットフォームに到達した時の競合解決、依存サービスが到達不可能な時の緩やかな劣化。設計はAuralinkで構築したものに情報を得ており、そこではエージェントが依存が失敗した時に動作を継続する必要がありました。
体制によります。エンゲージメントは、安全エンジニアが取り組んでいる基準にマップする認証エビデンスチェーン——ハザード分析、故障モードカバレッジ、エンベロープ違反テスト——を生み出します。私は認証機関ではなく、安全エンジニアの代わりにもなりません——レビューが停滞しないよう、彼らが必要とする構造でエビデンスを構築します。特にEU AI法高リスク分類については、エビデンスチェーンは付属書III要件に対して明示的に設計されます——そこが産業および自律システムデプロイメントが着地する傾向のある場所だからです。
運用チームが承認するものなら何でも。第1週に、現実的なハードウェアエンベロープを特定します——調達が購入し、運用がインストールし、保守がサービスするもの。Jetson、Intel、AMD、カスタムシリコンにわたって作業してきました。モデル設計はハードウェア制約に情報を得て——その逆ではなく——行われます。好みのプラットフォームを持って入ってくることはしません——正しいハードウェアは運用チームが今後10年間実際に運用するものだからです。
意味ある形ではできません。4つのフェーズはそれぞれ異なる規律——安全、MLエンジニアリング、産業統合、運用——を代表し、それぞれ必要な時間を必要とします。安全フェーズを圧縮すると、認証に失敗するデプロイメントが生まれます。統合フェーズを圧縮すると、運用チームが拒否するデプロイメントが生まれます。時に時間を節約できる一箇所は、既存の産業オートメーションパートナーが既に相当な統合作業を行っている時——エンゲージメントはモデルと安全層に焦点を当て、統合フェーズは2週間に圧縮されます。それが該当するかは第1週にお伝えします。
30分で状況を診断し、このサービスが合うかどうか正直にお伝えします。合わなければ、何が合うかも。