Lifecycle stage — Govern
Ceci n'est pas la mission Fractional CAIO. C'est l'adaptation startup du leadership exécutif fractional, et le travail est structurellement différent. Une entreprise mid-market avec un portefeuille d'initiatives IA a besoin d'un Chief AI Officer — gouvernance, P&L, reporting board, pilotage des fournisseurs. Une startup seed à Series B où l'IA est le produit n'en a pas besoin. Elle a besoin d'un Chief Technology Officer qui est dans la codebase, propriétaire de la roadmap technique, qui mène les code reviews du chemin critique, qui prend les décisions build-versus-buy, qui recrute les trois premiers ingénieurs, et qui pose la discipline d'astreinte que l'équipe finira par détenir. Un CAIO gouverne un portefeuille ; un CTO livre le produit. Faire tourner un fractional CAIO dans une startup qui a besoin d'un CTO produit une couche advisory qui ne livre pas de code, et l'entreprise paie pour une supervision dont elle n'a pas encore besoin pendant que le problème de livraison reste non résolu. J'ai livré dix ventures IA en tant que fondateur et opérateur — Auralink est la plus grande d'entre elles à 1,7 million de lignes de code en production et peer-reviewed sur arXiv — ce qui est un credential différent d'avoir mené de la gouvernance IA en entreprise. Cette mission utilise ce credential. Six à douze mois, deux à trois jours par semaine, critères de sortie définis au kickoff : un recrutement CTO temps plein nommément désigné, l'ingénieur fondateur qui monte dans le siège avec la reconnaissance de patterns transférée, ou un jalon de maturité au niveau d'une série où l'organisation ingénierie peut tourner sans le leader fractional.
L'équipe fondatrice a un meilleur ingénieur, pas un leader technique. Quelqu'un dans l'équipe fondatrice a écrit la première version fonctionnelle du produit et pilote maintenant l'ingénierie par défaut. Il est fort en exécution et faible sur les patterns qui n'apparaissent qu'après plusieurs livraisons en production — les choix d'architecture qui se composent, la discipline de review qui attrape les régressions avant les clients, le filtre de recrutement qui sélectionne les ingénieurs qui seront encore productifs à dix personnes. La startup a besoin de ces patterns maintenant, pas après l'arrivée d'un CTO temps plein au mois douze. Le fractional CTO apporte les patterns immédiatement et les transfère délibérément.
Le recrutement du premier ingénieur ML est la décision à plus fort enjeu que la startup n'a pas encore bien prise. Recruter le premier ingénieur ML de production — celui qui sera réellement propriétaire du pipeline de modèles, du harnais d'évaluation, de la stack d'inférence — exige d'évaluer les candidats sur des décisions de jugement que les fondateurs eux-mêmes n'ont pas eu à prendre. Le résultat typique est soit un recrutement senior coûteux que l'entreprise ne peut pas manager productivement, soit un recrutement junior qui apprend encore la forme du problème. Un fractional CTO qui a personnellement livré des modèles fine-tunés en production mène l'interview loop, écrit les problem sets techniques, et fait les reference calls qu'un fondateur non-spécialiste ne peut pas mener crédiblement.
Les décisions d'architecture prises en seed deviennent de la dette de refactoring en Series A. Le choix de model-serving fait au mois trois pour livrer la démo, la vector database choisie parce qu'elle avait un bon tutoriel, la stack d'inférence bricolée depuis des appels API de frontière et des scripts Python — chacun se compose. À la Series A, le coût pour défaire ces décisions est plusieurs engineer-months et un trimestre de roadmap manqué. Un CTO dans la codebase attrape les décisions qui se composent au moment où les corriger est un travail d'une journée, pas d'un trimestre. Le modèle fractional rend ce CTO abordable six mois plus tôt qu'un recrutement temps plein.
La due diligence technique pour une Series A ou des clients stratégiques se passe mal sans une représentation technique que les investisseurs respectent. Un appel de DD technique Series A, ou la revue d'architecture qui conditionne un pilote Fortune 500, exige une voix technique crédible dans la pièce — pas un slide deck. Les fondateurs sans reconnaissance profonde de patterns ML de production se font remettre en question sur des questions qu'un CTO chevronné répondrait en quatre-vingt-dix secondes. Le fractional CTO gère ces conversations directement pendant la mission et prépare l'équipe fondatrice à les gérer indépendamment ensuite. Le credential que les investisseurs vérifient est celui que la mission apporte dans la pièce.
La mission se déroule à deux à trois jours par semaine, embedded avec l'équipe ingénierie, avec des critères de sortie définis au kickoff. Le travail est hands-on : revue d'architecture sur les chemins critiques, code review sur les commits qui comptent, interview loops pour les premiers recrutements ingénierie, participation à l'astreinte jusqu'à ce que l'équipe puisse la porter, et les conversations fournisseurs — prestataires d'inférence, licensing de base models, crédits cloud — qui exigent une négociation à l'échelle d'une startup. La représentation board et investisseurs fait partie du siège ; la gouvernance de portefeuille non. C'est une mission CTO, pas une mission CAIO.
Lecture approfondie de la codebase, des pipelines de données, de l'infrastructure et de la stack de modèles. Identification des décisions d'architecture qui se composent, des écarts de production readiness, et des recrutements ingénierie dont l'entreprise a besoin dans les deux prochains trimestres. Une roadmap technique écrite atterrit à la fin du mois un — spécifique, séquencée, avec les compromis documentés pour que les fondateurs puissent pousser back là où leurs priorités produit diffèrent. La roadmap est l'artefact contre lequel le reste de la mission se déroule, pas un slide deck de stratégie.
Opérer le siège. Revues d'architecture sur les décisions qui donnent sa forme au produit — choix de model serving, infrastructure d'évaluation, stack d'observabilité, modèle de coût d'inférence. Code review sur les chemins critiques jusqu'à ce que la discipline de l'équipe puisse la porter. Les deux ou trois premiers recrutements ingénierie sont menés de bout en bout — scorecard, interview loop, problem sets techniques, reference calls, closing — parce que le coût de rater ces recrutements est supérieur au coût de la mission elle-même. Les conversations fournisseurs commencent : prestataires d'inférence, crédits cloud, licensing de base models.
L'organisation ingénierie commence à prendre les opérations de production au sérieux. Rotation d'astreinte, discipline de réponse aux incidents, harnais d'évaluation qui rend les mises à jour de modèle mesurables, stack d'observabilité qui attrape les régressions avant les clients. Représentation technique sur les appels de due diligence Series A ou B, sur les revues d'architecture pour les pilotes clients stratégiques, et sur les sessions board où des questions techniques sont à l'agenda. L'équipe fondatrice commence à gérer les non-critiques directement, avec prep et debrief, parce que le transfert de patterns est le sujet.
Les critères de sortie définis au kickoff deviennent visibles. Un recrutement CTO temps plein nommément désigné atterrit, ou l'ingénieur fondateur monte dans le siège avec la bibliothèque de patterns transférée, ou l'organisation atteint un jalon de maturité au niveau d'une série où elle peut tourner sans la couche fractional. Je mène l'interview loop pour le CTO temps plein là où c'est le chemin choisi. Le successeur interne, là où c'est le chemin, opère déjà des parties significatives du siège au mois neuf et reprend proprement au mois douze. La sortie laisse l'organisation ingénierie plus forte qu'elle ne l'était, et spécifiquement plus dépendante de ma présence pour livrer.
Startups seed à Series B avec cinq à trente ingénieurs, IA dans le chemin critique du produit — pas un outil d'enablement posé par-dessus un business différent — et une équipe fondatrice qui manque de leadership ingénierie ML senior. Entreprises qui se dirigent vers un cycle de due diligence technique Series A ou B, un premier pilote enterprise stratégique, ou une inflexion de production où l'absence d'une voix technique au niveau CTO devient une contrainte bloquante. Fondateurs qui comprennent que le travail est du leadership ingénierie — architecture, recrutement, code review, astreinte — et non de la gouvernance advisory. Ceci n'est pas pour les startups où l'IA est une fonctionnalité d'un produit non-IA ; ces entreprises ont souvent besoin d'un lead ingénierie expérimenté plutôt que d'un fractional CTO à ce périmètre. Ce n'est pas non plus pour les entreprises mid-market avec un portefeuille IA à travers plusieurs business units — la mission Fractional CAIO est la bonne variante à ce périmètre, parce que le travail là-bas est gouvernance et reporting board, pas livrer du code.
Un CAIO gouverne un portefeuille d'initiatives IA dans une entreprise — stratégie, posture de risque, reporting board, pilotage fournisseurs — et ne livre généralement pas de code ni ne mène d'interview loops pour des recrutements ingénierie. Un CTO dans une startup est dans la codebase, propriétaire de la roadmap technique, mène les code reviews du chemin critique, recrute les premiers ingénieurs, et pose la discipline d'astreinte. Pour une startup où l'IA est le produit, le périmètre CAIO est le mauvais travail à la mauvaise altitude. Si votre entreprise est une entreprise mid-market avec un portefeuille IA à travers plusieurs business units, la mission Fractional CAIO est la bonne variante ; si vous êtes une startup, celle-ci l'est.
Oui, sur les chemins critiques où une main senior sur le clavier est matériellement plus rapide que reviewer le travail de quelqu'un d'autre — choix prototypes de model-serving, scaffolding du harnais d'évaluation, première coupe de la stack d'observabilité. La majorité de l'écriture est code review et architecture, pas de l'output d'IC, parce que le sujet est d'élever l'altitude de l'organisation ingénierie plutôt que d'en être l'IC le plus productif. Le test est si l'équipe livre mieux et plus vite, pas combien de code j'ai personnellement écrit cette semaine.
La mission s'adapte. La Series A réinitialise généralement la trajectoire ingénierie — recrutements plus gros, clients plus sophistiqués, exigences de production plus dures — et le travail CTO pendant et après cette levée est exactement le travail que la mission a été montée pour porter. Les critères de sortie sont réexaminés à ce moment parce que le recrutement CTO temps plein devient réaliste d'une manière qu'il ne l'était pas en seed, et nous menons cet interview loop de bout en bout si c'est le chemin choisi. Plusieurs missions ont conclu avec le successeur interne qui monte à la place, ce qui est généralement le meilleur résultat quand l'ingénieur fondateur a la trajectoire.
Oui, dans le périmètre de la mission. Les appels de due diligence technique Series A ou B, les revues d'architecture avec clients stratégiques, et les sessions board où des questions techniques sont à l'agenda font partie du siège. Ce que je ne fais pas, c'est jouer au CTO sur un slide deck — je suis sur la paie en tant que fractional executive, je suis nommé sur la page équipe pendant la mission, et je suis représenté crédiblement parce que le travail est réel. Post-mission, je suis disponible pour des escalades spécifiques sur accord préalable, mais la représentation continue est le travail du successeur temps plein, pas le mien.
Si cet ingénieur a personnellement livré des systèmes IA en production à plusieurs clients enterprise, recruté et managé une équipe de dix, mené des conversations techniques au niveau board, et négocié des contrats fournisseurs à l'échelle startup, probablement vous n'en avez pas besoin. La plupart des ingénieurs seniors dans des startups AI-native ne l'ont pas fait — ils ont livré des features produit mais pas opéré un siège CTO de bout en bout. La mission est explicitement structurée pour coacher cet ingénieur dans le siège au mois neuf là où la trajectoire est là, ou pour co-opérer le siège avec lui jusqu'à ce qu'un recrutement temps plein atterrisse là où elle ne l'est pas. Dans les deux cas, la préparation du successeur est le sujet, pas ma présence indéfinie.
30 minutes. Je diagnostique votre situation, je vous dis honnêtement si ce service convient — et sinon, lequel conviendrait.