Digital Business & Future 28.05.2026

Trois défaites de l’IA en une semaine : leçons pour les PME

8 min de lecture

Trois des histoires IA les plus retentissantes de mai 2026 ne sont pas des succès. Starbucks retire un outil d’inventaire qui confond les types de lait. Microsoft bloque l’accès à un outil IA populaire pour ses propres ingénieurs, car la facture explose. Uber consomme tout son budget annuel en intelligence artificielle en quatre mois et le COO admet ouvertement que les résultats restent incertains. Pour les PME, il ne s’agit pas d’anecdotes, mais de trois indices pragmatiques sur ce qui peut mal tourner avec les investissements en IA en 2026.

Les points clés en bref

L’IA nécessite encore beaucoup de supervision. Après neuf mois de pilote, Starbucks a désactivé un système de comptage des stocks dans plus de 11 000 magasins, car les employés devaient vérifier manuellement chaque décompte. On avait promis une précision de 99 % et un inventaire huit fois plus rapide.
La facture bascule avec l’utilisation. Mi-mai 2026, Microsoft a résilié la plupart des licences internes pour l’assistant de codage IA d’Anthropic et a ramené ses développeurs vers son propre outil. La raison donnée dans l’e-mail interne : trop cher, car trop performant.
Le ROI reste le point faible. Uber a épuisé son budget IA 2026 avant avril, couvre actuellement environ 5 000 ingénieurs avec des outils IA et son COO Andrew Macdonald admet franchement qu’il ne parvient pas à établir clairement le lien avec les nouvelles fonctionnalités.

Articles connexes :Indice IA Stanford 2026 : L’inexactitude l’emporte sur la cybersécurité / Quand les outils IA commencent soudainement à grignoter la marge

Trois défaites en sept jours

L’ordre est aléatoire, le contexte non. Au cours d’une semaine en mai 2026, trois histoires IA majeures ont tourné au vinaigre, alors qu’elles étaient censées tenir chacune une promesse différente : de meilleures opérations, de meilleurs logiciels, une meilleure scalabilité. Aucune de ces trois promesses ne s’est concrétisée et, dans deux cas, c’est la réalité qui a mis fin au projet.

Il ne s’agit pas d’un rejet général de la technologie. C’est un indice concret que les présentations de vente standard des fournisseurs d’IA et les attentes habituelles des conseils d’administration des PME divergent précisément sur les trois points où l’argent est dépensé. Quiconque envisage de lancer un grand projet IA dans les douze prochains mois devrait examiner ces trois cas avant de signer le dossier d’investissement.

Starbucks : lorsque l’IA ne distingue pas le lait du lait

En septembre 2025, Starbucks a déployé un système de recensement des stocks dans ses succursales nord-américaines, basé sur un modèle d’IA du fournisseur NomadGo. Les employés scannent les rayons à l’aide d’une tablette ; le système compte automatiquement grâce aux données LIDAR et caméra, puis transmet le résultat au système de gestion des stocks. Promesse publicitaire : une précision de 99 %, huit fois plus rapide qu’un inventaire manuel.

Le 19 mai 2026, l’entreprise a retiré l’outil de toutes ses quelque 11 000 succursales. Dans une note interne, l’entreprise indique avec calme que les ingrédients des boissons et le lait seront désormais comptés comme toutes les autres catégories. Reuters et plusieurs médias américains ont retracé les coulisses : le système confondait régulièrement les types de lait, ne reconnaissait tout simplement pas certaines bouteilles et les employés devaient en pratique vérifier manuellement chaque comptage automatique. Dans une vidéo promotionnelle de la phase de lancement, le système passe même sous silence un sirop à la menthe poivrée placé directement devant la caméra.

Faits saillants du retrait de Starbucks

Fournisseur : NomadGo, nom de l’outil Automated Counting
Durée : septembre 2025 au 19 mai 2026, neuf mois
Portée : toutes les succursales nord-américaines, environ 11 000 sites
Promesse : 99 % de précision, huit fois plus rapide que manuellement
Réalité : confusion entre les types de lait, produits individuels ignorés, contrôle manuel obligatoire

La leçon opérationnelle est banale et c’est précisément pour cela qu’elle est pertinente. Un système d’IA censé soulager une force de travail, mais qui oblige cette même force de travail à vérifier chaque sortie, génère une charge supplémentaire et non un allègement. Cela s’applique non seulement à l’inventaire, mais à tout outil d’IA utilisé dans les services back-office, la comptabilité ou le service client. La question cruciale dans le dossier d’investissement n’est pas de savoir quelle est la précision du système selon le fournisseur, mais plutôt combien de fois les humains doivent vérifier manuellement les résultats pour qu’un processus métier fonctionne encore.

Microsoft bloque l’accès à son propre outil pour ses ingénieurs

Le 14 mai 2026, des milliers d’ingénieurs de Microsoft, au sein de la division Experiences and Devices (qui englobe Windows, Microsoft 365, Outlook, Teams et Surface), ont reçu un e-mail interne. Contenu : les licences pour l’assistant de codage Claude Code d’Anthropic sont résiliées au 30 juin 2026, avec passage à l’outil maison GitHub Copilot CLI. Des rapports publiés notamment par Windows Central et The Suivant Web citent la justification avec une clarté rare : l’outil externe était devenu trop populaire au sein de Microsoft.

Le mécanisme sous-jacent est pertinent pour toute entreprise qui facture les outils d’IA à la consommation. La licence d’Anthropic est calculée en tokens, c’est-à-dire après chaque morceau de code que l’IA génère ou traite. Plus l’outil est utile, plus les développeurs l’utilisent fréquemment, et plus la facture augmente. Microsoft fait ainsi face à un paradoxe pur et simple : l’incitation économique à utiliser le meilleur outil entre en collision avec l’incitation économique à contrôler la facture mensuelle.

Que Microsoft ralentisse ainsi visiblement son propre développement peut se lire dans un détail. Lors d’un autre tour d’e-mails, le PDG Satya Nadella aurait exhorté ses collaborateurs, début mai 2026 selon TheStreet, à utiliser davantage leur propre Copilot. Si le fabricant doit lui-même prêcher à ses ingénieurs l’utilisation de son propre outil, c’est un signal clair concernant la qualité perçue entre les outils maison et ceux des tiers.

Uber : des milliards dépensés, ROI non mesurable

Le cas le plus ouvertement communiqué selon Fortune vient d’Uber. L’entreprise a déployé des outils de codage IA auprès d’environ 5 000 ingénieurs, et le taux d’utilisation est passé de 32 à 84 % entre février et avril 2026. En avril, 70 % de tous les commits de code étaient rédigés avec l’aide d’outils IA. Cela ressemble à un cas d’adoption idéal pour toutes les scènes de conférence.

L’autre face des chiffres, également documentée dans le reportage de Fortune du 26 mai 2026 : Uber a épuisé son budget IA pour 2026 en quatre mois. Par développeur, la facture mensuelle se situe entre environ 460 et 1 840 euros, selon l’intensité d’utilisation. Le COO Andrew Macdonald déclare en substance lors de la conférence téléphonique sur les résultats que tant que l’on ne pourra pas tracer clairement la ligne entre l’utilisation de l’IA et les améliorations de produits livrées, l’investissement sera toujours plus difficile à justifier.

Chiffres clés du budget Uber

Déploiement : environ 5 000 ingénieurs équipés d’outils de codage IA
Adoption : de 32 à 84 % entre février et avril 2026
Productivité : 70 % des commits de code avec une part d’IA en avril 2026
Coûts : environ 460 à 1 840 euros par ingénieur par mois
État du budget : budget annuel 2026 épuisé après quatre mois
Déclaration du COO sur le ROI : lien avec les améliorations produits non démontrable clairement

Ce qui est remarquable n’est pas la consommation élevée, mais la transparence. Uber démontre ainsi en direct ce qui donne des maux d’estomac à de nombreux CFO de PME : un investissement élevé, une utilisation intensive, mais aucune ligne d’impact clairement attribuable sur le résultat commercial. Si une entreprise technologique cotée en bourse avec sa profondeur d’ingénierie ne parvient pas à tracer cette ligne, une entreprise allemande de construction mécanique de 200 salariés n’y parviendra pas non plus d’emblée.

Ce que les PME devraient en retenir

Les trois cas étudiés révèlent trois points de rupture distincts : la qualité, la courbe des coûts et la mesure de l’impact. Pour les décisions d’investissement dans les PME, il est possible d’en tirer des conséquences concrètes qui doivent figurer dans chaque dossier de présentation pour 2026.

Premièrement : rendre obligatoire l’estimation du temps de vérification. Tout investissement dans l’IA nécessite une estimation du nombre de minutes de contrôle humain requises pour 100 sorties d’IA afin de sécuriser le processus. Ce chiffre n’est pas un détail esthétique, il détermine la rentabilité du projet. Si l’effort de vérification atteint 50 % ou plus, l’outil n’est plus une automatisation, mais une duplication coûteuse du travail.

Deuxièmement : calculer froidement les modèles basés sur les tokens. Pour tout outil facturé à la consommation, il faut intégrer dans le tableur un scénario où l’utilisation par utilisateur est multipliée par trois à cinq. C’est exactement ce qui s’est passé chez Microsoft et Uber. Celui qui ne calcule que pour le groupe pilote en oubliant la mise à l’échelle intègre activement un piège à coûts.

Troisièmement : verrouiller la mesure de l’impact avant le lancement. Un indicateur approximatif mais honnête avant le démarrage du projet a plus de valeur qu’un rapport précis a posteriori. Quel délai de traitement, quel taux d’erreur, quel indicateur commercial doit évoluer, et dans quelle proportion ? Celui qui ne peut pas répondre à cette question le premier jour n’y répondra pas non plus après douze mois, et se retrouvera alors, comme Uber, sur la sellette lors de la conférence téléphonique avec ses propres actionnaires.

Quatrièmement : atténuer le verrouillage fournisseur par des clauses de licence. Microsoft a opéré son changement en quelques semaines parce que l’outil était interchangeable. Quiconque ancre profondément un outil d’IA dans ses propres flux de travail, sans prévoir dans le contrat un délai de préavis de sortie et un mécanisme d’extraction des données, se fera duper dès la première modification tarifaire du fournisseur.

Cinquièmement : dimensionner le pilote en fonction de l’objectif d’apprentissage, et non du battage médiatique. Un pilote avec 20 utilisateurs soigneusement sélectionnés fournit des données plus solides qu’un déploiement généralisé à tous. Starbucks a équipé 11.000 succursales avant de réaliser que les employés devaient effectuer chaque comptage en double. Cet ordre des choses est réversible et s’avère même impératif pour les PME.

Foire aux questions

Ces trois cas signifient-ils que l’IA n’a pas de sens pour les PME en 2026 ?

Non, ils signifient que les diapositives commerciales standard sont trop optimistes. L’IA apporte des avantages mesurables dans des cas d’usage étroitement délimités, par exemple pour le traitement de texte, la priorisation de dossiers ou les évaluations structurées. Ce qui ne fonctionne pas, c’est l’adoption sans esprit critique de promesses telles qu’une précision de 99 % ou un retour sur investissement en six mois. Ceux qui démarrent un pilote clairement défini, en évaluant de façon réaliste l’effort de vérification et la courbe de coûts, en profitent. Ceux qui le déploient partout de manière uniforme perdront de l’argent.

Quel devrait être le budget IA d’une PME en 2026 ?

Il n’existe pas de chiffre universel, mais une règle générale : prévoyez le double de la première offre et définissez un plafond strict au-delà duquel l’investissement est arrêté. Uber a épuisé son budget en quatre mois parce que l’utilisation a augmenté plus vite que prévu. Dans les PME, des montants de l’ordre de quelques milliers d’euros suffisent souvent pour un pilote sérieux. L’important, c’est le plafond, pas la taille.

Quels contrats avec les fournisseurs d’IA sont particulièrement risqués ?

Les contrats basés sur les jetons ou la consommation sans plafond mensuel strict représentent le plus grand risque opérationnel. Avec des outils populaires, ils peuvent épuiser en quelques semaines le budget de toute une année. Si vous signez de tels contrats, vous devriez au minimum négocier un plafond mensuel absolu, un rapport de consommation automatique et un préavis de résiliation de 30 jours. Les licences forfaitaires par utilisateur sont plus chères au départ, mais plus prévisibles.

Comment mesurer l’impact de l’IA si Uber n’y arrive pas ?

Avec un seul indicateur par cas d’usage, défini avant le lancement du pilote. Dans la vente par exemple, le délai de traitement des offres ; en comptabilité, le taux de pièces comptabilisées sans intervention ; dans le service client, la durée moyenne de traitement. Un chiffre approximatif accepté par tous vaut mieux qu’un tableau de bord précis que personne n’entretient. Uber mesure trop de choses à la fois, c’est pourquoi la ligne directrice fait défaut.

Qu’en est-il des fournisseurs d’IA allemands, sont-ils meilleurs ?

La logique est identique. Que le modèle provienne d’un fournisseur américain ou de la région DACH ne change ni l’effort de vérification ni la mathématique des jetons. Ce que les fournisseurs allemands font souvent mieux : des contrats de protection des données rédigés en allemand, des délais de réaction plus courts et un modèle de prix plus réaliste, sans facturation purement à la consommation. Pour les risques décrits ici, l’origine est secondaire, la conception du contrat est primordiale.

Autor

Jakob Bach Entrepreneur. Ästhet. Möglichmacher. Mit einer Leidenschaft für Motorsport, Hospitality und die Kunst des feinen Erlebens verbindet Jakob Bach unternehmerisches Denken mit einem tiefen Verständnis für Menschen und Märkte. Aus dem Vertrieb kommend und geprägt durch die Welt des hochwertigen Konsums, führt er heute mit strategischem Blick und sicherem Stil unsere Verlagsmarken in die Zukunft – dorthin, wo Relevanz und Klasse sich begegnen.