À retenir en 60 secondes

 

1. Modèles & infrastructure : Google passe à l’agentique « cost-first »

Google I/O 2026 (19 mai) — Gemini 3.5 Flash. Google ouvre le bal de la semaine en livrant Gemini 3.5 Flash, premier modèle d’une « série combinant intelligence frontière et action ». Les benchmarks sont structurants : Terminal-Bench 2.1 à 76,2 %, GDPval-AA à 1 656 Elo, MCP Atlas à 83,6 % — soit au-dessus de Gemini 3.1 Pro sur les tâches agentiques longues et le coding, pour moins de la moitié du coût des modèles frontière concurrents. Disponible via Google Antigravity, Gemini API et Android Studio. Gemini 3.5 Pro est annoncé pour juin. Lecture stratégique : la course se déplace explicitement vers le rapport « performance agentique / coût par token ». Pour les diagnostics 360° BMA, c’est un nouveau curseur économique à intégrer dans la rubrique « Coûts & impacts ».

Gemini Spark + Agent Platform. Google industrialise sa pile agentique : Gemini Spark, agent personnel 24/7 pour Gemini Enterprise et Workspace ; CodeMender pour la détection automatique de vulnérabilités code ; AI Content Detection API pour identifier les contenus générés par IA (Google et autres modèles). Macquarie Bank rapporte 130 000 heures économisées en 7 mois via Gemini Enterprise — premier benchmark sectoriel public significatif en banque sur Gemini.

Google Gemini CLI — la fin du modèle « open community » (19 mai). Google annonce le retrait de l’accès API du Gemini CLI pour tous les non-payants, après avoir accepté 6 000 contributions communautaires. À compter du 18 juin 2026, l’outil est réservé aux clients entreprise. Signal faible mais structurant : la phase « DevRel open » des hyperscalers se referme ; les outillages développeurs migrent vers les licences entreprise. À documenter dans la rubrique « Dépendances fournisseurs » des analyses Semperia.

Cohere Command A+ (20 mai) — premier LLM frontière « Apache 2.0 » utilisable commercialement. Cohere ouvre son premier modèle de la famille Command sous licence Apache 2.0 — usage commercial sans licence séparée. Combiné aux MoU Indra et Multiverse (voir section 5), c’est une offensive de souveraineté ouverte, qui pousse Mistral sur son propre terrain à 8 jours du AI NOW Summit.

Claude Opus 4.7 — rappel & premier mois de production. Disponible depuis le 16 avril 2026 sur Claude.ai, API, Bedrock, Vertex, Foundry, Snowflake Cortex et GitHub Copilot. Gains majeurs sur le software engineering complexe et premier modèle Claude à supporter les images haute résolution (2576px / 3,75 MP). Tarif inchangé : 5 $ / 25 $ par million de tokens. Les retours d’usage entreprise de la fin mai sont uniformément positifs sur les tâches longues — c’est aussi ce qui explique les bascules KPMG et BMS.

 

2. Agentique en entreprise : la phase « bascule des cabinets »

KPMG × Anthropic — alliance globale (19 mai). KPMG (138 pays, 276 000+ collaborateurs) embarque Claude au cœur de Digital Gateway, la plateforme propriétaire qu’utilisent ses équipes et ses clients. Trois piliers : (1) accès Claude pour les 276 000 employés ; (2) outils tax & legal Claude-powered livrés aux clients ; (3) Anthropic nomme KPMG « preferred partner » pour le private equity — coproduction d’offres pour les sociétés de portefeuille PE. Une équipe conjointe travaillera également à la détection de vulnérabilités cybersécurité dans les systèmes critiques sous le cadre Trusted AI de KPMG.

Bristol Myers Squibb × Anthropic (20 mai). BMS pose Claude Enterprise comme plateforme d’intelligence partagée sur R&D, développement clinique, manufacturing, commercial, corporate — 30 000+ collaborateurs. Premier cas d’usage déjà en production : rédaction de rapports réglementaires à partir des données d’essais cliniques. Anthropic confirme via Eric Kauderer-Abrams (Head of Life Sciences) que les sciences de la vie sont un axe d’investissement majeur. À combiner avec le déploiement Claude Code pour les équipes engineering et AI de BMS.

Japon × Anthropic — Claude « Mythos » au Trésor japonais (22 mai). Le ministre des Finances japonais Satsuki Katayama annonce que le gouvernement et les grandes institutions financières japonaises accéderont à Claude (variante Mythos) dans les deux semaines, à l’issue d’une rencontre avec le Secrétaire au Trésor américain Scott Bessent. La diplomatie IA bilatérale entre dans une phase « workflows régaliens ».

Claude Managed Agents & Claude Security beta. Anthropic durcit son offre entreprise : Claude Managed Agents tournent désormais dans un sandbox client et se connectent à des serveurs MCP privés, sandbox et services restant à l’intérieur du périmètre sécurité-runtime du client. Claude Security entre en beta publique pour Claude Enterprise. Claude for Small Business est également lancé — pack de connecteurs et workflows prêts-à-l’emploi pour les PME. Pour Semperia : un nouvel argument pour défendre la posture « modèle externe + données et exécution chez le client » dans la rubrique « Architecture & dépendances ».

OpenAI × Dell Technologies (19 mai). OpenAI étend Codex aux environnements hybrides et on-premise via Dell. Conjugué à OpenAI DeployCo (cf. semaine dernière), OpenAI complète sa descente dans la chaîne de valeur intégrateurs et bâtit une réponse crédible à Anthropic sur l’enterprise. À surveiller : la suite logique est l’arrivée de Codex en mode « on-premise » sur les workloads régulés — finance, défense, santé.

SAP bloque les agents externes — Salesforce et ServiceNow restent ouverts. Décrypté cette semaine par Techzine Global : la section 2.2.2 de l’API Policy v4/2026 de SAP, publiée discrètement en avril, interdit explicitement aux systèmes IA externes qui planifient ou exécutent indépendamment des appels d’utiliser les API SAP. À l’opposé, Salesforce et ServiceNow restent « headless » et exposent leurs actions via MCP. ServiceNow Action Fabric passe d’ailleurs en disponibilité générale (Knowledge 2026), avec MCP Server intégré. Lecture stratégique majeure pour les Codir : le choix d’une suite ERP devient désormais un choix de modèle d’orchestration agentique. SAP = walled garden interne (Joule + 50 agents). Salesforce / ServiceNow = open API. Ce ne sont plus les mêmes architectures, ni les mêmes risques de dépendance.

ServiceNow × Nvidia × 17 éditeurs — Agent Toolkit. Nvidia annonce un Agent Toolkit open-source adopté par Adobe, Salesforce, SAP, ServiceNow, Siemens, CrowdStrike, Atlassian, Cadence, Synopsys, IQVIA, Palantir, Box, Cohesity, Dassault Systèmes, Red Hat, Cisco et Amdocs — 17 éditeurs entreprise. C’est la confirmation de la convergence du marché vers une fondation commune d’orchestration agentique — au-dessus, la différenciation se fait sur les actifs métier et la verticalisation.

Microsoft Build 2026 (2–3 juin) — préparer. À 8 jours, Microsoft pré-annonce une AI Foundry for Windows SDK (bundle ONNX Runtime + DirectML + Copilot Runtime) et fait de AI production systems / agentic workflows / model-cost control ses trois piliers stratégiques. La cohorte startups ciblée porte sur observability, agent security, synthetic data, agent robotics. Build 2026 est le prochain marqueur d’industrialisation à intégrer dans la veille.

 

3. Gouvernance & contrôle agentique : la bombe « Shadow AI »

Microsoft Cyber Pulse 2026 — l’étude qui marque la semaine. Les chiffres sont éloquents et doivent figurer dans tout brief Codir / Comex IA :

Lecture stratégique : on n’est plus dans le « risk anticipé » — on est dans le « risk réalisé ». La fenêtre où la gouvernance pouvait suivre l’adoption à 6–12 mois est dépassée. Pour Sempervirens, c’est un argument central pour le prochain livrable « Gouvernance IA et Codir » : la question n’est plus « faut-il un cadre », mais « comment rattraper un parc d’agents déjà déployé hors contrôle ».

AI Act EU Omnibus — adoption formelle en cours. L’accord politique du 7 mai (Annexe III repoussée au 2 décembre 2027, Annexe I au 2 août 2028, watermarking GenAI au 2 décembre 2026) chemine vers l’adoption formelle avant le 2 août 2026. Pas d’évolution majeure cette semaine, mais White & Case, Latham & Watkins, Inside Privacy publient des analyses convergentes sur les nouvelles interdictions Art. 5 (CSAM, « nudification ») et la période transitoire watermarking. À surveiller : la liste finale des autorités nationales compétentes — la France n’a toujours pas désigné les siennes (rappel MIAI).

Content provenance — OpenAI s’aligne sur C2PA + SynthID (20 mai). OpenAI renforce sa conformité C2PA, ajoute des watermarks SynthID cross-platform durables sur les images, et publie un outil public de vérification pour identifier les contenus générés par IA. Bonne nouvelle pour les obligations de traçabilité Art. 50(2) AI Act : la « plomberie » de la transparence GenAI se standardise progressivement entre fournisseurs, ce qui réduit le coût de conformité côté client.

OpenAI — révocation du code-signing macOS (23 mai). Suite à l’attaque supply chain TeamPCP, OpenAI annonce révoquer son certificat de code-signing macOS au 12 juin 2026. Signal supplémentaire : la « supply chain agentique » est désormais un vecteur d’attaque actif. À combiner avec l’OWASP Top 10 LLMs 2025 (supply chain en #3) dans les diagnostics sécurité IA.

 

4. Marché du travail : la grande recomposition s’accélère

Cisco : 4 000 postes. Meta : 8 000 postes (effets 20 mai). La vague des plans sociaux tech s’amplifie : au cumul, plus de 92 000 emplois tech supprimés sur 5 mois. Près de 48 % des suppressions de 2026 sont attribuées explicitement à l’IA et à l’automatisation. La logique reste celle du Washington Post : ces réductions de coûts financent le capex IA 725 Md$ 2026 des quatre hyperscalers.

Le contre-pas : IBM et Salesforce investissent sur les juniors. IBM triple son recrutement entry-level en 2026 — argument explicite : « l’IA a besoin de supervision humaine, de curation des données, de jugement ». Salesforce annonce 1 000 nouveaux diplômés et conteste publiquement la thèse selon laquelle l’IA va supprimer les opportunités de carrière en début de parcours. Lecture stratégique cœur Sempervirens : une nouvelle bifurcation se dessine — les organisations qui pensent l’IA comme « remplacement » contractent leur pipe RH ; celles qui la pensent comme « démultiplication supervisée » investissent dans l’entry-level. Cette bifurcation devient un indicateur de maturité IA à intégrer dans la grille « Capital humain & gouvernance » de Semperia.

 

5. Souveraineté européenne : Cohere accélère, Mistral garde la scène (cœur Sempervirens)

Cohere × Indra Group — MoU sovereign AI Espagne-Canada (20 mai). Cohere consolide son axe transatlantique post-Aleph Alpha avec un MoU stratégique avec Indra Group, prime contractor de défense espagnol. Implémentation via IndraMind — l’initiative technologique d’Indra dédiée à la « sovereign intelligence » pour la protection d’actifs critiques. Indra apporte le calcul et la donnée souveraine ; Cohere apporte les LLM souverains. Périmètre : multilingue (catalan, basque, valencien, galicien, castillan) et défense — analysis, mission planning, interoperability multinationale. L’accord s’inscrit dans le cadre de coopération bilatérale Canada–Espagne sur la technologie souveraine.

Cohere × Multiverse Computing (21 mai). Deuxième MoU dans la foulée, avec le spécialiste espagnol de compression quantique et IA. L’enjeu : réduire le coût d’inférence des LLM frontière via des techniques de compression issues du calcul quantique — un argument économique fort pour les déploiements souverains où le coût d’infrastructure est un frein structurel.

Lecture stratégique : la pile souveraine sort de la posture. En une semaine, Cohere a posé trois briques structurantes : ouverture commerciale (Command A+ Apache 2.0), partenariat défense (Indra), optimisation coût (Multiverse). Mistral détient encore l’avance industrielle française (44 MW à Bruyères-le-Châtel, Sweden 1,2 Md€) et la scène du AI NOW Summit (28 mai, Carrousel du Louvre). Pour les clients européens de Sempervirens, le couple « Cohere-Aleph Alpha–Indra » vs « Mistral » devient une alternative crédible sur défense, énergie et public regulated, à intégrer systématiquement dans la matrice « Souveraineté IA » du diagnostic 360° BMA.

Mistral AI NOW Summit — countdown (28 mai). Carrousel du Louvre. Première édition flagship. Pré-annonces : lancement public de Workflows (orchestration agentique Temporal-powered, déjà en production à plusieurs millions d’exécutions / jour) et SDK Python v3.0. Trois tracks :

À retenir pour l’agenda commercial Sempervirens : (a) qualifier la liste des dirigeants présents (CAC 40, ETI régulées, secteur public) ; (b) cadrer une note de fond post-summit (1er juin) intégrant les annonces produit dans la rubrique « Make-or-buy modèle » du diagnostic 360° BMA ; (c) préparer un post LinkedIn de chaud (28 mai soir) sur la posture « Own your AI transformation » et sa traduction concrète pour les ETI françaises.

 

6. Durabilité : la pression structurelle se confirme (cœur Sempervirens)

Données consolidées cette semaine. Pas de rupture, mais des chiffres qui se précisent et s’imposent dans les agendas :

Le tournant qualitatif : la durabilité comme décision d’architecture, plus comme reporting. « What was once viewed as a compliance issue is now shaping core infrastructure decisions and data center planning » (Data Center Knowledge 2026 Predictions). Trois conséquences directes pour les diagnostics Sempervirens :

  1. FinOps + GreenOps deviennent une seule discipline — coût électrique / hydrique par requête, par modèle, par hub data center. À cadrer dès l’architecture, pas en aval.
  2. Le choix du modèle = choix d’empreinte — Mistral (LCA publié, ADEME / Carbone 4), Anthropic (engagement « bouclier prix » résidentiel), Cohere–Aleph Alpha (data centers européens), face à OpenAI / Google / Meta. Critère à scorer explicitement dans la matrice de make-or-buy.
  3. Licence sociale d’opérer = nouveau risque board — médiatisation des oppositions locales aux data centers (US comme UE) ; à anticiper en stratégie de stakeholder management pour tout client envisageant un build infrastructure interne.

 

Et alors pour Sempervirens / Semperia cette semaine ?

  1. Mettre à jour la rubrique « Gouvernance agentique » du diagnostic 360° BMA. Intégrer les 7 chiffres clés Microsoft Cyber Pulse (80 % usage / 10 % gouvernance / 65 % incidents / 82 % shadow / 63 % no purpose limit / 60 % no kill switch / 34 % budget dédié). En faire une infographie « tableau de bord Codir » exploitable en atelier d’acculturation.
  2. Cadrer un livrable « Bascule cabinets de conseil — qu’est-ce qui change ? ». PwC (semaine -1) + KPMG (semaine 0) — sur 10 jours, deux Big Four mettent Claude à ~530 000 collaborateurs combinés. Préparer une note de fond (4 pages) sur les conséquences pour les clients de conseil français : nouveaux livrables, nouveaux prix, nouvelle ligne de partage entre cabinets « équipés » et « non équipés ».
  3. Cartographier l’écosystème Cohere–Indra–Multiverse pour les clients défense / public regulated. Compléter la matrice « Souveraineté IA » à 3 colonnes (US Big Tech / Cohere–Aleph Alpha–Indra–Multiverse / Mistral) × 5 lignes (défense, énergie, finance, santé, public). À utiliser comme support Codir pour les clients régulés.
  4. Préparer la couverture éditoriale du Mistral AI NOW Summit (28 mai). Brief commercial : qualifier la liste des dirigeants présents (CAC 40, ETI régulées, secteur public). Post LinkedIn de chaud le soir-même. Note de fond (4 pages) le 1er juin intégrant les annonces produit et les keynotes.
  5. Intégrer Bristol Myers Squibb au case-study pharma de Semperia. Premier déploiement Claude Enterprise massif en pharma (30 000+ collaborateurs), avec un cas d’usage régulatoire en production. Cas d’école à documenter pour les analyses 360° BMA en santé / sciences de la vie.
  6. Veille à surveiller cette semaine et la suivante :

 

Sources

Modèles, infrastructure & plateformes

Agentique en entreprise & cabinets de conseil

Gouvernance, contrôle agentique & régulation

Souveraineté européenne — Cohere, Indra, Multiverse, Mistral

Marché du travail

Durabilité & énergie

McKinsey & cadres business model