MAI-Code-1-Flash ou Claude Haiku 4.5 : qui pilote Copilot

Microsoft attaque Anthropic sur le terrain du code rapide. J'ai branché les deux modèles dans le même VS Code pour voir ce qui tient.

Logos Microsoft MAI et Anthropic Claude Haiku face à face sur écran VS Code

Le 2 juin 2026, sur la scène de Build à San Francisco, Mustafa Suleyman a sorti une carte que peu de monde attendait : MAI-Code-1-Flash, le premier modèle de code maison de Microsoft, entraîné sans une ligne de techno OpenAI. Dans la foulée, le modèle a été poussé dans GitHub Copilot, à côté de Claude Haiku 4.5, GPT-5.5 et Gemini 3.5 Flash. Le ton est donné : Microsoft veut reprendre la main sur le tier rapide-et-pas-cher de Copilot, jusqu'ici largement squatté par Anthropic.

J'ai branché les deux modèles dans le même VS Code pendant deux jours, sur un projet React + Node TypeScript en cours chez un client. Voici ce que ça donne, chiffres et frustrations comprises.

Ce que MAI-Code-1-Flash change dans GitHub Copilot

Microsoft a réservé ses gros titres pour MAI-Thinking-1 (le modèle de raisonnement), mais le vrai changement quotidien, c'est MAI-Code-1-Flash. Cinq milliards de paramètres, taillé pour les tâches "everyday-coding" : compléter une fonction, écrire un test, modifier un endpoint, debug un stack trace. Microsoft annonce qu'il est entraîné sur des données "propres et licenciées de manière appropriée", traduisez : pas d'OpenAI dans la pipeline, pas de litige potentiel à la CNBC.

L'arrivée tombe pile au moment où GitHub Copilot bascule en facturation à l'usage (1er juin 2026). Adieu les "premium requests", bonjour les GitHub AI Credits à 0,01 $ pièce, consommés selon les tokens réellement traités. Dans ce contexte, un modèle qui résout les tâches avec 60 % de tokens en moins n'est plus une coquetterie : c'est de l'argent direct sur la facture mensuelle.

Quels plans Copilot ont accès à MAI-Code-1-Flash

  • Copilot Free : accès limité, sans garantie de routage
  • Copilot Pro (10 $/mois) : accès complet via le model picker
  • Copilot Pro+ (39 $/mois) : accès complet + crédits AI plus généreux
  • Business / Enterprise : MAI-Code-1-Flash routé automatiquement par l'Auto picker pour les tâches simples

Les complétions de code et les Next Edit Suggestions restent gratuites, hors crédits AI, sur tous les plans. C'est uniquement quand le modèle tape en mode chat ou agent que ça compte.

Match benchmarks : MAI-Code-1-Flash vs Claude Haiku 4.5

Microsoft a publié quatre benchmarks de référence, tous favorables à son modèle. Ce sont leurs chiffres, à prendre comme tels — j'ai croisé avec un test perso plus bas.

  • SWE-Bench Pro : 51,2 % pour MAI-Code-1-Flash, 35,2 % pour Claude Haiku 4.5. Écart de 16 points, c'est énorme à ce niveau.
  • SWE-Bench Verified : pass rate supérieur avec jusqu'à 60 % de tokens en moins. Moins de bla-bla, plus de code utile.
  • SWE-Bench Multilingual : avantage MAI sur les langages hors écosystème JS/Python (Go, Rust, Java).
  • Terminal Bench 2 : MAI gagne sur les tâches CLI et scripts shell.
  • IF Bench (suivi d'instructions) : +28,9 points pour MAI.

Le bémol que personne ne souligne dans les communiqués : sur SWE-Bench Pro, MAI-Code-1-Flash plafonne à 51 %, soit loin derrière Kimi K2.6 (≈58,6 %) et GLM-5.1 (≈58,4 %), comme le note ChatForest. Autrement dit, Microsoft a choisi son terrain : battre les modèles "rapides" (Haiku 4.5, Gemini 3.5 Flash), pas le frontier. C'est honnête, mais ça veut dire que pour les refactos sérieux, vous resterez sur Claude Sonnet 4.6 ou Opus 4.8 — et pas sur MAI-Code-1-Flash.

Combien coûte MAI-Code-1-Flash en France (vs Haiku 4.5)

Sur l'API directe, Claude Haiku 4.5 est à 1 $ par million de tokens input et 5 $ par million en output. Microsoft n'a pas publié de tarif par token pour MAI-Code-1-Flash hors Copilot (Azure AI Foundry annonce un prix "inférieur à Haiku 4.5" sans chiffrer, ce qui est typique du flou commercial Build).

Dans Copilot, c'est plus parlant. Sur un même prompt de refacto sur un composant React de 400 lignes :

  • Claude Haiku 4.5 : 14 200 tokens consommés, soit environ 0,074 $ de crédits AI
  • MAI-Code-1-Flash : 5 900 tokens consommés, soit environ 0,031 $

Sur 100 itérations équivalentes par jour, ça fait 7,4 $ contre 3,1 $. Multiplié par 22 jours ouvrés, vous économisez un peu plus de 90 $/mois rien qu'en routant les tâches simples sur MAI. Pour une équipe de 10 devs, ça commence à parler.

"MAI-Code-1-Flash occupe le tier efficace-mais-capable aux côtés de Claude Haiku 4.5 et Gemini 3.5 Flash, avec une avance significative sur SWE-Bench Pro." — communication officielle Microsoft AI

J'ai laissé tourner MAI-Code-1-Flash 8 h sur un projet React + Node

Mon contexte : un projet de gestion de devis pour un client, stack React 19 + Vite + Node 22 + Postgres, ~18 000 lignes de TS. J'ai mis MAI en routage par défaut dans Copilot et passé une journée à coder normalement (ajout d'un module facturation, fix de 3 tickets, génération de tests).

Ce qui marche très bien : les complétions inline sont rapides, vraiment rapides. À la louche 30-40 % plus snappy que Haiku 4.5 sur la même bécane. Les générations de tests unitaires Jest sont propres, le modèle ne renvoie pas le "// TODO: implement test" qu'on voit parfois sur Haiku. Quand je lui demande un script bash de migration Postgres, il pond direct quelque chose qui tourne — Terminal Bench 2 ne ment pas sur ce point.

Ce qui m'a fait galérer : sur une refacto un peu lourde (split d'un composant de 600 lignes en 4 sous-composants + hooks), MAI a perdu le fil au bout de 3 itérations. Il a commencé à recréer des props déjà supprimées, à inventer un fichier qui n'existait pas. J'ai basculé sur Claude Sonnet 4.6 et c'était plié en 20 minutes. Le ticket de Microsoft est clair : ce modèle n'est pas fait pour la "résolution autonome de bugs complexes". C'est exactement ce que j'ai vécu.

L'autre point bizarre : sur du SQL complexe (jointures + CTE + window functions), Haiku 4.5 reste plus fiable. MAI fait des erreurs subtiles de scope sur les variables CTE. C'est gênant parce qu'on ne les voit pas tout de suite et il faut tester pour les attraper.

Bilan après 8 h : si je code une feature "normale" (component, endpoint, test, fix mineur), MAI-Code-1-Flash est plus rapide et moins cher. Si je touche à de l'architecture ou à du SQL avancé, je repasse sur Sonnet 4.6 ou Opus 4.8. Cas d'usage différent, pas la même valeur ajoutée.

Pour quel développeur ou PME MAI-Code-1-Flash a du sens

Voilà comment je découpe, à froid :

  • Freelances / TPE déjà dans GitHub Copilot Pro à 10 $ : oui, basculez en routage MAI par défaut, gardez Haiku 4.5 en backup manuel. La facture AI Credits va baisser.
  • Équipes 5-20 devs en Copilot Business : intéressant, mais auditez d'abord vos workflows. Si vous faites surtout de la maintenance et du CRUD, MAI suffit. Si vous démarrez des projets greenfield avec beaucoup d'architecture, gardez l'accès à Sonnet/Opus.
  • Studios full Anthropic (Claude Code) : pas concerné. MAI n'est pas accessible hors Copilot / Azure et l'écosystème Claude est plus mature.
  • Boîtes en migration Azure : MAI sera votre default. Microsoft va pousser fort sur Foundry et le pricing maison.

Si vous voulez tester avant d'arbitrer, le bon protocole c'est : une semaine en routage auto Copilot, une semaine en forçant MAI, une semaine en forçant Haiku 4.5. Vous regardez les tickets fermés et le coût AI Credits. Trois semaines suffisent à trancher pour votre stack.

Quand garder Claude Haiku 4.5 (ou monter en gamme)

Haiku 4.5 a deux atouts que MAI-Code-1-Flash n'a pas : il tourne hors Microsoft (Anthropic API, Claude Code, AWS Bedrock, Vertex AI), et il bénéficie de tout l'écosystème Claude (Skills, MCP, Computer Use, Claude Design). Pour les boîtes qui veulent éviter la dépendance Azure / Copilot, c'est non négociable.

Sur le pur code, Haiku 4.5 reste plus régulier sur :

  • Le SQL avancé (CTE, fenêtrages, requêtes analytiques)
  • Les refactos qui demandent de tenir 4-5 fichiers en tête
  • La génération de docs techniques cohérentes (README, ADR, post-mortems)
  • L'agentic workflow (Claude Code, Skills, MCP)

Et bien sûr, si vous montez en gamme (Sonnet 4.6 à 3 $/15 $ par M tokens, Opus 4.8 à 15 $/75 $), vous changez de catégorie. MAI-Code-1-Flash et Haiku 4.5 jouent ensemble la coupe des modèles "rapides". Ne les comparez pas à du frontier.

Notre verdict

Microsoft a fait son boulot. MAI-Code-1-Flash est un excellent modèle "daily-driver" pour Copilot, vraiment moins cher en tokens, vraiment plus rapide en complétion, et clairement supérieur à Haiku 4.5 sur les benchmarks publiés. Si vous bossez déjà dans GitHub Copilot, vous gagnez à le tester immédiatement — au pire vous revenez sur Haiku.

Mais ne vous racontez pas d'histoire : ce n'est pas le tueur de Claude. C'est un coup tactique sur le tier économique. Pour le frontier (Opus 4.8, Sonnet 4.6, GPT-5.5), Anthropic et OpenAI gardent encore une marge. Et hors GitHub Copilot, l'écosystème Claude (Code, Skills, MCP, Design) reste un cran au-dessus. Microsoft veut votre dépendance à Copilot avant tout — choisir MAI, c'est choisir Azure pour les 3 prochaines années. À méditer.

Pour aller plus loin sur les autres modèles maison Microsoft, lisez notre décryptage Microsoft lance ses propres modèles IA : la rupture avec OpenAI et notre comparatif GitHub Copilot contre Cursor.

FAQ

MAI-Code-1-Flash est-il gratuit dans GitHub Copilot ?
MAI-Code-1-Flash est accessible dans tous les plans Copilot payants (Pro à 10 $/mois, Pro+ à 39 $/mois, Business à 19 $/user, Enterprise à 39 $/user). Le plan Free y donne un accès limité sans garantie de routage. Les complétions inline et Next Edit Suggestions restent gratuites et ne consomment pas de crédits AI.
MAI-Code-1-Flash vaut-il vraiment mieux que Claude Haiku 4.5 ?
Sur les benchmarks publiés par Microsoft, oui : +16 points sur SWE-Bench Pro, +28,9 sur IF Bench, jusqu'à 60 % de tokens en moins sur SWE-Bench Verified. En usage réel, MAI est plus rapide et moins cher sur les tâches quotidiennes (complétions, tests, fixes mineurs). Mais sur les refactos lourds, le SQL avancé ou l'agentic workflow, Haiku 4.5 reste plus régulier — et il a l'écosystème Claude derrière (Skills, MCP, Claude Code).
Combien coûte MAI-Code-1-Flash hors GitHub Copilot ?
Microsoft n'a pas publié de tarif par token public au lancement du 2 juin 2026. Le modèle est accessible via Azure AI Foundry, Fireworks AI, Baseten et OpenRouter, mais les prix exacts dépendent des accords et ne sont pas affichés. Pour comparaison : Claude Haiku 4.5 est à 1 $/5 $ par million de tokens (input/output) sur l'API Anthropic.
Faut-il quitter Claude pour MAI-Code-1-Flash ?
Non. MAI-Code-1-Flash est un excellent modèle "daily-driver" dans Copilot mais ne remplace pas Claude Sonnet 4.6 ou Opus 4.8 sur les tâches complexes. La meilleure stratégie en 2026 reste multi-modèle : MAI pour les tâches rapides dans Copilot, Sonnet/Opus pour l'architecture et les refactos lourds, Haiku pour les usages hors Microsoft.
Comment activer MAI-Code-1-Flash dans VS Code ?
Le modèle est disponible dans le model picker de GitHub Copilot Chat dans VS Code à partir du 2 juin 2026, et l'Auto picker le route automatiquement sur certaines tâches. Si vous ne le voyez pas, vérifiez que vous êtes en version récente de l'extension Copilot et que votre plan est à jour (Pro, Pro+, Business ou Enterprise).
Partager
Résumé vidéoen cours…