Testé n'est pas testé

L'un coche une case Jira. L'autre tourne à chaque étape vers la mise en production. Avec l'IA qui accélère les équipes de développement, les organisations qui n'accélèrent pas le test au même rythme perdent le contrôle - en général sans s'en apercevoir.

Publié le 14 May 2026 par Gabriel Tanguay

« Testé » est un mot qui cache un problème de mesure. Dans une réunion de statut, il signifie une colonne dans un tableur, cochée. Dans un système qui doit tenir cinq ans à travers une demi-douzaine de services et trois langues, il signifie une suite de régression qui tourne à chaque étape vers la mise en production et qui aurait attrapé le bug d'hier avant qu'il ne se produise. L'écart entre ces deux significations est l'endroit où vit la majeure partie du coût du logiciel - et c'est aussi là que l'IA vient bouleverser complètement la donne.

Ce que tester coûte réellement

D’abord, la réalité du budget. Les chiffres ci-dessous sont des fourchettes de l’industrie largement citées (ISTQB, IEEE, des décennies d’enquêtes de projet) et ils ne bougent pas beaucoup avec la stack technique.

  • Nouveau développement logiciel : tester consomme typiquement 25% à 40% de l’effort total du projet. Plus dans les domaines régulés ou critiques pour la sécurité.
  • Logiciel en développement actif (post-MVP, encore en ajout de fonctionnalités) : chaque sprint dépense 30% à 50% de sa capacité en test, et la part grandit avec la surface. Chaque nouvelle fonctionnalité doit cohabiter avec tout ce qui a déjà été livré, dans chaque langue où le produit tourne.
  • Logiciel en maintenance : le test domine. 50% à 70% de l’effort de maintenance est du travail de vérification. La cible ROI ici est directe : chaque euro dépensé en régression automatisée fait économiser des multiples en coût d’incident de production. Un bug attrapé en test coûte typiquement 10x à 100x moins cher que le même bug attrapé en production.

Ce qui change, c’est ce que ces pourcentages achètent. Le même budget de 30% par sprint peut acheter un passage de test manuel unique, oublié le lendemain matin, ou une suite de régression qui se capitalise sur cinq ans. C’est le choix.

L’actif, pas l’artefact

Le logiciel ne dure pas seulement parce qu’il a été bien construit une fois. Il dure parce qu’il reste livrable, mois après mois, année après année, sans remettre en cause ce qui a déjà été payé. Ce qui protège cet investissement cumulatif, c’est la régression : une batterie de vérifications automatiques qui tourne à chaque étape vers la mise en production - le check de PR, le build d’intégration, la promotion en staging, la barrière de pré-prod - et qui dit, avec confiance : « vous n’avez pas cassé l’export de facture, le login SSO ou le rendu PDF pour les clients francophones ».

Un test qui a tourné une fois, qui a été inscrit dans un ticket Jira X-Ray coché « Passé » et qui n’a plus jamais tourné, n’est pas un actif. C’est un artefact de documentation. Le coût est réel - quelqu’un a passé une journée à le produire. La valeur cumulative est nulle. La prochaine fois que quelqu’un touche cette zone du code, un humain doit refaire le travail - ou, plus souvent, ne le fait pas et livre la modification quand même.

La seule sorte de test qui protège l’investissement, c’est celui qui continue à tourner sans vous.

Quelqu’un a-t-il testé dans la langue cible à la fin ?

L’autre chose qui ne survit pas au tampon « testé », c’est la localisation. Le logiciel européen livre dans un marché fragmenté. Une application suisse a des clients germanophones, francophones et italophones. Les formats de nombre se partagent entre CHF 1'000.50 (apostrophe comme séparateur des milliers) et 1.000,50 (virgule décimale). Les chaînes de date comme « 01/06/2026 » peuvent être valides dans deux langues et signifier des jours différents. Les codes fiscaux, les regex de codes postaux, la différence entre « Mwst. » et « MwSt. », la différence entre « courriel » et « e-mail » - rien de tout cela n’apparaît dans un plan de test exécuté par des gens qui ne lisent pas les lettres de la clientèle.

Un testeur qui passe chaque flux fonctionnel peut quand même livrer un logiciel qui se lit cassé pour la clientèle. Le temps que quelqu’un le signale, le correctif s’est cumulé en une release de hotfix, un courriel d’excuses et (si la cliente est régulée) une question de conformité.

La connaissance locale est un actif de test. La plupart des budgets de test ne le tarifent pas comme tel.

Ce que l’IA vient de changer

Pendant longtemps, le calcul derrière « externaliser le test à une grande équipe externe » semblait stable. Le test exploratoire manuel évoluait linéairement avec les personnes, et le levier était d’embaucher plus de testeurs.

Le calcul s’est inversé. Un ingénieur senior qui connaît le produit, la langue et le cadre réglementaire peut désormais s’asseoir avec un outil d’exploration assisté par LLM, parcourir une fonctionnalité une fois, et faire capturer ce parcours en un test bout en bout déterministe et reproductible qui rejoint la suite de régression le même après-midi. Ce qui était une semaine d’écriture de scripts de test est désormais une heure. Ce qui était un passage manuel unique devient un actif qui continue à tourner, à chaque étape de promotion, dans chaque langue où le produit est livré.

Nous avons vu des cycles de vérification se comprimer de passages de régression de plusieurs semaines à des suites qui finissent en dizaines de minutes à chaque étape liée à la mise en production. Des équipes qui livraient mensuellement livrent désormais hebdomadairement, ou par fonctionnalité, sans perdre de couverture. Le 10x à 100x est dans le temps-de-changement-à-vérifié-livrable, non pas dans le nombre brut de releases - et c’est précisément la métrique à laquelle tient celle ou celui qui répond du système.

Ce n’est pas une affirmation de type « utilisez un agent conversationnel pour écrire les tests ». La partie intéressante n’est pas un outil unique. C’est que la même personne senior sachant lire la langue de la clientèle, juger si la nouvelle fonctionnalité est la bonne à construire, et concevoir la stratégie de régression, peut désormais aussi produire en quelques heures un actif de test qui exigeait auparavant une équipe de dix. Le levier s’est déplacé à un endroit inattendu.

L’urgence : vitesse de développement sans vitesse de test signifie la perte de contrôle

C’est la part que la plupart des organisations n’ont pas encore intégrée. L’IA accélère les équipes de développement partout. Le même ingénieur qui livrait une fonctionnalité par semaine refactorise désormais trois modules et prototype un quatrième dans la même semaine. Ce débit se cumule chaque trimestre.

Si la fonction test n’accélère pas au même rythme, le résultat n’est pas « livraison plus rapide ». C’est la perte de contrôle. Davantage de changements traversent la même porte étroite de vérification, la porte devient le goulot d’étranglement ou commence à être contournée, et la production devient discrètement l’environnement de test. Les premiers symptômes sont subtils - quelques rollbacks de plus, une hausse inexpliquée des défauts signalés par la clientèle, une régression qui s’échappe pendant deux sprints avant que quelqu’un ne s’en aperçoive. Les symptômes plus tardifs ne sont pas subtils. Ce sont un constat d’audit, une lettre de régulateur, ou un client payant qui vous dit qu’il ne fait plus confiance au logiciel sur lequel il a bâti ses opérations.

Les organisations qui associent une équipe de développement accélérée par IA avec un processus de test à la mode de 2018 augmentent le risque - en général sans s’en rendre compte - à chaque sprint. La seule réponse stable est que la vitesse de test doit croître au moins aussi vite que la vitesse de développement. C’est ce qui rend l’automatisation de régression stratégique aujourd’hui, et non plus tactique.

Pourquoi le modèle local/hybride livre mieux maintenant

Le modèle de test offshore était un choix d’achat, pas un choix de qualité. Il avait du sens quand le travail de test était le goulot et que les effectifs étaient le levier. La structure de contrat, facturée à l’heure de testeur, correspondait à la forme du travail.

Cette forme est désuète pour la nouvelle économie. Une équipe facturée à l’heure n’a aucune raison intégrée de comprimer les deux tiers du travail manuel en automatisation. Remplir des tickets Jira X-Ray avec « testé » génère une facture horaire mais n’assure pas la stabilité d’un produit digital à long terme. Produire une suite de régression automatisée et semi-autonome ferait rétrécir la facture. La plupart des équipes sous ce contrat continuent donc à produire l’artefact, pas l’actif - et elles ne peuvent pas être en plus celles qui remarquent que l’en-tête de facture allemand dit « MwSt. » alors qu’il devrait dire « Mwst. », parce qu’elles ne lisent pas la langue de la clientèle.

Une petite équipe locale ou hybride optimisée pour l’automatisation des tests fonctionne à l’inverse. Plus vite la suite de régression attrape les défauts sans surveillance, plus vite l’équipe est libre de livrer les prochaines fonctionnalités et de participer à quelques tests manuels exploratoires pour identifier les vrais soucis. Quelqu’un dans l’équipe comprend le contexte métier du client - y compris sa langue - et repère quand le format de date rend le mauvais jour. Le levier de l’IA se capitalise. Les ressources s’alignent naturellement sur la valeur livrée et la pérennité du produit, pas sur le nombre d’heures de testeur consignées ce sprint.

Si c’est la forme de processus de test que vous voulez, c’est exactement le mandat de notre service QA et automatisation des tests.

Où le budget de test doit réellement aller

Tester n'est pas une phase qu'on termine. C'est un poste de 30% à 70% qui dure toute la vie du logiciel, et la seule question qui vaille est de savoir si votre investissement achète un artefact ou un actif.

La régression qui tourne sans surveillance à chaque étape vers la mise en production - et que quelqu'un dans l'équipe peut lire dans la langue cible - est ce qui protège la valeur du produit sur cinq ans. Tout le reste est de la documentation.

L'IA accélère les équipes de développement plus vite que la plupart des fonctions de test ne peuvent suivre. Si votre processus de test ne s'est pas comprimé au même rythme que votre débit de développement, vous perdez le contrôle même si les tableaux de bord ont l'air verts. Choisissez une équipe dont le contrat est aligné sur la durée de vie du logiciel, pas sur les heures consignées ce sprint.

Parlons-en.

Vous vous demandez si votre processus de test a tenu le rythme auquel vos ingénieurs (et leurs outils IA) livrent désormais ? Échangez avec un expert Luzid. Nous revenons vers vous dans la journée ouvrée.