QA et automatisation des tests

Automatisation des tests assistée par IA, pour les équipes dont le débit de développement vient de doubler.

Vitesse de développement sans vitesse de test signifie la perte de contrôle

L’IA a accéléré le développement logiciel partout. La même ingénieure qui livrait une fonctionnalité par semaine refactorise aujourd’hui trois modules et prototype un quatrième. Si le processus de test ne s’est pas comprimé au même rythme, davantage de changements traversent la même porte étroite, la porte devient le goulot d’étranglement, ou pire : elle est contournée - et la production devient discrètement l’environnement de test.

Avec plus de testeurs, vous ne rattrapez pas. Ce qui rattrape : une suite de régression qui tourne sans surveillance à chaque étape vers la mise en production, construite et entretenue par des ingénieurs seniors qui savent utiliser l’IA pour comprimer une semaine d’écriture de scripts de test en un après-midi. C’est exactement ce que livre ce service.

Vous voulez d’abord lire l’argumentation longue ? Lisez Testé n’est pas testé.

Quand cela s’applique

  • Les ingénieurs livrent plus vite (avec ou sans assistance IA) et la vérification est devenue le goulot d’étranglement.
  • « Testé » veut dire aujourd’hui un ticket Jira coché « passé », pas une pipeline CI verte qui a fait tourner toute la suite de régression.
  • Les releases glissent parce que les passages de tests manuels ne rentrent plus dans la cadence que le métier attend désormais.
  • Le produit tourne dans plusieurs langues et les bugs n’apparaissent que dans celle que personne dans l’équipe ne lit.
  • Une modernisation, une migration ou un grand refactoring est sur la table et le filet de tests existant ne rattraperait pas les régressions.
  • Un travail d’audit, de régulateur ou de certification a besoin de preuves de test documentées et reproductibles - pas d’un dossier de captures d’écran.

Ce que nous livrons

Stratégie et audit des tests

Nous démarrons par un audit de ce que vous avez aujourd’hui : où sont réellement les manques, et ce qui rapporte le plus de ROI au prochain trimestre. La stratégie qui suit est ancrée sur ISTQB - une pyramide de tests, une priorisation par risques, et une carte explicite de ce qui tourne où (check de PR, build d’intégration, promotion en staging, barrière de pré-prod). L’outillage (Playwright, Cypress, Jest, JUnit, k6, Lighthouse, harnais sur mesure) est choisi depuis votre stack, pas depuis une fiche commerciale. Ce que vous emportez, c’est une feuille de route vers un filet de tests qui se capitalise - mesuré en cycle-time-to-verified-shippable, pas en heures de testeur.

Automatisation qui se capitalise

Les suites bout en bout sont construites avec capture assistée par IA : un ingénieur de tests parcourt une fonctionnalité une fois avec un outil d’exploration assisté par LLM, et le parcours rejoint la suite de régression le même après-midi. En dessous, les tests unitaires et d’intégration collent à l’architecture réelle - pas une fine couche de tests UI fragiles qui prétend être de la couverture. Tout tourne en CI : chaque pull request à travers le pipeline, chaque promotion en staging à travers la barrière, rien n’est oublié à la main. Un budget de flake - quarantaine au premier flake, fix-or-delete dans le sprint, coupe-circuit quand une classe de tests perd la confiance - garde la suite fiable plutôt que muette. Les données de test sont gérées avec respect de la vie privée : pas de données client réelles dans les environnements de test.

Vérification API et inter-systèmes

Les tests d’UI ne sont qu’une couche. La plupart des bugs qui s’échappent en production vivent dans les coutures entre systèmes - le portail l’a affiché, mais l’intégration backend ne l’a jamais reçu ; l’API a renvoyé 200, mais l’enregistrement en aval est faux ; le contrat de staging marche, celui de prod non.

Nos suites de tests d’API visent chaque environnement - dev, staging, pré-prod, prod en lecture seule - sur le même chemin de code, pour que la dérive de contrat entre les étapes apparaisse comme un échec de test, pas comme un ticket client. Par-dessus, la réconciliation inter-systèmes joue un véritable flux métier à travers le portail, l’API et le système backend intégré, et vérifie que l’état correspond à chaque endroit : même enregistrement, mêmes champs, mêmes totaux, même piste d’audit. Là où cela paie, nous ajoutons des tests de contrat consumer-driven pour qu’un changement d’API tiers ne casse pas silencieusement l’intégration deux sprints plus tard. Les mêmes flux tournent en surveillance synthétique en production, pour qu’une panne d’intégration apparaisse en quelques minutes via un canary, pas en quelques semaines via un ticket client. Les données et fixtures de test sont conscientes de l’environnement - elles survivent aux limites de débit, aux remises à zéro de données et aux règles d’isolation des partenaires d’intégration.

Performance, accessibilité et résilience

  • Tests de charge et de stress avec SLO définis et détection de régression à chaque release.
  • Vérifications d’accessibilité (WCAG 2.2 AA) intégrées en CI - pas un audit unique avant le lancement.
  • Tests Lighthouse et smoke à chaque déploiement.
  • Exercices de chaos et de modes de défaillance pour les systèmes où la disponibilité est le contrat.

Vérifications de sécurité dans le pipeline de build

Le code qui passe par le pipeline de build porte ses propres barrières de sécurité. Nous traitons SAST et DAST comme des contrôles qualité de premier rang sur le logiciel livré - pas comme un chantier séparé qui tourne une fois par an.

SAST tourne sur chaque pull request : secrets, points d’injection, désérialisation non sûre et mauvais usage cryptographique attrapés avant que le code ne soit fusionné. DAST tourne sur chaque promotion en staging et sonde l’application en cours d’exécution sur les catégories OWASP Top 10 contre de vrais endpoints. Le scan des dépendances se fait au moment du build, pour qu’une nouvelle dépendance transitive vulnérable fasse échouer ou avertisse le build par politique, pas trois mois plus tard par accident. Les constats sont triagés comme tout autre échec de test : classifiés, avec un propriétaire, dans un délai borné, jamais silencieusement coupés. Tout ce qui vit après la construction de l’artefact - suivi SBOM, mise en correspondance des CVE avec l’infrastructure, évaluation d’exploitabilité - passe à Exploitation et durcissement.

Tester dans la langue du client

  • Tests de localisation et i18n qui échouent bruyamment quand CHF 1'000.50 est rendu en 1.000,50 ou que « Mwst. » devient « MwSt. ».
  • Vérifications de format de date, de devise et d’adresse pour chaque langue que vous livrez.
  • Revue trilingue de l’interface rendue - par des personnes qui lisent vraiment l’allemand, le français et l’anglais.

Où l’IA s’insère dans notre boucle de test

Nous utilisons l’IA pour comprimer des semaines en jours - pas pour livrer ce que nous ne livrerions pas sans elle.

La capture de tests assistée par IA est le plus grand changement : une fonctionnalité est parcourue une fois initialement, le test déterministe rejoint la suite le même après-midi. Quand quelque chose échoue, la personne de maintenance demande « pourquoi ceci a échoué » et obtient une hypothèse classée d’un LLM, plutôt qu’un mur de stack traces à lire de haut en bas. Les données de test et cas limites générés couvrent des espaces combinatoires qu’aucun humain n’écrirait à la main. Chaque actif de test assisté par IA passe par une barrière de revue senior - celui qui le livre l’assume, comme sans IA. Par défaut, il n’y a aucun usage de données client dans des LLM publics : aucune donnée personnelle n’est transmise à des outils IA, et nous offrons des modèles auto-hébergés en Suisse ou en Europe lorsque le travail le demande.

Comment nous travaillons

Nous nous ancrons sur le référentiel ISTQB : stratégie de test, gestion, automatisation, performance. De quoi tenir la route quand votre auditeur examine le travail. Chaque mandat commence par un cadrage explicite, comporte des points de contrôle convenus, et se termine par un rapport écrit : résumé exécutif, ce qui tourne où, les indicateurs qui comptent (cycle-time-to-verified, escape rate, flake rate), et les priorités du prochain sprint.

Pour les tests de sécurité applicative, y compris les pentests alignés OWASP et le travail de red team, voir Exploitation et durcissement.

Pourquoi Luzid

  • Des ingénieurs seniors qui savent lire votre stack, la langue de vos clients et la conception des tests - pas un pool de testeurs distants facturés à l’heure.
  • Stratégie, conception, automatisation, performance - une équipe ancrée sur ISTQB, à un niveau de qualité qu’attend votre auditeur.
  • L’IA comme levier côté tests, pas seulement côté dev - pour que la vérification se comprime au même rythme que le développement.
  • Des rapports de test qui parlent le langage des parties prenantes, pas seulement des développeurs.
  • Trilingues en allemand, français et anglais.
Remplacez-vous notre équipe QA interne ?

Non. Nous travaillons avec l'équipe que vous avez - en apportant stratégie de test, muscle d'automatisation et capture assistée par IA là où les techniques modernes permettent le plus d'accélération. L'objectif final est que votre équipe possède une suite à laquelle elle fait confiance, pas que nous devenions indispensables.

Pouvez-vous reprendre une suite Cypress, Playwright ou Selenium existante ?

Oui. Nous démarrons par un audit (ce qui tourne, ce qui est coupé, ce qui est flaky, quelle couverture est réelle), puis nous mettons le tout sous une seule barrière CI avec un budget de flake explicite. La majeure partie de la valeur vient de la couche stratégie, pas de la réécriture de tests qui fonctionnent.

Testez-vous uniquement l'UI, ou aussi les APIs et les systèmes intégrés ?

Les deux - et nous mettons généralement le poids sur la couche API et inter-systèmes, car c'est là que vivent la plupart des bugs à fort impact en production. Nous frappons les APIs sur chaque environnement sur le même chemin de code, et nous jouons des flux de réconciliation qui font passer un véritable cas métier par le portail, l'API et le système backend intégré - en vérifiant que le même enregistrement, avec les mêmes champs et la même piste d'audit, apparaît à chaque endroit. L'E2E sur l'UI s'ajoute par-dessus, pas en seule couche.

Que veut dire concrètement « capture de tests assistée par IA » ?

Un ingénieur de test parcourt une fonctionnalité avec un outil d'exploration assisté par LLM. Le parcours est capturé en un test déterministe de bout en bout et reproductible - revu et committé le même jour. Ce qui était une semaine d'écriture de scripts de test devient un après-midi. L'actif tourne ensuite sans surveillance à chaque étape de promotion.

Où SAST et DAST se situent-ils dans votre pipeline de test ?

SAST tourne sur chaque pull request - il lit le code statiquement et signale secrets, points d'injection, désérialisation non sûre et mauvais usage cryptographique avant que la modification ne soit fusionnée. DAST tourne sur chaque promotion en staging - il sonde l'application en cours d'exécution sur les catégories OWASP Top 10 sur de vrais endpoints. Les deux sont soumis à la politique de sécurité de votre organisation et triagés comme tout autre échec de test, avec un propriétaire classifié et un délai borné. Ce sont des contrôles qualité sur le logiciel livré, pas un audit annuel.

Comment évitez-vous que la suite ne devienne flaky ?

Chaque projet reçoit une politique de flake explicite : quarantaine au premier flake, fix-or-delete dans le sprint, coupe-circuit quand une classe de tests perd la confiance. Un test coupé est pire que pas de test du tout.

Combien coûte la mise en place par rapport au fonctionnement ?

La mise en place est un bloc unique (audit + stratégie + colonne vertébrale d'automatisation initiale), typiquement des semaines, pas des mois. Ensuite, chaque itération de développement porte deux coûts de test continus : mettre à jour les suites de test pour couvrir ce qui a été ajouté ou modifié, et faire tourner les suites plus évaluer les résultats - y compris le triage qui vous dit, défaut par défaut, si la prochaine bonne action est un correctif de code, un correctif de configuration, ou une parade opérationnelle qui tient la position jusqu'à ce qu'un vrai correctif puisse être livré. En régime établi cela se situe entre 30% et 50% de la capacité d'ingénierie produit sur la plupart des produits. Notre objectif est de comprimer cette part, pas de la préserver.

Faites-vous aussi des pentests et des engagements de red team ?

Oui - ils vivent sous Exploitation et durcissement, notre service d'exploitation et de sécurité, aux côtés de la réponse aux CVE pilotée par SBOM et de l'introspection d'infrastructure. Nous traitons le travail de sécurité par scénarios et la posture de sécurité côté production comme une discipline distincte, pour que le service QA reste centré sur la vérification fonctionnelle, de performance, de localisation et de sécurité dans le pipeline.

Échangez avec un expert QA Luzid.

Parlez à un expert Luzid. Réponse sous un jour ouvré.