Test utilisateur

Techniques d'évaluation en UX

Mattia A. Fritz
TECFA, Université de Genève

Deux grandes fonctions

Conception et évaluation

Un team/professionnel/projet de UX peut s'occuper exclusivement/principalement de l'une ou de l'autre, ou proposer les deux en même temps.

Évaluation

L'évaluation mesure l'adéquation entre les attentes des concepteurs/stakeholders d'une part, et l'utilisation et perception du public cible de l'autre.

Continuum

Performance

Perception

Quelques méthodes

  • Oculométrie (Eye-tracking)
    Mesure physiologique de type performance.
  • Test A/B
    Mesure statistique (souvent) de type performance.
  • Test des 5 seconds
    Mesure perceptive de la première impréssion.
  • Échelles utilisabilité/UX
    Mesures perceptives standardisées et validées empiriquement.
  • Test utilisateur
    Technique d'évaluation holistique combinant performance et perception.

Oculométrie

Mesure la position et le mouvement des yeux :

  • Fixations
    Information processing. Temps pendant lequel la pupille ne bouge pas (en réalité elle bouge toujours). En général, indication que la personne traite l'information.
  • Saccades
    Information seeking. Temps pendant lequel la pupille se déplace grâce aux mouvements oculaires. En général, indication que la personne cherche de l'information à traiter.

Yarbus (1967)

Différents patterns Lucs-kho at English Wikipedia, Public domain, via Wikimedia Commons

Manifestation d'intérêt

Image d'une mappe de chaleur Test utilisateur sur un outil d'awareness émotionnelle dans un mémoire de Master (Fritz, 2015).

Test A/B

Répartition aléatoire à une version de l'interface différente.

Deux versions différentes d'un bouton Maxime Lorant, CC BY-SA 4.0, via Wikimedia Commons

Parfois avec test statistique

Version Utilisateurs Oui Non %
A 500 91 409 18.20%
B 500 119 381 23.80%

$\chi^2$(1, N = 1000) = 4.39, p = .036

Dans la version B, les utilisateurs ont eu un comportement d'intérêt (e.g. cliquer sur un bouton, visiter une page, s'inscrire à une mailing list, ...) avec une fréquence de 5 points de pourcentage plus élevée que pour la version A.

Différents types de test A/B

Coordonnées d'un plan
Tiré de Designing with Data (King et al., 2017)

Local vs. Global

Différence locale
Local
Différence dans la labellisation d'un bouton
Différence locale
Global
Différence dans l'affichage des éléments

Exploration vs. Evaluation

  • Exploration : sans hypothèse précise
    Le team UX utilise les données du test A/B pour recueillir plus d'informations. La cause d'une éventuelle préférence d'une version plutôt que l'autre n'est pas établie en amont. Les résultats du test sont difficilement généralisables à d'autres choix de design/conception.
  • Evaluation : avec hypothèse précise
    Le team UX a une idée à propos d'un mécanisme causale qui pourrait expliquer la préférence d'une version plutôt que l'autre et veut tester la validité de cette hypothèse. Les résultats du test sont plus facilement généralisables à d'autres choix qui impliquent le même mécanisme causale.

Tests séquentiels ou parallèles

Exemple de test séquentiel
Les tests peuvent être menés en séquence ou en parallèle. À l'image, le deuxième test exploite les résultats du test précédent.

Test des 5 seconds

Canvas de page web

Demander de dessiner l'interface et de deviner les objectifs du site après une brève exposition.

Échelles utilisabilité/UX

Questionnaires standardisés et/ou validés empiriquement.

  • Échelles utilisabilité
    En général plus anciennes, limitées plutôt à évaluer l'efficacité, l'efficience et la satisfaction perçues.
  • Échelles UX
    En général plus récentes, elles utilisent une approche holistique, en intégrant les dimensions cognitive, sociale et affective.

Elles permettent la comparaison entre versions ou systèmes différents.

System Usability Scale

SUS items Traduction libre de l'échelle de Brooke (1996).

User Experience Questionnaire

UEQ items Traduction non validée pour le moment de Laugwitz, Held & Schrepp (2008)

Benchmark UEQ

Exemple de comparaison des résultats UEQ

Résultats de la passation de l'échelle UEQ avec N = 20 participant-es sur une maquette interactive de site web.

Les résultats sont comparés à un benchmark proposé avec l'échelle qui prend en compte l'évaluation de 452 produits pour un total de 20'190 passations (Schrepp, Hinderks, & Thomaschewski, 2017).

Test utilisateur

Technique holistique : performance et perception.

Layer cake Photo by Annie Spratt on Unsplash

Étapes test utilisateur

  1. Accueil
    De manière similaire à une recherche scientifique, on met les participant-es dans les meilleures conditions (i.e. on teste le dispositif et non pas leurs capacités)
  2. Scénarisation/Mise en situation
    Le test s'adresse à des persona (profils d'utilisateurs issues de l'analyse exploratoire) qu'il faut activer/simuler.
  3. Exécution de tâches en lien avec le scénario
    Les participant-es effectuent une série de tâches authentiques en lien avec le scénario. Les passations sont en général encodées, e.g. avec enregistrement audio/vidéo et/ou oculométrie.
  4. Évaluation post-test et débriefing
    Après les tâches, les participants répondent à des questions fermées (e.g. échelles UX), sémi-directifs et/ou ouvertes qui complémentent les tâches.

Tâches scénarisées


Trouvez les prix des tickets d'entrée au musée.

Vous souhaitez visiter le musée le dimanche, avec votre partenaire et vos deux enfants de 15 et 8 ans. Combien va vous coûter l’entrée au total ?

Les tâches conduisent très souvent à des réponses spécifiques, qui permettent de déterminer si la tâche est réussite.

Synthèse des tâches

Agrégation des passations pour avoir un aperçu général des tâches scénarisées.

Table

Analyse des problèmes

Identification des problèmes majeurs, souvent avec utilisation de grilles/héuristiques pour effectuer un diagnostic (e.g. Bastien & Scapin, 1993).

Table de problèmes

Proposition de remédiation

Suite aux résultats du test utilisateur, lors de la prochaine itération, nous conseillons d'ajouter l'adresse complète, les horaires d'ouverture et les coordonnées de contacts du musée en bas de chaque page du site.

— Votre team UX

Avis justifiés et accompagnés souvent par éléments multimédia (diagrammes, séquences vidéos, gaze path)

Évaluer les évaluateurs

Critères de sélections pour des utilisateurs :

  1. Disponibilité de temps
    Si le feedback/tâche à faire est trop simple et rapide, les gens ont tendance à donner des avis trop positifs ("Oui, super... allez-y!")
  2. Disponibilité à mettre en jeu sa propre réputation
    Actions concrètes qui témoignent attachement, par exemple retweet d'un message de l'entreprise qui lance le produit.
  3. Disponibilité en termes d'argent
    De manière paradoxale, on peut demander aux utilisateurs de payer pour participer à un test, ou les engager à achéter le produit à la fin de la conception.

Importance de la perspective

Une évaluation n'existe pas en absolu :

  • Quels sont les objectifs ?
  • Quel est le contexte d'utilisation ?
  • Qui est le public cible ?
  • Quelles sont les conséquences envisageables ?
  • Qu'est-ce qu'on ne pourra pas savoir à cette étape ?

L'importance de la perspective

Leonardo da Vinci, CC BY-SA 4.0, via Wikimedia Commons

Merci pour votre attention !

Mattia A. Fritz
TECFA, Université de Genève

Licence Creative Commons
Présentation créée avec Reveal.js.