2010-05-04 5 views
2

Je me demandais si quelqu'un connaissait un sondage standard (basé de préférence sur le travail de Jacob Nielson sur la convivialité) que les administrateurs Web peuvent administrer pour tester la convivialité des groupes?Échelle d'utilisation de Nielson

Je pourrais juste créer la mienne, mais je pense qu'il doit y avoir une recherche solide sur le genre de jugements sur les tâches que je devrais demander.

Par exemple

Q :: Demander à l'utilisateur de trouver la page profil Do I ... A.) Présentez à l'échelle standard Likert après chaque question B.) Présentez le Likert après toutes les questions Alors quelle devrait être cette probabilité, je sais que l'échelle des jugements d'utilisabilité de Nielson est basée sur la capacité d'apprentissage, l'efficacité d'utilisation, la mémorabilité, le taux d'erreur, la satisfaction, mais je ne peux qu'imaginer ... comment puis-je demander à un utilisateur de classer la mémoire d'un site après une utilisation sur une échelle de 1 à 5? Sûrement quelqu'un a conçu un bon moyen de poser la question?

Répondre

2

Quelques recommandations:

  1. Ne pas déterminer votre niveau exclusivement en écoutant les utilisateurs et d'attendre leurs commentaires. Nielsen dit que la règle n ° 1 de la convivialité est "Ne pas écouter les utilisateurs"; il est plus important de watch them work.

  2. Voici an FAQ concernant le développement de Likert questionnaires. Je me tromperais du côté de la simplicité et de la brièveté si vous demandez aux utilisateurs une liste de questions après chaque tâche. Il y a des avantages et des inconvénients pour les deux options que vous envisagez. Si vous demandez à un utilisateur d'attendre jusqu'à ce qu'il ait terminé toutes ses tâches avant de répondre à un sondage, il se peut qu'il ne se souvienne pas de ses difficultés initiales avec l'interface lorsqu'il s'adapte à sa courbe d'apprentissage. D'un autre côté, si vous leur posez des questions après chaque tâche, ils peuvent commencer à parcourir le questionnaire à la fin de la liste des tâches. Une option supplémentaire, en fonction du nombre de tâches que vous avez, peut être de demander à l'utilisateur de remplir un sondage après chaque tâche.

  3. Le laboratoire HCI de l'Université du Maryland maintient un Questionnaire for User Interaction Satisfaction, qui est disponible en téléchargement et maintenant sur la version 7.0. Vous pourriez être en mesure d'utiliser leur sondage, ou du moins l'adapter à votre utilisation.

0

court et facile System Usability Scale (SUS) a été trouvé par Tullis and Stetson (2004) à d'autres échelles psychométriques surclassent subjectives, dont la renommée QUIS. La plupart des items SUS semblent liés à l'apprentissage ou à la mémorisation, avec un couple pour l'efficacité. Cependant, je n'essaierais pas de le diviser en sous-échelles; tous les éléments sont fortement intercorrélés, ce qui suggère que cette échelle mesure une seule construction sous-jacente.

Je doute que vous puissiez obtenir une échelle pour mesurer chacune des dimensions de Nielsen séparément. Un utilisateur peut vous dire si un produit est "difficile" à utiliser, mais il est beaucoup plus difficile pour lui de le décomposer davantage. Ils savent qu'il a fallu beaucoup de travail pour faire quelque chose, mais était-ce parce qu'ils ne pouvaient pas trouver un moyen plus facile (apprentissage)? Ou peut-être qu'ils avaient appris une meilleure manière sur une tâche précédente, mais l'ont oubliée (mémorabilité)? Ou est-ce juste comme cela doit être (efficacité)? Les utilisateurs n'auront pas suffisamment d'informations pour faire la distinction.

Si vous êtes spécifiquement intéressé par chacune des dimensions de Nielsen séparément, évaluez-les séparément et directement. Vous pouvez mesurer grossièrement l'apprentissage en enregistrant le nombre d'erreurs ou le temps entre les clics, et précisément en fonction du nombre d'essais nécessaires pour que les utilisateurs apprennent la séquence d'interaction normative. Pour plus d'efficacité, après avoir formé les utilisateurs à faire la séquence d'interaction normative, notez combien de temps il leur faut pour le faire. Vous pouvez également obtenir une bonne réponse analytique en utilisant quelque chose comme GOMS-KLM. Pour la mémorisation, amener les mêmes utilisateurs dans une semaine ou plus tard et comparer leur performance à celle de l'essai de mesure de l'efficacité.

Comme presque toutes les échelles subjectives, le SUS est principalement utile pour comparer l'expérience subjective globale de différents produits. Il est difficile de savoir quoi faire à partir d'un seul score sans quelque chose à comparer. Ces échelles ne précisent pas les problèmes spécifiques d'un produit ou les raisons pour lesquelles il en a (par exemple, pour vous aider à déterminer les améliorations). Pour cela, l'observation qualitative et le débriefing de vos participants au test sont les meilleurs.