Archivo de la categoría "Ucd"

Test remotos de usabilidad

Wednesday, 24 de November de 2010

    ¿Qué son?

    Test remotos de usabilidad o Remote Research (RR) es una forma de aplicar test usabilidad* con usuarios sin que el evaluador se encuentre físicamente en el mismo espacio que el participante.
    Los test de usabilidad se pueden agrupar en dos grandes grupos en función de la localización del participante y evaluador.
    Si el participante y el evaluador se encuentran en el mismo lugar, los test son presenciales o de laboratorio.

    En cambio si el participante y el evaluador se encuentran en lugares diferentes son test  remotos o remote reseach.
    Los RR pueden así mismo agruparse en distintas categorías**, por ejemplo en función de la participación del moderador podemos tener test moderados y test automatizados por una herramienta. Además, los moderados son de corte más cualitativo, mientras que los automatizados son más cuantitativos.

    En función de la captación del participante y la forma de hacerlo podemos hablar de captación en vivo, mediante un layer, captación por perfil y mediante agencia de captación, contactos personales  o paneles de investigación.

    E incluso en función de la tecnología empleada en las herramientas de captación remota podríamos agrupar en función de las que usan JavaScript y las que usan tecnologías Html.

    Ventajas de RR vs Laboratorio

    La ventaja principal entre los RR y lo test de laboratorio son los costes, entorno a un 42% más barato mediante RR. Este ahorro viene de reducir el tiempo de ejecución y el tiempo de captación de los participantes.
    Además los RR poseen una mayor variedad en la procedencia de las muestras, ya que los RR son virtualmente aplicables a cualquier persona del mundo con una conexión.
    Algunos caso de estudio otorgan unos valores de éxito mayores a los RR. Si se realiza el test en Laboratorio y en Remoto suelen detectarse entorno a 15 resistencias al uso con el RR que pasan desapercibidas en el laboratorio. Pero estas tasa de éxito no son valores concluyentes, así que no vincules tu elección a ello.

    Inconvenientes de RR vs Laboratorio

    Para mí el principal inconveniente está en la falta de especialización en las herramientas y en la técnica. Los RR aun no forman parte del arsenal metodológico de los profesionales, aunque muchas de estas herramientas son gratuitas.

    Si estas interesado en potenciar tus conocimientos en RR y probar alguna herramienta consulta el fantástico el documento de Liz Bacon en referencias.

    bullet.gif Referencias:

    * Diga Test de Usabilidad, NO test de usuarios
    ** Otras categorías sobre las herramientas de investigación en Remote Usability

    Integración de la investigación en el desarrollo del producto

    Thursday, 24 de June de 2010

      Las investigaciones se diseñan.

      En los proyectos no se suele hablar de esto por que se suele encontrar en un espacio aspiracional, pero el proceso de desarrollo del producto se optimiza si integramos  técnicas de investigación en el proceso.

      Suele ser más o menos frecuente encontrarnos con proyectos en los que se van a llevar a cabo alguna o varias técnicas de diseño centrado en el usuario.

      Lo que no suele ser tan frecuente, es que la finalidad de todos estos procesos de investigación estén planeados hacia un único fin. Dando la sensación que las técnicas por las técnicas mismas son lo importante del proceso, cuando la técnica es un elemento puramente táctico, mientras que el diseño del producto, y ahí se incluye la investigación, es la estrategia.

      El proceso de desarrollo debe cubrir un amplio espectro, desde la idea al producto, o desde el concepto a la solución. Para lo cual, en la mayoría de proyectos nos vamos a encontrar con dos estados.

      1. Descubrimiento, este estado es inicial, tengo una idea, un proyecto, pero no se como enfocarlo, necesito una aproximación a la realidad, necesito conocimiento. Este tipo de investigación se conoce como investigación primaria y suele ser de tipo flexible.
      2. Confirmación, en este estado ya tenemos una opinión, pero no tenemos la certeza de que sea plenamente operativa. Deseamos contrastar nuestro enfoque con la realidad. A este tipo de investigación se la conoce como investigación secundaria o de contraste. (No confundir con investigación sobre fuentes secundarias).

      Integración de la investigación en el desarrollo del producto

      Clicar sobre la imagen para ampliar.

      Si desde el inicio del proceso tenemos en cuenta estos dos estados, los datos pueden ser acumulativos y pueden servir de brújula para la toma de decisiones de diseño.

      En mi opinión esto debería estar presente tanto en la mentalidad de las empresas de consultoría, como en el cliente.

      bullet.gif Referencias:

      Pasos previos a medir la usabilidad

      Tuesday, 11 de May de 2010

        Medir la usabilidad es un tema complejo. Habitualmente el concepto se emplea como un indicador, pero en la mayoría de los casos lo que realmente se hace es una valoración subjetiva. Alguna de las técnicas más populares emplean el mismo método, por ejemplo los análisis expertos y algunos modelos de check list de análisis heurístico se basan en puntuaciones subjetivas que dificultan poder  recrear el experimento y comparar los resultados.

        Esto nos coloca en un lugar complejo, por un lado  necesitamos ponderar el grado de subjetividad del evaluador, para poder saber como de fiables son las comparaciones entre distintos estudios, realizados por distintos evaluadores. Y por otro nos limita para definir planes de mejora de la usabilidad  de un producto a lo largo del tiempo ya que no podemos estar seguros de la homogeneidad de los datos que comparamos.

        Para  evitarte callejones sin salida lo mejor es dar unos pasos previos antes de medir.

        “Usabilidad” hace referencia a una especie de constructor  de la cualidad de un producto*. Cuando deseamos medirla debemos comenzar por definir que es usabilidad. Esto puede suponer un problema por que no existe ninguna definición estándar aceptada plenamente por toda la industria, aunque de forma mayoritaria se suele aceptar la definición ISO 9241-11 en la que se identifica la usabilidad con tres dimensiones del producto: Eficiencia, Eficacia y Satisfacción.

        ¿Porqué debemos indicar una definición? A la hora de iniciar la evaluación de un producto debemos seleccionar e indicar cual es nuestra definición, por que es ahí donde vamos a indicar las métricas que vamos a emplear. Son estas métricas las que nos permite definir en nuestros proyectos como se van a llevar a cabo las auditorías y las evaluaciones. Parece una tontería, pero muchas veces esto se obvia. Optar por una u otra definición también condiciona como vamos a investigar. ISO 9241-11 esta vinculado a la realización de tareas por definición. Si usas esta definición tienes que evaluar tareas.
        Para este post se ha decidido emplear como ejemplo la técnica de test con usuarios.

        Muy bien, vamos a medir. Como hemos establecido 3 dimensiones, necesitamos definir como vamos a medir y que medir.

        Primero veamos las dimensiones y que significan.

        • Eficacia: Capacidad de lograr el efecto que se desea o se espera.**
        • Eficiencia: Capacidad de disponer de alguien o de algo para conseguir un efecto determinado.**
        • Satisfacción: Razón, acción o modo con que se sosiega y responde enteramente a una queja, sentimiento o razón contraria.**


        Eficacia
        la podemos medir contabilizando las tareas que se logran  y las que no se logran (Tareas OK VS. Tareas KO) . Aquí nos va hacer falta definir que es lograr una tarea, podemos medirla contabilizando las dificultades que encuentra el usuario y el numero de “dificultades” que estimamos en los que un usuario abandonaría una tarea.

        Eficiencia la podemos medir contabilizando el tiempo empleado en la consecución de la tarea. Para poder establecer ratios de tiempo, definimos un tiempo “experto” para la tarea que tomamos como referencia para la prueba.

        Satisfacción se suele medir con un cuestionario post prueba, hay un montón de cuestionarios de satisfacción que te pueden servir de ejemplo.

        El resto del proceso es el habitual. Identificamos las tareas que vamos a testar, identificamos a las unidades muestrales, hacemos la captación y realizamos las pruebas.
        Después de esto procesamos los resultados, y presentamos el  informe.

        Bola extra:
        Cuando estamos analizando los datos, lo normal es crear una matriz de variables y estadísticos descriptivos. Y sobre esto analizar los datos. Puede ser útil hallar el coeficiente de correlación***, para establecer que relación hay entre las variables (cuando el tiempo de ejecución de una tarea es menor cuando las dificultades encontradas son menores, cuando esto ocurre el usuario puntúa como más satisfecho)

        Bala de plata
        :
        Es posible que necesitemos reducir nuestras variables a indicadores independientes para los datos  “Usabilidad” ya que se van a usar como kpi de negocio.
        En ese caso se puede emplear análisis de componentes principales **** para reducir los factores  a variables para poder llevar a cabo acciones concretas sobre cada uno.

        bullet.gif Referencias:

        Desmitificando de la investigación con usuarios. Test de usuario

        Tuesday, 20 de April de 2010

          La primera pregunta que surge es ¿porqué investigar? El objetivo de investigar con usuarios  es contrastar que el producto tiene algún interés para el usuario. Analizando sus  necesidades y la forma de uso del producto, con el fin de asegurarnos que las decisiones de diseño mantienen la misma finalidad a lo largo de todo el proceso y que el producto es coherente.

          Mitos sobre la investigación con usuarios

          #1. Los proyectos UX que incluyen investigación con usuarios son más costosos y largos que los que no incluyen investigación.
          #2. La investigación con usuarios son test de usuario.
          #3. los test de usuario son caros.
          #4. Necesitamos un laboratorio para poder llevar a cabo test con usuarios.

          Estas ideas son muy comunes (desgraciadamente) en el mundo de la consultoría y creo que se deben matizar, porque no considero que sean totalmente correctas.

          Desmitificando

          #1. La investigación con usuarios no es un sinónimo de que el proyecto sea  caro y/o largo. En mi opinión, la investigación debe de ser una fase en todos los proyectos, y no incluir investigación en el proyecto puede ser peligroso y hacer que el proyecto acabe presentando costes inesperados.

          ¿Por qué digo esto? Si medimos el éxito del proyecto  a corto plazo, la investigación puede que no sea critica. En este enfoque suele primar la competición de ofertas, los plazos hiperajustados, el mostrar “algo” para llevar a cabo la gestión estratégica del cliente, y en ocasiones se entran en gaps de gestión insalvables. Este es el día a día en las trincheras del proyecto y una de las razones que subyacen bajo la idea de que la investigación con usuarios es cara y alarga los tiempos de los proyectos.

          Pero si nos planeamos una perspectiva  temporal un poco mayor, veremos que la investigación es critica, ya que cumple un papel táctico que permite conseguir productos de éxito, con skateholders felices, donde se fomenta la toma de  decisiones de una forma racional, que hace que el proyecto sea más colaborativo entre proveedor y cliente y que abre la puerta a nuevas cuentas cada vez más interesantes. En estos términos,  despreciar la investigación es peligroso, ya no para el proyecto, sino para la propia supervivencia de la organización.

          #2. Hay muchas técnicas de investigación,  no todas las técnicas tienen la misma finalidad ni la misma eficiencia.   Las  distintas técnicas de investigación se suelen agrupar bajo  la categoría  “usability enginnering”.  Para selecciona la que más se adapte a tus necesidades puede ser útil consultar el papers de Nigel Bevan “Criteria for selecting methods in user-centered design

          #3. Los test no son caros, En el libro “No me hagas pensar” Krung bromea con que se pueden hacer pruebas de usuario por 9 centavos al día y que por menos de 600 dolares usa se puede obtener el equipo para grabar la sesión. No se  si desde el 2006 el precio ha subido,  pero para lleva a cabo un test no es necesaria una gran inversión.

          Básicamente necesitamos:

          1. Identificar  las tareas que van a ser testadas. Estas tareas están definidas por su importancia dentro de la lógica de negocio.
          2. Establecer la métrica de evaluación, (por ejemplo, si el experto tarda 3 minutos en completar la tarea, esto sera TiempoExperto (TE). Consideramos que los usuarios logra un éxito si tardan (TE) x2 minutos, todo lo que exceda de esto se considera fallo. Los tiempos pueden salir de las analíticas, o ser una convención, pero tiene que ser constante para todos los casos.
          3. Tipologías de usuarios, y cuales vamos a analizar. La variable tipo de usuario esta en relación con lo que hemos considerado “tarea evaluable”. No testamos tareas que realizan usuarios secundarios o marginales.

          Estas tres cosas son las realmente importantes a la hora de testar, y no es que sean excesivamente caras.

          #4. No se  necesita un laboratorio para poder testar. Con tener una habitación tranquila donde instalar el equipo y donde llevar a cabo la prueba debería ser más suficiente en la mayoría de los casos. Y dentro de la habitación una mesa y un par de sillas. En mi opinión, el valor del espejo doble no esta en que sea útil para concienciar a los skateholders del valor de investigar, que ayuda,  sino por el halo de ciencia que da al proceso. Pero no es vital tener uno, ni supone  nada que no se pueda solucionar con una presentación de las grabaciones de las sesiones.

          Otra  opción es que te montes tu laboratorio de usabilidad on box, un cámara de vídeo, dos ordenadores, micrófono, cables altavoz  y un trípode.  Puedes tener una laboratorio como el de Google por  menos de 1.500 €

          Algunas herramientas que te pueden interesar:

          • Silverback   Trial de 30 días, pero es software exclusivo para Mac. Herramienta que permite grabar la pantalla y el audio. Convierte tu mac en un laboratorio de usabilidad.
          • Ethino   Herramienta para captar  usuarios  Los primero 20 usuarios son gratuitos. Permite definir los segmentos, hacer la captación y gestionar el incentivo al usuario.
          • Gtk-recordMyDesktop  para Linux. Herramienta para grabar la pantalla, permite realizar seguimiento del ratón y grabar audio. Es gratuita y muy sencilla de utilizar.
          • Morae  permite un uso gratuito durante 30 días. Morae es una suite que integra varios programas, permite definir las tareas a testar, grabar la pantalla y el ratón, trasmitir la señal a otro equipo y lanzar cuestionarios pos prueba. Durante mucho tiempo ha sido el estándar de la industria.
          • FeedbackArmy 50 pruebas de enfoque por poco más de un 1 USD. Si tus test no buscan afinar una tarea, sino que quieres contrastar una idea, Feedback Army es una buena elección.

          Muchas de estas técnicas tienen su continuidad en la analítica web. Si dentro de tu empresa hay equipo de analíticas habla con ellos antes de diseñar tu investigación, seguro que te aportan opiniones valiosas, estrategias y herramientas.

          Investigar es bueno, pero no se pueden ganar todas las batallas. Estoy convencido que la investigación con usuarios sera  a la segunda generación, lo que los prototipos a los pioneros de la profesión.

          bullet.gif Referencias:

          (actualización 22/04/10)

          Estadística para HCI (2/3). Diseño de Investigación

          Wednesday, 30 de December de 2009

            Logo de Investigacion HCI

            El diseño de investigación o diseño experimental es un plan general de investigación para contrastar la hipótesis.

            Una hipótesis es una afirmación respecto a una característica de una población.

            Todas las investigaciones o estudio estadístico, de forma general, se componen de los siguientes pasos:

            • En primer lugar hay que definir el objetivo de la investigación, ¿qué quiero saber? Por ejemplo “como de usable es el interfaz”.

            Esta pregunta podría ser nuestra  hipótesis. Pero ¿cómo podemos saber si esta es una buena hipótesis?

            Para poder habla de “como de usable es el interfaz” debemos comenzar por definir que atributos vamos a considerar indicadores de usabilidad. Existen numerosas definiciones de usabilidad, por lo que debernos elegir una. Por ejemplo podemos utilizar la definición de la ISO 9241-11*, que vincula la usabilidad  con la Eficiencia, la Eficacia y la Satisfacción del empleo del producto.

            Muy bien, hasta ahora hemos acotado el objeto de investigación, pero aun así, indicar como de eficiente, eficaz o satisfactorio es el empleo de un interfaz sigue siendo un tanto árido.  Por lo que necesitamos tareas sobre las que ponderar estas características.

            Una tarea es una acción que puede realizar un usuario con un objetivo, y tiene un origen y un fin claros.

            Las tareas que vamos a seleccionar serán aquella que responden a los objetivos de negocio, interés del proyecto, consistencia con anteriores investigaciones o que nos aporten los datos que necesitamos. Es importante que seleccionemos tareas que aporten datos significativos. Las tareas deben ser únicas y deben tener un único objetivo. Por ejemplo en un librería online la tarea “Comprar el libro X” puede implica 1. Tratar de localizar el libro, 2. Iniciar la compra, 3. Validar la compra. Estaríamos ante 3 tareas, si la enunciamos como una sola tendremos problemas a la hora de cuantificar.

            Con la ayuda de las tareas parece que podemos definir nuestra hipótesis.  Recordemos, la hipótesis debe ser formula de forma sencilla e inequívoca.

            La idea del proceso es cerciorarnos con números que lo que afirmamos en la hipótesis  es correcto, (cuando es correcta nuestra afirmación decimos que se cumple la hipótesis nula)

            • Recogida de la información muestral.

            Uno de los aspectos más comentados cuando se habla de test de usuarios es: ¿cuántos usuarios necesito?
            Es mucho mas importante definir correctamente las tareas y fijar los objetivos que realizar un muestreo muy exhaustivo. La calidad de la muestra es tan importante como su tamaño.

            Es posible que conozcas formula 5. Bueno, en principio usar 5 usuarios no resulta estadísticamente representativo. Además recuerda que Nielsen habla de una población homogénea donde cada unidad descubre el 31% de los problemas de usabilidad de un total de problemas CONOCIDOS.

            Puede que necesites argumentar porque no usar 5 usuarios, como alternativa a teórica a  Nielsen están los estudios CUE de Molich.

            La selección de la muestra es un problema antiguo de los test de usuarios, ya que en algún sitio esta escrito a fuego que resulta cara la captación de usuarios (en cualquiera de sus sabores, pero la captación formal e informal no tienen el mismo coste), aunque posiblemente resulte más caro tomar decisiones basadas en seudo-investigación.

            A la hora de hacer un muestreo es importante el grado de homogeneidad de la población. Por ejemplo si nuestros usuarios responden en su mayoría a una serie de características comunes (grupo de edad muy definido, pautas de consumo similares, objetivos de uso concretos …)  diremos que son muy homogéneos, si no es así, y en la mayoría de casos no lo sera, estableceremos grupos que presenten homogeneidad interna y heterogeneidad entre los grupos (jóvenes, adultos, amplia experiencia con tecnología, poca experiencia con tecnología)  y seleccionaremos aleatoriamente la muestra.

            Los estimadores siempre tienen que ir acompañados por una  medida de su precisión por lo que la pregunta no es cuantos usuarios empleo en mi test, sino cuanta incertidumbre puedo aceptar a la hora de hacer recomendaciones de usabilidad, en otras palabras, con que seguridad puedo decir que debemos cambiar “ese botón” por que 5 usuarios han tenido problemas con él. Gota de sudor.

            Raúl Páramo tiene un post muy bueno al respecto de tamaños de muestra (y al final del post esta el enlace a la calculadora de muestras para distribuciones normales ¡oro puro!).

            • Significación estadística.  Son los análisis numéricos, pero eso se lo vamos a dejar a algún útil programa de calculo como  SPSS, o la alternativa código libre PSPP.

            Vas a necesitar los estadísticos descriptivos para el análisis descriptivo.

            La significación estadística la vamos a calcular de la siguiente forma:

            1. Si se trata de una única variable continua mediante el calculo de la T de Student.
            2. Si se trata de mas de una variable continua  mediante el calculo de la ANOVA.
            3. Si se trata de una variable discreta mediante el calculo de Chi cudrado.
            • Análisis descriptivo. Ya tienes un buen montón de datos, pero es posible que necesites resumir los datos, las formas más intuitivas es la presentación de los datos mediante algún diagrama, como por ejemplo un histograma. Recuerda que un buen gráfico siempre tiene algo de ciencia y algo de arte.
            • Informe. Donde documentamos el proceso del test y los resultados obtenidos. Seguiremos el modelo CIF.

            * Usability en ISO 9241-11: “the extent to which a product can be used by specified users to achieve specified goals with effectiveness, efficiency and satisfaction in a specified context of use“. Esta definición también se emplea en CIF.

            ———————————————————————————————

            ★ Quizás te interesa leer: Estadística para HCI 1. Introducción

            Estadística para HCI (1/3). Introducción

            Thursday, 24 de December de 2009

              Logo de Investigacion HCI

              La ciencia estadística tiene un sin fin de campos de aplicación. Dentro del HCI puedes encontrar estadística en las técnicas de Usability Engineering, como por ejemplo en los test de usuario.

              Para un ejercicio responsable del Usability Engineering es imprescindible tener un mínimo conocimiento de estadística, sin que esto implique un gran dominio de las matemáticas.
              Este post pretende introducción algunos conceptos básicos de estadística  que permitan entender la aplicación de la estadística a las investigaciones con usuarios.

              La estadística básicamente  nos permite hacer 2 tipos de cosas: analizar grupos y aceptar o rechazar hipótesis.

              Esto se plasma en los dos grandes tipos que hay de estadística, la Estadística Descriptiva y la Estadística Inferencial.

              La Estadística Descriptiva es la que nos permite recoger, ordenar y analizar los datos sobre un asunto, fenómeno o problema de investigación, por ejemplo ¿cómo  son nuestros usuarios?.

              La Estadística Inferencial es la a partir de una muestra extraída de una población nos permite hacer inferencias acerca de esa población, como por ejemplo ¿sí los usuarios del test realizan X todos los usuarios realizará Y?.

              Es posible que encuentres difícil algunas de estas ideas, seguramente por que se emplea un vocabulario especializado. Así que vamos a empezar por acotar conceptos.

              Conceptos  estadísticos básicos

              • Universo o Población: es el conjunto completo de individuos sobre los que queremos generalizar las conclusiones de nuestro estudio.  Se denota como N.
              • Muestra: es el conjunto de individuos que estudiamos. La muestra debe ser representativa de la población de estudio.  Se denota como n.

              Un universo o población se puede describir mediante parámetros. Los parámetros se suelen representar con letras griegas. Los parámetros nos dicen que es lo que ocurre en la población y los obtenemos de los estadísticos de la muestra.
              Los estadísticos son una estimación del valor del parámetro en la población.

              • Parámetros: son índices que describen la población. Estos índices son toda función definida sobre los valores numéricos de una población.
              • Estadísticos: son índices que describen la muestra. Estos índices es toda función definida sobre los valores numéricos de una muestra.
              • Las variables: son cada una de las características o aspectos que queremos medir en la muestra. Las variables se pueden clasificar en dos grupos:
              1. Cualitativas, cuando los valores no se pueden medir por que indican una cualidad (las variables cualitativas que pueden ser Nominales, cuando no pueden ordenar, por ejemplo el genero. Ordinales cuando si se pueden  ordenar, por ejemplo ante una pregunta sobre las preferencias,  estoy totalmente de acuerdo, estoy moderadamente de acuerdo…)
              2. Cuantitativas, cuando los valores se pueden medir por que son un numero (las variables cuantitativas pueden Discretas, que no tienen un valor intermedio entre dos valores consecutivos,  por ejemplo numero de hijos, pueden ser 1 o 2, pero no 1.7. Continuas cuando si existen valores intermedios entre dos valores consecutivos, por ejemplo la temperatura).
              • Distribución: es el registro de las distintas observaciones de una variable.

              La distribución de una variable discreta es binomial y la distribución de una variable continua es normal.

              Hay que tener cuidado al definir las variables del estudio porque en ocasiones estamos definiendo implícitamente la escala, por ejemplo si queremos medir la “usabilidad” en una tarea tenemos distintas formas de formular la cuestión.

              • Facilidad del usuario para completar la tarea: Completada/No Completada (Variable cualitativa nominal).
              • Dificultad percibida de la tarea: Alta, Media, Baja (Variable cualitativa ordinal).
              • Tiempo empleado en completar la tarea en segundos: (Variable cuantitativa continua).

              Como norma general, trataremos de usar variables cuantitativas continuas, porque  contienen más información, y permiten utilizar pruebas estadísticas más potentes.
              Además, cuando recogemos información sobre un  dato en forma de variable cuantitativa, podemos agrupar esa información en categorías cualitativas, mientras que al revés no se puede.
              De todos modos, esto no es una obligación, ya que  hay que valorar el esfuerzo que supone conseguir los datos y la viabilidad de la investigación. Estos aspectos los definiremos en el diseño de la investigación.

              ———————————————————————————————

              Quizás te interesa leer: Estadística para HCI 2. Diseño de investigación

              Creative Commons License
              Esta obra está bajo una licencia de Creative Commons.