Archivo de la categoría "Uem"

Estadística para HCI (2/3). Diseño de Investigación

Wednesday, 30 de December de 2009

    Logo de Investigacion HCI

    El diseño de investigación o diseño experimental es un plan general de investigación para contrastar la hipótesis.

    Una hipótesis es una afirmación respecto a una característica de una población.

    Todas las investigaciones o estudio estadístico, de forma general, se componen de los siguientes pasos:

    • En primer lugar hay que definir el objetivo de la investigación, ¿qué quiero saber? Por ejemplo “como de usable es el interfaz”.

    Esta pregunta podría ser nuestra  hipótesis. Pero ¿cómo podemos saber si esta es una buena hipótesis?

    Para poder habla de “como de usable es el interfaz” debemos comenzar por definir que atributos vamos a considerar indicadores de usabilidad. Existen numerosas definiciones de usabilidad, por lo que debernos elegir una. Por ejemplo podemos utilizar la definición de la ISO 9241-11*, que vincula la usabilidad  con la Eficiencia, la Eficacia y la Satisfacción del empleo del producto.

    Muy bien, hasta ahora hemos acotado el objeto de investigación, pero aun así, indicar como de eficiente, eficaz o satisfactorio es el empleo de un interfaz sigue siendo un tanto árido.  Por lo que necesitamos tareas sobre las que ponderar estas características.

    Una tarea es una acción que puede realizar un usuario con un objetivo, y tiene un origen y un fin claros.

    Las tareas que vamos a seleccionar serán aquella que responden a los objetivos de negocio, interés del proyecto, consistencia con anteriores investigaciones o que nos aporten los datos que necesitamos. Es importante que seleccionemos tareas que aporten datos significativos. Las tareas deben ser únicas y deben tener un único objetivo. Por ejemplo en un librería online la tarea “Comprar el libro X” puede implica 1. Tratar de localizar el libro, 2. Iniciar la compra, 3. Validar la compra. Estaríamos ante 3 tareas, si la enunciamos como una sola tendremos problemas a la hora de cuantificar.

    Con la ayuda de las tareas parece que podemos definir nuestra hipótesis.  Recordemos, la hipótesis debe ser formula de forma sencilla e inequívoca.

    La idea del proceso es cerciorarnos con números que lo que afirmamos en la hipótesis  es correcto, (cuando es correcta nuestra afirmación decimos que se cumple la hipótesis nula)

    • Recogida de la información muestral.

    Uno de los aspectos más comentados cuando se habla de test de usuarios es: ¿cuántos usuarios necesito?
    Es mucho mas importante definir correctamente las tareas y fijar los objetivos que realizar un muestreo muy exhaustivo. La calidad de la muestra es tan importante como su tamaño.

    Es posible que conozcas formula 5. Bueno, en principio usar 5 usuarios no resulta estadísticamente representativo. Además recuerda que Nielsen habla de una población homogénea donde cada unidad descubre el 31% de los problemas de usabilidad de un total de problemas CONOCIDOS.

    Puede que necesites argumentar porque no usar 5 usuarios, como alternativa a teórica a  Nielsen están los estudios CUE de Molich.

    La selección de la muestra es un problema antiguo de los test de usuarios, ya que en algún sitio esta escrito a fuego que resulta cara la captación de usuarios (en cualquiera de sus sabores, pero la captación formal e informal no tienen el mismo coste), aunque posiblemente resulte más caro tomar decisiones basadas en seudo-investigación.

    A la hora de hacer un muestreo es importante el grado de homogeneidad de la población. Por ejemplo si nuestros usuarios responden en su mayoría a una serie de características comunes (grupo de edad muy definido, pautas de consumo similares, objetivos de uso concretos …)  diremos que son muy homogéneos, si no es así, y en la mayoría de casos no lo sera, estableceremos grupos que presenten homogeneidad interna y heterogeneidad entre los grupos (jóvenes, adultos, amplia experiencia con tecnología, poca experiencia con tecnología)  y seleccionaremos aleatoriamente la muestra.

    Los estimadores siempre tienen que ir acompañados por una  medida de su precisión por lo que la pregunta no es cuantos usuarios empleo en mi test, sino cuanta incertidumbre puedo aceptar a la hora de hacer recomendaciones de usabilidad, en otras palabras, con que seguridad puedo decir que debemos cambiar “ese botón” por que 5 usuarios han tenido problemas con él. Gota de sudor.

    Raúl Páramo tiene un post muy bueno al respecto de tamaños de muestra (y al final del post esta el enlace a la calculadora de muestras para distribuciones normales ¡oro puro!).

    • Significación estadística.  Son los análisis numéricos, pero eso se lo vamos a dejar a algún útil programa de calculo como  SPSS, o la alternativa código libre PSPP.

    Vas a necesitar los estadísticos descriptivos para el análisis descriptivo.

    La significación estadística la vamos a calcular de la siguiente forma:

    1. Si se trata de una única variable continua mediante el calculo de la T de Student.
    2. Si se trata de mas de una variable continua  mediante el calculo de la ANOVA.
    3. Si se trata de una variable discreta mediante el calculo de Chi cudrado.
    • Análisis descriptivo. Ya tienes un buen montón de datos, pero es posible que necesites resumir los datos, las formas más intuitivas es la presentación de los datos mediante algún diagrama, como por ejemplo un histograma. Recuerda que un buen gráfico siempre tiene algo de ciencia y algo de arte.
    • Informe. Donde documentamos el proceso del test y los resultados obtenidos. Seguiremos el modelo CIF.

    * Usability en ISO 9241-11: “the extent to which a product can be used by specified users to achieve specified goals with effectiveness, efficiency and satisfaction in a specified context of use“. Esta definición también se emplea en CIF.

    ———————————————————————————————

    ★ Quizás te interesa leer: Estadística para HCI 1. Introducción

    Estadística para HCI (1/3). Introducción

    Thursday, 24 de December de 2009

      Logo de Investigacion HCI

      La ciencia estadística tiene un sin fin de campos de aplicación. Dentro del HCI puedes encontrar estadística en las técnicas de Usability Engineering, como por ejemplo en los test de usuario.

      Para un ejercicio responsable del Usability Engineering es imprescindible tener un mínimo conocimiento de estadística, sin que esto implique un gran dominio de las matemáticas.
      Este post pretende introducción algunos conceptos básicos de estadística  que permitan entender la aplicación de la estadística a las investigaciones con usuarios.

      La estadística básicamente  nos permite hacer 2 tipos de cosas: analizar grupos y aceptar o rechazar hipótesis.

      Esto se plasma en los dos grandes tipos que hay de estadística, la Estadística Descriptiva y la Estadística Inferencial.

      La Estadística Descriptiva es la que nos permite recoger, ordenar y analizar los datos sobre un asunto, fenómeno o problema de investigación, por ejemplo ¿cómo  son nuestros usuarios?.

      La Estadística Inferencial es la a partir de una muestra extraída de una población nos permite hacer inferencias acerca de esa población, como por ejemplo ¿sí los usuarios del test realizan X todos los usuarios realizará Y?.

      Es posible que encuentres difícil algunas de estas ideas, seguramente por que se emplea un vocabulario especializado. Así que vamos a empezar por acotar conceptos.

      Conceptos  estadísticos básicos

      • Universo o Población: es el conjunto completo de individuos sobre los que queremos generalizar las conclusiones de nuestro estudio.  Se denota como N.
      • Muestra: es el conjunto de individuos que estudiamos. La muestra debe ser representativa de la población de estudio.  Se denota como n.

      Un universo o población se puede describir mediante parámetros. Los parámetros se suelen representar con letras griegas. Los parámetros nos dicen que es lo que ocurre en la población y los obtenemos de los estadísticos de la muestra.
      Los estadísticos son una estimación del valor del parámetro en la población.

      • Parámetros: son índices que describen la población. Estos índices son toda función definida sobre los valores numéricos de una población.
      • Estadísticos: son índices que describen la muestra. Estos índices es toda función definida sobre los valores numéricos de una muestra.
      • Las variables: son cada una de las características o aspectos que queremos medir en la muestra. Las variables se pueden clasificar en dos grupos:
      1. Cualitativas, cuando los valores no se pueden medir por que indican una cualidad (las variables cualitativas que pueden ser Nominales, cuando no pueden ordenar, por ejemplo el genero. Ordinales cuando si se pueden  ordenar, por ejemplo ante una pregunta sobre las preferencias,  estoy totalmente de acuerdo, estoy moderadamente de acuerdo…)
      2. Cuantitativas, cuando los valores se pueden medir por que son un numero (las variables cuantitativas pueden Discretas, que no tienen un valor intermedio entre dos valores consecutivos,  por ejemplo numero de hijos, pueden ser 1 o 2, pero no 1.7. Continuas cuando si existen valores intermedios entre dos valores consecutivos, por ejemplo la temperatura).
      • Distribución: es el registro de las distintas observaciones de una variable.

      La distribución de una variable discreta es binomial y la distribución de una variable continua es normal.

      Hay que tener cuidado al definir las variables del estudio porque en ocasiones estamos definiendo implícitamente la escala, por ejemplo si queremos medir la “usabilidad” en una tarea tenemos distintas formas de formular la cuestión.

      • Facilidad del usuario para completar la tarea: Completada/No Completada (Variable cualitativa nominal).
      • Dificultad percibida de la tarea: Alta, Media, Baja (Variable cualitativa ordinal).
      • Tiempo empleado en completar la tarea en segundos: (Variable cuantitativa continua).

      Como norma general, trataremos de usar variables cuantitativas continuas, porque  contienen más información, y permiten utilizar pruebas estadísticas más potentes.
      Además, cuando recogemos información sobre un  dato en forma de variable cuantitativa, podemos agrupar esa información en categorías cualitativas, mientras que al revés no se puede.
      De todos modos, esto no es una obligación, ya que  hay que valorar el esfuerzo que supone conseguir los datos y la viabilidad de la investigación. Estos aspectos los definiremos en el diseño de la investigación.

      ———————————————————————————————

      Quizás te interesa leer: Estadística para HCI 2. Diseño de investigación

      MUSiC Methods

      Thursday, 19 de February de 2009

        Comillas 2.0 The MUSiC methods were specifically developed by the European MUSiC (Metrics  for Usability Standards in Computing) project to provide valid and reliable means of specifying and measuring usability, while also giving diagnostic feedback which enables the design to be modified to improve usability. MUSiC includes tools and techniques for measuring user performance and satisfaction.Comillas 2.0

        Tomado de Measuring usability as quality of use, Software Quality Journal, 4, 115-150 (1995)

        ¿Así que  existe una especificación que permite cuantificar la usabilidad de las aplicaciones, y que además está documentada?
        El responsable es Nigel Bevan,  que además que resulta que los más viejos del lugar hasta puede que le vieran en su visita a España.
        El proyecto MUSiC  es un análisis de contexto de uso  que emplea métricas de usabilidad (User Performance Measurement Method y SUMI)

        bullet.gif Referencias:

        Morae en test de usuario con perfiles múltiples

        Friday, 13 de June de 2008

          Logo de Investigacion HCI

          Morae es un paquete de software compuesto por 4 herramientas, destinadas a analizar y compartir la experiencia de uso de una web, estas herramientas son: Morae Manager, Morae Observer, Morae Recorder y Morae Player.

          Una de las opciones más interesantes a la hora de evaluar la usabilidad de un site, reside en analizar las tareas especificas destinadas a los distintos perfiles de la audiencia del site. (Este enfoque entronca con personas y escenarios).


          Y para este fin Morae resulta una herramienta extremadamente útil.

          No obstante requiere cierta estrategia de investigación previa a su uso.

          Desde las tareas de diseño del cuestionario:

          Debemos establecer cuestionarios equilibrados para los distintos perfiles, de modo que podamos realizar comparaciones intragrupales e intergrupales.

          (Ejemplo: podemos detectar que el empleo del buscador de la web a analizar es residual en todos los perfiles, para recabar información podemos fijar tareas de uso del buscador orientadas a las posibilidades de que ofrece el site para los perfiles y analizar las pautas de navegación o la consecución del objetivo.)

          Desde la “operacionalización” del experimento:

          Conviene tener en cuenta los requisitos de análisis de Morae desde el inicio.

          Morae tiene un pequeño problema con las palabras acentuadas, que obliga a corregir estas palabras cuando recuperas un estudio (ejemplo “á” se convierte en & aacute;”) debido a la codificación de caracteres empleada.

          Es posible que exista una solución elegante a esto, pero resulta útil disponer del cuestionario en formato txt, para poder sustituir rápidamente y sin excesivo esfuerzo.

          Es importante establecer carpetas diferenciadas para los distintos experimentos y ser ordenado a la hora de definir el nombre del fichero de la grabación.

          El formato de fichero “Proyecto_FechaAñoMesDía” creo que resulta muy útil, y evita muchos problemas.

          Desde la generación de entregables:

          Se puede dar la situación de tener urgencia en generar y distribuir las sesiones del experimento, en principio desde Morae Observer se puede solucionar con gran facilidad.

          Si, se ha optado por la funcionalidad en tiempo real, para trasmitir el experimento a los observadores de sala , recuerda que este vídeo carece de la señal de audio, y muy posiblemente tendrás que procesar las grabaciones del experimento mediante Morae Manager para exportarla.

           

          bullet.gif Referencias:

          Encuestas online

          Monday, 5 de May de 2008

            Logo de Investigacion HCI

            La encuesta es una técnica muy popular en las ciencias sociales para recabar información de grupos cuando estos son voluminosos.

            Consiste en una serie de preguntas estructuradas y codificada, al que se llama cuestionario, cuya finalidad es obtener una perspectiva de la opinión de un grupo sobre una o más cuestiones.
            Existen distintos tipos de encuesta, atendiendo a una categorización basada en el procedimiento de administración, los fines, los objetivos y la dimensión temporal en la que se realiza.

            Cuando se hacen encuestas para recabar la opinión de una audiencia de un site, y esta se realiza mediante un elemento en el site estamos en una encuesta online.

            Las encuestas online se deben adaptar al canal web.
            Por lo que todo lo que vale para el diseño la web debe valer para el diseño del cuestionario, con esto me refiero a las consideraciones de buenas prácticas sobre usabilidad y accesibilidad.

            Algunas consideraciones que pueden serte útiles

            Resulta más sencillo enfocar el cuestionario como una prueba de contraste, que como una prueba exploratoria.

            Sí generas una hipótesis y la contrastas con la audiencia vía cuestionario vas a tener el campo de análisis mucho más acotado, que si tratas de descubrir todas las posibles deficiencias vía cuestionario.

            El cuestionario debe ser digerible, piensa en tu propia experiencia.

            Puede que no te moleste dedicarle 5 minutos a responder algunas preguntas, pero desde luego, ninguno queremos estar 55 minutos. (Supongo que quieres un numero, la fórmula mágica para mi esta en no sobrepasar los 15 ítems, siempre y cuando los ítems no tengan más de 6 u 8 categorías de respuesta.)

            No obstante, para estar seguros pide a alguna persona que haga la encuesta antes de implementarla en el site y controla el tiempo que emplea.

            ¿Preguntas abiertas o cerradas?

            Las preguntas abiertas son mucho más ricas en información, por el contrario resultan más difíciles de codificar y procesar. Una opción intermedia es emplear respuestas múltiples con diferenciales semánticos bien definidos.

            Ten previsto el plan B

            ¿Qué ocurre si no logras una muestra estadísticamente significativa en el periodo de la investigación?
            ¿Y si la logras a las 5 horas de lanzar el cuestionario?
            Ten cubiertos todos los frentes.

            Si la encuesta forma parte de una batería de pruebas de usabilidad, se coherente e integra cada fase dentro de la perspectiva general del proyecto. Genera hipótesis de tipo general, que puedas matizar en el test de usuario o que te sirvan para lograr un enfoque más definido de un análisis heurístico.

            Análisis Heuristico

            Tuesday, 15 de January de 2008

              La teoría dice que introducir pruebas de evaluación en los proyectos es bueno, y mientras antes las introduzcas mejor para el resultado final.

              Ahora, existen algunas pruebas de evaluación que presentan una “secuencialidad” determinada, respecto a la fase del proyecto en el que nos encontremos.

              Los análisis heurísticos cumplen ambas categorías, mejor cuanto antes, siempre dentro de la fase de testeo y afinamiento en el enfoque usability.gov o en la fase de desarrollo en el enfoque UCD de ciclo de vida del producto de S.E.

              Bien, eso es la parte teórica del curso.

              Pasemos a la práctica.

              Heurístico…? Eso donde lo hacen ?

              Antes de nada, es necesario aclarar el concepto a todos los implicados.
              Heurístico es como paralelepípedo, que tiene un nombre contundente, pero no por ello es ingeniería espacial.

              Análisis Heurístico es un tipo de análisis en el que se aplica heurística [la capacidad de un sistema para realizar de forma inmediata innovaciones positivas para sus fines], esta capacidad es netamente humana, y podemos considerar a esta capacidad como un sinónimo de “descubrir” (claro, que si dijeras Análisis de Descubrir el cool factor de la investigación desaparecería …)

              De Madrid a Toledo, pasando por Nueva York y a nado.

              Testear Bueno.
              Heuristico Bueno.

              Pero ¿para qué?, es una técnica, no un fin, (el fin de la técnica es detectar e identificar factores que afectan negativamente a la usuabilidad del producto web).
              El análisis heuristico incrementa su significación si esta integrado dentro de una fase de evaluación y mejora del site, y permite responder a la pregunta “¿Y después que?”

              4 ojos ven más que 2, el precio de la vida, ROI, investigadores y costes

              A) El análisis heuristico identifica un mayor número de problemas de usabilidad si se incrementa el número de investigadores.
              B) El análisis heuristico presenta una relación Coste-Beneficio más baja que otras técnicas de análisis.

              A más A) menos B).

              Hay que tenerlo en cuenta, y definir el análisis en términos de Muestra (donde aplicamos, WEB/ PDA/TODO) en términos de Tiempos, Costes y Plazos, y orientar la investigación a un fin, y no llevarnos sorpresas,del tipo “¿Y ahora de donde saco yo un investigador?”

              En conclusión:

              Analisis Heuristico, es un tipo de prueba de evaluación de usabilidad, cuya finalidad es descubrir mediante contraste, con una serie de reglas o guías basadas en principios de usabilidad, que elementos del site lastran la experiencia de uso.

              La capacidad de detección del análisis heurístico teóricamente, nos permite hablar de un nivel de confianza entorno al 75% de problemas de usabilidad para 5 evaluadores, según J. Nielsen, (no he visto los cálculos y el diseño del experimento, pero la lógica me resulta un poco discutible, estos datos se basan en tener identificados el 100% de los problemas antes de iniciar la investigación… lo cual, me resulta extraño, es una técnica exploratoria.

              Todo el proceso se plasma en un informe del Análisis Heuristico. (¿necesitas un ejemplo?, cortesía de las señoritas de cadius)

              bullet.gif Referencias:

              Creative Commons License
              Esta obra está bajo una licencia de Creative Commons.