
El diseño de investigación o diseño experimental es un plan general de investigación para contrastar la hipótesis.
Una hipótesis es una afirmación respecto a una característica de una población.
Todas las investigaciones o estudio estadístico, de forma general, se componen de los siguientes pasos:
- En primer lugar hay que definir el objetivo de la investigación, ¿qué quiero saber? Por ejemplo “como de usable es el interfaz”.
Esta pregunta podría ser nuestra hipótesis. Pero ¿cómo podemos saber si esta es una buena hipótesis?
Para poder habla de “como de usable es el interfaz” debemos comenzar por definir que atributos vamos a considerar indicadores de usabilidad. Existen numerosas definiciones de usabilidad, por lo que debernos elegir una. Por ejemplo podemos utilizar la definición de la ISO 9241-11*, que vincula la usabilidad con la Eficiencia, la Eficacia y la Satisfacción del empleo del producto.
Muy bien, hasta ahora hemos acotado el objeto de investigación, pero aun así, indicar como de eficiente, eficaz o satisfactorio es el empleo de un interfaz sigue siendo un tanto árido. Por lo que necesitamos tareas sobre las que ponderar estas características.
Una tarea es una acción que puede realizar un usuario con un objetivo, y tiene un origen y un fin claros.
Las tareas que vamos a seleccionar serán aquella que responden a los objetivos de negocio, interés del proyecto, consistencia con anteriores investigaciones o que nos aporten los datos que necesitamos. Es importante que seleccionemos tareas que aporten datos significativos. Las tareas deben ser únicas y deben tener un único objetivo. Por ejemplo en un librería online la tarea “Comprar el libro X” puede implica 1. Tratar de localizar el libro, 2. Iniciar la compra, 3. Validar la compra. Estaríamos ante 3 tareas, si la enunciamos como una sola tendremos problemas a la hora de cuantificar.
Con la ayuda de las tareas parece que podemos definir nuestra hipótesis. Recordemos, la hipótesis debe ser formula de forma sencilla e inequívoca.
La idea del proceso es cerciorarnos con números que lo que afirmamos en la hipótesis es correcto, (cuando es correcta nuestra afirmación decimos que se cumple la hipótesis nula)
- Recogida de la información muestral.
Uno de los aspectos más comentados cuando se habla de test de usuarios es: ¿cuántos usuarios necesito?
Es mucho mas importante definir correctamente las tareas y fijar los objetivos que realizar un muestreo muy exhaustivo. La calidad de la muestra es tan importante como su tamaño.
Es posible que conozcas formula 5. Bueno, en principio usar 5 usuarios no resulta estadísticamente representativo. Además recuerda que Nielsen habla de una población homogénea donde cada unidad descubre el 31% de los problemas de usabilidad de un total de problemas CONOCIDOS.
Puede que necesites argumentar porque no usar 5 usuarios, como alternativa a teórica a Nielsen están los estudios CUE de Molich.
La selección de la muestra es un problema antiguo de los test de usuarios, ya que en algún sitio esta escrito a fuego que resulta cara la captación de usuarios (en cualquiera de sus sabores, pero la captación formal e informal no tienen el mismo coste), aunque posiblemente resulte más caro tomar decisiones basadas en seudo-investigación.
A la hora de hacer un muestreo es importante el grado de homogeneidad de la población. Por ejemplo si nuestros usuarios responden en su mayoría a una serie de características comunes (grupo de edad muy definido, pautas de consumo similares, objetivos de uso concretos …) diremos que son muy homogéneos, si no es así, y en la mayoría de casos no lo sera, estableceremos grupos que presenten homogeneidad interna y heterogeneidad entre los grupos (jóvenes, adultos, amplia experiencia con tecnología, poca experiencia con tecnología) y seleccionaremos aleatoriamente la muestra.
Los estimadores siempre tienen que ir acompañados por una medida de su precisión por lo que la pregunta no es cuantos usuarios empleo en mi test, sino cuanta incertidumbre puedo aceptar a la hora de hacer recomendaciones de usabilidad, en otras palabras, con que seguridad puedo decir que debemos cambiar “ese botón” por que 5 usuarios han tenido problemas con él. Gota de sudor.
Raúl Páramo tiene un post muy bueno al respecto de tamaños de muestra (y al final del post esta el enlace a la calculadora de muestras para distribuciones normales ¡oro puro!).
- Significación estadística. Son los análisis numéricos, pero eso se lo vamos a dejar a algún útil programa de calculo como SPSS, o la alternativa código libre PSPP.
Vas a necesitar los estadísticos descriptivos para el análisis descriptivo.
La significación estadística la vamos a calcular de la siguiente forma:
- Si se trata de una única variable continua mediante el calculo de la T de Student.
- Si se trata de mas de una variable continua mediante el calculo de la ANOVA.
- Si se trata de una variable discreta mediante el calculo de Chi cudrado.
- Análisis descriptivo. Ya tienes un buen montón de datos, pero es posible que necesites resumir los datos, las formas más intuitivas es la presentación de los datos mediante algún diagrama, como por ejemplo un histograma. Recuerda que un buen gráfico siempre tiene algo de ciencia y algo de arte.
- Informe. Donde documentamos el proceso del test y los resultados obtenidos. Seguiremos el modelo CIF.
* Usability en ISO 9241-11: “the extent to which a product can be used by specified users to achieve specified goals with effectiveness, efficiency and satisfaction in a specified context of use“. Esta definición también se emplea en CIF.
———————————————————————————————
★ Quizás te interesa leer: Estadística para HCI 1. Introducción