viernes, diciembre 02, 2005

Investigansadas VI - Investigación "for dummies", 3era parte

Anteriormente hemos visto las definiciones, los problemas, el marco teórico y las hipótesis. El siguiente paso son:

4 – Los Diseños de Investigación

Es hora de construir nuestro método de investigación, y para ello disponemos de diseños tanto experimentales y no experimentales. La diferencia entre ambos radica en que en un experimento el investigador manipula variables deliberadamente y de manera controlada, mientras que en las investigaciones no experimentales se trabaja observando la realidad directamente sobre el campo sin intervenir.

Diseños no experimentales:

Las ventajas de no experimentar son una mayor naturalidad de las condiciones del estudio, lo que hace que los resultados se aproximen mas a describir la realidad, que la artificialidad de las condiciones de un experimento a menudo interfiere. Por ende, sus conclusiones son mas fácilmente generalizables. Según la dimensión temporal que abarquen los podemos clasificar en transeccionales y longitudinales.

La investigación transeccional abarca un único tiempo, un instante, es como una “fotografía”. Describe variables y analiza su incidencia y correlación en un tiempo determinado. Pueden abarcar tanto grupos como elementos aislados, y a su vez se dividen en descriptivos (indagan en la incidencia y los valores de las variables) y correlacionales causales (describen las relaciones entre dos o mas variables).

La investigación longitudinal incorpora la dimensión tiempo, se recolectan datos en períodos específicos para analizar los cambios que se van desarrollando. Suelen dividirse en diseños de tendencia, de evolución de grupo y panel. Suelen ser mas complejos y costosos que los transeccionales, pero su aporte es mas valioso ya que informan sobre la evolución del elemento o grupo bajo análisis.

Diseños experimentales:

O experimentos, en otras palabras. La palabra experimento tiene dos acepciones, una amplia y una restringida. La amplia equivale a “realizar una acción y observar las consecuencias de la misma”. Así experimentamos cuando, por ejemplo, echamos mas condimentos en una comida a ver que sabor le da.

En el sentido estricto, restringido, nos referimos a “un estudio de investigación en el que bajo condiciones de control se manipulan de manera deliberada una o mas variables independientes con el objeto de medir sus consecuencias sobre las variables dependientes”.

Esto es lo que se denomina un experimento “puro”, además del cual existen los cuasiexperimentos y los preexperimentos. Pero vamos por partes.

Leyendo con atención la definición, veremos que un experimento puro debe cumplir varios requisitos, a saber:

1 – Manipulación intencional de una o mas variables independientes.
2 – Medición de los efectos sobre la o las variables dependientes.
3 – El control.


(aclaración, por si no se sobreentendió: por variable dependiente entendemos aquella que es influenciada por una variable independiente, variable independiente es la que no se ve alterada por las otras variables sino por el experimentador. Se presume que la variable independiente elegida es la causa del fenómeno que queremos experimentar, mientras la variable dependiente refleja el efecto.)

En el experimento buscamos descubrir si una o varias variables determinadas influencian a otras, cómo lo hacen y por qué. Para poner en evidencia las relaciones entre variables se manipula (en otras palabras, se alteran sus valores) deliberadamente las variables independientes, sin tocar las demás. Las variables dependientes solamente se miden, para ver que efecto produjo en ellas la manipulación de la otra.

Esta manipulación puede darse ya como presencia-ausencia (1;0) de estímulo, o con una graduación cuantitativa en el estímulo (1;2;3;...), o bien con diferentes modalidades (verde, rojo, azul), e incluso una combinación de ambos sistemas. Téngase en cuenta que cada nivel requiere un grupo adicional de elementos para experimentar. El aumento de variables independientes a modificar implica aumentar el tamaño de la muestra, si se quiere que los resultados conserven fiabilidad, no así el aumento de variables dependientes a medir, que sólo aumenta el tamaño de la medición (salvo en experimentos en los cuales la medición en sí implique destrucción o alteración irreversible de la muestra medida, por ejemplo, la datación por C14).

El control tiene por objeto asegurar que los efectos observados en las variables dependientes sean de hecho producto de la manipulación de las independientes y no de otras causas. ¿Cuales son las posibles causas de invalidación de un experimento? Podemos distinguirlas entre internas y externas.

Fuentes de invalidación interna:

1) Historia: eventos inesperados que ocurren durante el experimento que afectan a la variable dependiente. Digamos que se descompone uno de los hornos en los que incubamos nuestros cultivos de laboratorio y esos ven alteradas sus propiedades. O una fuga en un ambiente supuestamente hermético contamina los elementos que estamos midiendo.

2) Maduración: son procesos internos de evolución de los elementos que se dan con el tiempo. Por ejemplo, materiales orgánicos que se van descomponiendo, fatiga en los individuos que participan del experimento, estrés en los animales de laboratorio.

3) Inestabilidad: cuando las mediciones son poco confiables, ya sea que los instrumentos fallen o que mediciones en teoría equivalentes den valores dispares. Supongan que tengo una cacerola con agua caliente e introduzco dos termómetros iguales, uno mide 75*C y el otro 85*C. Uno de ellos (o ambos) está fallando. La medición no es confiable.

4) Administración de pruebas: habla del efecto que la realización de una medición puede tener sobre mediciones posteriores. Por ejemplo, una encuesta acerca de hábitos del consumidor de, supongamos, gaseosas, puede hacer que el individuo encuestado tome conciencia de segundas marcas y se decida a probarlas. Si se le hace una nueva encuesta la semana siguiente arrojará cambios en su hábito de consumo sin que esto sea efecto de la campaña publicitaria de la empresa.

5) Instrumentación: Si en el transcurso del experimento se cambian los instrumentos de medición o los operadores de los mismos, se cambian los observadores o experimentadores los nuevos tendrán sus propias características personales distintas que podrían influir el desarrollo del experimento.

6) Regresión estadística: Es un efecto que presentan elementos seleccionados sobre valores extremos que se hallan en trance de volver a su promedio. Supongamos que quiero analizar la evolución del volumen de precipitaciones de la Mesopotamia argentina de los últimos años pero tomo como base el año 1997, cuando el efecto de El Niño provoco precipitaciones extremas y grandes inundaciones. Los años siguientes a 1997/98 mostrarían un abrupto descenso que en realidad representa la vuelta a la normalidad del régimen de precipitaciones.

7) Selección: Los elementos pueden haber sido seleccionados de manera deficiente, sin asegurar su equivalencia. Digamos que al asignar grupos de personas para distintas pruebas decido respetar los a los grupos de amigos que existían previamente. Su coincidencia en gustos y costumbres puede provocar sesgos en los grupos de estudio.

8) Mortalidad experimental: Se pierden elementos por abandono, muerte o destrucción en proporciones no equivalentes. Supongan que se incendie el laboratorio y de un cultivo se pierda el 75% del mismo, mientras otro sufre pérdidas del 20% y un tercero resulta intacto. ¿Siguen siendo respresentativos los sobrevivientes o son demasiado escasos?

9) Experimentador: la interacción del experimentador cuenta mas de lo que parece, sobre todo en los experimentos que involucren personas. La personalidad del investigador, mas amable o mas hosco puede predisponer a los individuos en un determinado sentido, incluso al punto de echar a perder el experimento. El investigador no es un observador pasivo sino activo, aunque a menudo no se percate de ello. Ejemplo claro podría ser un investigador racista, que tratara con desprecio a los integrantes negros que haya en el grupo.

Por ello hay experiencias que requieren el sistema del “doble ciego”, en el cual la persona que administra las pruebas no sabe qué le esta administrando a quién. Los experimentos para probar medicamentos son un clásico ejemplo: suponga que deseo probar si los remedios homeopáticos funcionan, administraré como es corriente el medicamento homeopático a un determinado grupo y un placebo al grupo de control, aunque éstos últimos no lo saben. Pero tampoco debe saberlo la persona que les administra los medicamentos, pues su actitud podría variar para con unos y otros, alterando la confianza de los mismos hacia uno u otro lado, potenciando o disminuyendo el efecto placebo.

Para salvar las fuentes de invalidación anteriormente mencionadas es que se recurre al control, y éste consiste en tener grupos de comparación (con un solo grupo no podríamos asegurar que los efectos responden a las causas), y en asegurar las mismas condiciones experimentales (equivalencia) para todos los grupos excepto la variable a alterar.

Hago hincapié en esto porque los experimentos pseudocientíficos a menudo no existe ni sombra del control, con lo cual tienden a verse ampliamente influidos por estas causas de invalidación, cuando no adulterados de manera deliberada.

La mencionada equivalencia comienza al principio, los grupos deben ser equivalentes desde el principio, similares desde el inicio. No son equivalentes dos grupos de personas a encuestar si uno esta compuesto en un 90% por hombres y 10% de mujeres, y el otro por 50% y 50%. O si un grupo tiene 100% de argentinos nativos y el otro tiene un 50% de inmigrantes chinos. La mejor manera de lograr la equivalencia inicial es la asignación al azar, y funciona mejor entre mayor sea el grupo (si, tirando un dado o una moneda si se quiere!). También pueden emparejarse los grupos, pero eso ya excede los propósitos de este artículo.


Los grupos deben ser representativos de la población a la cual se quiere extender las conclusiones del estudio. Y esta equivalencia debe mantenerse durante la experiencia. Los grupos deben estar todos sometidos exactamente a las mismas condiciones con única excepción de la variable que vamos a influir.

También hay causas externas de invalidación de un experimento. Me explico: trata de en qué medida los resultados del experimento son aplicables a poblaciones en condiciones no experimentales. Las condiciones de un experimento tienen un grado de artificialidad determinado, y los elementos a menudo se comportan de distinta manera en la naturaleza. Esto es así porque es imposible reproducir de manera exacta las condiciones naturales de las poblaciones. El comportamiento de los animales salvajes no puede estudiarse en una jaula donde están sujetos al estrés. Las personas no se comportan de la misma manera en la intimidad que en la casa del Gran Hermano (programa de televisión basura si los hay), por eso todos los que esperaban ver sexo en pantalla quedaron bastante desilusionados.

Causas de invalidación externa son:

1) Efecto reactivo o interacción de las pruebas: los elementos estudiados se sensibilizan con respecto a la variable debido a las prepruebas. Ejemplo clásico es el de Babbie (1979), en el que una película contra el prejuicio racial se proyecta a un grupo de personas para ver si reduce sus niveles de prejuicio. Sin embargo la administración previa de un cuestionario sobre prejuicio racial puede sensibilizar al grupo y provocar un mayor o menor impacto de la película.

2) Interacción entre errores de selección y el tratamiento: se da cuando se eligen elementos con propiedades especiales que provocan respuestas distintas a las normales.

3) Efectos reactivos de los tratamientos en sí: la aplicación de un estímulo no es neutra. La administración de un medicamento o la realización de una operación quirúrgica acarrean situaciones de estrés que modifican el comportamiento de personas y animales de laboratorio. La medición de un compuesto puede alterarlo o contaminarlo.

4) Interferencia de tratamientos múltiples: si los efectos de los estímulos no son reversibles las conclusiones solamente son aplicables a los elementos que hayan sufrido los mismos estímulos en el mismo orden e importancia.

5) Imposibilidad de replicar: cuando las experiencias son tan complejas o tan puntuales y específicas que no se dan en condiciones naturales no se pueden generalizar a una población. Esto es lo que suele suceder con muchas investigaciones pretendidamente científicas que alegan demostrar la eficacia de pseudociencias como la astrología, las medicinas alternativas, la criptozoología, etc.... Las supuestas experiencias no son replicables, por lo tanto resultan científicamente inválidas.

Breves palabras vamos a dedicar a los preexperimentos y a los cuasiexperimentos. Los primeros tienen un grado de control ínfimo y son de poca utilidad, apenas sirven para hacer estudios exploratorios. Se trata lisa y llanamente de administrar un estimulo a un grupo cualquiera y medir su efecto, sin preprueba ni control.

Los cuasiexperimentos difieren de un experimento “verdadero” en la equivalencia inicial de los grupos, que están armados ya de antemano. A veces las condiciones de un estudio determinan que uno no pueda asignar grupos al azar sino debe estudiar un grupo específico, digamos un cultivo determinado o un grupo de personas en particular.

Ahora sí, llegamos al experimento “puro”. Éste puede ser de campo o de laboratorio, la diferencia es el grado de control que se tiene sobre las variables. El experimento de laboratorio puede verse como un experimento en una “burbuja de cristal”, el control de las condiciones es casi absoluto pero altamente artificial. El experimento de campo relaja mas el control, hasta el límite posible, pero se lleva a cabo en una ambiente mas natural y por ende mas realista, lo que le da mayor validez externa.

Ahora voy a recurrir a algunos diagramas para explicar distintos diseños, por lo cual aclararemos la simbología desde ahora:

R : significa asignación al azar o aleatoria (la “R” viene del inglés, “random”).
G : es el grupo (en inglés, “group”).
X : es el estímulo o tratamiento, la alteración de la variable
- : significa ausencia de la alteración a la variable. Es un grupo de control.
0 : indica una medición a los elementos del grupo.

La cronología es lineal de izquierda a derecha, eventos alineados verticalmente son simultáneos.

Ejemplo de preexperimento:

G X 0

Es un grupo, se le aplica el estímulo y una medición. Veamos ahora un cuasiexperimento:

G1 01 X 02
G2 03 - 04

Se tiene un grupo de experimentación (G1) y uno de control (G2), pero no son aleatorios. Se realiza una primera medición, se aplica un estímulo al primer grupo y se mide nuevamente cada grupo.

Los experimentos verdaderos reúnen las características de control y validez interna: los grupos de comparación y la equivalencia de los grupos. Veamos primero un sencillo diseño con un grupo de control y postprueba:

RG1 X 01
RG2 - 02

“R” indica la aleatorización inicial de los grupos. RG2 es el grupo de control que no recibe estímulo, y ambos grupos son evaluados a posteriori para comprobar las diferencias. La postprueba debe preferentemente llevarse a cabo lo antes posible después de la administración del estímulo si la variable dependiente tiende a evolucionar con el tiempo. Éste otro incluye una preprueba para comparar con el estado previo al estímulo.

RG1 01 X 02
RG2 03 - 04

Aclaro, por las dudas, que las distintas numeraciones de las mediciones corresponden a la identificación de cada medición en particular, no a distintos métodos de medición. Los métodos de medición deben ser, como dijimos, exactamente los mismos. Veamos como sería un diseño con varios grupos sometidos a estímulos distintos a, b y c, con un grupo de control:

RG1 01 Xa 05
RG2 02 Xb 06
RG3 03 Xc 07
RG4 04 - 08

Un experimento “ideal”, si se quiere, que considere las también las prepruebas como causa posible de invalidación, es el diseño de cuatro grupos de R. L. Solomon (1949).

RG1 01 X 03
RG2 02 - 04
RG3 - X 05
RG4 - - 06

El diseño incluye un primer grupo (RG1) al cual se le administran tanto la preprueba como el estímulo X, un segundo grupo que es de control (RG2) al cual se le administra la preprueba pero no recibe el estímulo X, un tercer grupo que es de experimentación (RG3) que recibe estímulo sin preprueba, y un segundo de control (RG4) que no recibe ninguno de ambos. En la medición final se podrá verificar si la preprueba tiene efecto sobre la postprueba.

Los diseños que mostramos hasta ahora son para experimentos de corto plazo, pero un experimento longitudinal que requiera cierto tiempo (incluso años) requieren series cronológicas con varias post pruebas espaciadas. Ejemplo:

(al día) (7 dias) (al mes) (al año)

RG1 01 X 03 07 011 015
RG2 02 - 04 08 012 016
RG3 - X 05 09 013 017
RG4 - - 06 010 014 018

¿Y si la investigación requiriese un experimento con repetición del estímulo? Se vería algo así

RG1 01 X 03 X 07
RG2 02 - 04 - 010
RG3 - X 05 X 011
RG4 - - 06 - 012

Claro que si queremos discernir que efectos tiene la repetición del estímulo habría que incluir un grupo de control con un estímulo solo (RG5).

RG1 01 X 03 X 07
RG2 02 - 04 - 010
RG3 - X 05 X 011
RG4 - - 06 - 012
RG5 013 X 014 - 015


Podríamos agregar un grupo RG6 para ver si el momento cronológico de la aplicación del estímulo individual influye, y tendríamos:

RG1 01 X 03 X 07
RG2 02 - 04 - 010
RG3 - X 05 X 011
RG4 - - 06 - 012
RG5 013 X 014 - 015
RG6 016 - 017 X 018

¿Quieren complicarla aún mas? Podemos multiplicar la diversidad de estímulos y repeticiones de aplicación, pero se requerirán cada vez mas grupos experimentales, y también grupos de control si quieren individualizar los efectos de cada tratamiento.

Si queremos manipular dos o mas variables independientes con dos o mas niveles de presencia de cada una requeriremos diseños factoriales, donde todos los niveles de cada variable independiente se cruzan con todos los niveles de la otra. La ventaja será que veremos los efectos de cada variable independiente sobre las dependientes tanto de manera individual como en conjunto. Pero si seguimos agregando variables el número de grupos y con ellos la complejidad del experimento van creciendo de manera exponencial.


Próximamente hablaremos sobre población, selección de muestras, y recolección de los datos.

(Continuará...)