La ciencia tras bastidores: Correlación y causalidad

Escrito en inglés por Brian Moyers, traducido al español por Thibaut R. Pardo-García y editado por Attabey Rodríguez-Benítez.

Cuando hablamos sobre problemas científicos, la frase “correlación no implica causalidad” a veces es utilizada. Pero, ¿Qué significa esta frase? La ciencia hace declaraciones sobre causa y efecto. Por ejemplo, el fumar causa cáncer de pulmón, las emisiones de carbón causan cambios climáticos y altas temperaturas causan un aumento en violencia. Claramente, los científicos tienen alguna manera de inferir relaciones causales. Pero, ¿Cómo es que ellos luchan con la idea de que “Correlación no implica causalidad”? Si no utilizan correlación, ¿Qué herramientas utilizan para inferir causalidad?

Por ejemplo, cuando la venta de mantecado aumenta también aumenta el número de ataques de tiburón. En otras palabras, la venta de mantecado está correlacionada al ataque de tiburones. Pero ¿Esto significa que la venta de mantecado causa ataques de tiburones? Por supuesto que no. El argumento de que “El mantecado causa ataques de tiburón” es un ejemplo clásico de una falacia lógica. Hay veces que las personas se mofan de este argumento ya que es dolorosamente obvio que no hay una relación de causa y efecto.

Posibles mecanismos

Usualmente cuando se trae el argumento de que “El mantecado causa ataques de tiburón,” la respuesta inmediata se parece a “No, no – los días calientes hacen que las personas visiten la playa. En la playa, hay una mayor probabilidad de que compres mantecado y de que un tiburón te ataque. Veras que la correlación entre estas dos variables es en realidad explicada por los días soleados y calientes.” Pero hay un problema. Esta respuesta dice que “los ataques de tiburón están correlacionados a los días calientes. El consumo de mantecado está correlacionado con los días calientes. Los días calientes causan ambas cosas.” Alguien debería estar gritando, “¡Oye! ¡Correlación no implica causalidad!”

¿Por qué creemos que está bien inferir causalidad en una ocasión, pero no en la otra? Un factor es que se nos provee un posible mecanismo. Por mecanismo posible me refiero a una explicación racional que ata dos o más observaciones. Basado en lo que sabemos sobre cómo es que las personas se comportan y cómo es que los tiburones se comportan, podemos decir una historia creíble acerca de cómo las ventas de mantecado, los ataques de tiburón, y el calor se correlacionan.

Pero esto no es suficiente. Después de todo, podemos inventar un posible mecanismo por el cual el consumo de mantecado podría causar ataques de tiburón. Podríamos decir “Los tiburones tienen un olfato particularmente bueno. A lo mejor el mantecado huele muy bien para ellos. Cuando una persona come mantecado y se mete al agua, los tiburones pueden oler el mantecado y van directamente hacia la persona.” Aún más, ambas explicaciones podrían ser verdad (El mantecado y los ataques de tiburón, o los días calientes y los ataques de tiburón). Claramente, se necesita más para implicar causalidad. Para poder inferir causalidad, tenemos que confirmar las conexiones entre cada paso de nuestra historia. Si fuésemos a utilizar la explicación al principio de este párrafo, necesitaríamos confirmar que los tiburones pueden oler el mantecado y que cuando huelen el mantecado nadan hacia eso. Nosotros conectamos los puntos en nuestra explicación por mediante de experimentos.

Diseño Experimental

Cuando tenemos que escoger entre múltiples posibles mecanismos – o, queremos confirmar solo un mecanismo – se emplearía uno o más experimentos. El campo de diseño experimental es un área de la estadística que ayuda a los investigadores a planear e interpretar experimentos.  Cómo diseñamos un experimento depende de muchas cosas, incluyendo cuántos mecanismos queremos poner a prueba y cuantos sujetos tenemos. (“Sujetos” podrían ser personas, días, ratones, o cualquier otra cosa que estés observando.) Si escasean los sujetos y tienes demasiadas explicaciones que poner a prueba, algunos experimentos serán imposibles.

En nuestro ejemplo, hay dos factores que estamos interesados en probar: el consumo de mantecado y los días calientes. Para este diseño experimental, necesitamos cuatro grupos de sujetos. El primer grupo no comería mantecado en la playa durante un día caliente. El segundo grupo comería mantecado en la playa durante un día caliente. El tercer grupo no comería mantecado en la playa durante un día frío. El cuarto grupo comería mantecado en la playa durante un día frío. Luego, contaríamos el número de ataques de tiburón que ocurrieron en cada uno de los cuatro grupos. En este experimento hay varios resultados posibles, pero solamente voy a demostrar tres ejemplos como método de ilustrar.

bryan_fig1En el ejemplo 1, se puede ver que, durante días calientes, parece ser que hubo muchos más ataques de tiburón que durante días fríos. Esto ocurrió con o sin el consumo de mantecado. Así que, si estos fuesen los resultados de nuestros experimentos, nosotros concluiríamos que “Los días calientes, pero no los fríos, están correlacionados a los ataques de tiburón.” Por supuesto, no podríamos afirmar esto basado únicamente en nuestra tabla. Estos resultados serían interpretados usando la estadística. Las estadísticas incorporan muchos factores como, por ejemplo, el número de sujetos (las personas) en cada grupo y cuantos ataques de tiburón hubo por cada grupo. Los investigadores utilizan valores proveídos por la estadística, como lo es el coeficiente de correlación y el valor-p, para tener la confianza de decir que sus resultados no están atribuidos a sucesos aleatorios*.

bryan_fig2En el ejemplo 2, podemos ver que cuando se come mantecado hay muchos más ataques de tiburón que cuando no se come mantecado. Esto ocurre esté el día caliente o frío. Si estos fuesen los resultados de nuestro experimento, podríamos concluir que “El consumo de mantecado está correlacionado a los ataques de tiburón.” Por supuesto, esto es asumiendo que la estadística apoye esa conclusión.

bryan_fig3En el ejemplo 3, los ataques de tiburón solamente ocurren cuando los días están caliente y la gente consumo mantecado. Podemos observar que hay pocos ataques de tiburón a menos que el día esté caliente y se esté consumiendo mantecado. A esto se le conoce como interacciones de primer-orden, lo que significa que dos factores (los días caliente y el mantecado) tienen un efecto diferente cuando están juntos que cuando están separados. Podríamos decir algo como “Hay un mayor número de ataques de tiburón cuando se consume mantecado durante días calientes.” Pero encontrar un posible mecanismo para explicar nuestros hallazgos puede que tome un poco más de esfuerzo. A lo mejor podría ser que “El mantecado se derrite más rápido de lo que puede ser consumido durante días calientes. El mantecado derretido cae al océano y atrae tiburones, los cuales atacan a las personas.”

De estos ejemplos, parece ser que tenemos una forma por la cual podemos inferir causalidad. Si los números apoyan nuestra historia, podemos decir que hay una relación causal. Pero hay dos grandes problemas con inferir causalidad, aun cuando es a partir de un buen experimento. 1) Para poder descartar todas las posibles explicaciones e interacciones, el número de sujetos experimentales requeridos puede ser astronómico.  Usualmente no es práctico ni posible descartar todas las demás posibilidades e interacciones. 2) Aun teniendo suficientes datos, todas las interpretaciones están basadas en estadísticas, como una correlación. Por lo que siempre hay una probabilidad, no importa cuán pequeña, de que tus resultados simplemente están basados en sucesos aleatorios.

Las “malas” noticias

¡El mensaje es que nunca podemos inferir causalidad! O por lo menos, siempre habrá problema con inferir causalidad. Nuestras pruebas estadísticas solamente nos dicen sobre lo que es y no es probable. Siempre es posible que haya otra explicación por probar o que un resultado experimental ocurrió aleatoriamente. ¿Entonces, la búsqueda del conocimiento es inútil? ¿Los experimentos no importan? ¿La Ciencia es inútil?

Al igual que con todos los problemas filosóficos, tienes que encontrar una respuesta por ti mismo. Mi punto de vista es que la ciencia no es inútil. Aun cuando es técnicamente posible que el mantecado cause ataques de tiburón, hay una falta de evidencia para apoyar esta posibilidad y mucha evidencia para apoyar la idea de que los días calientes causan ataques de tiburón. A menos que alguien descubra un tiburón de tierra que sin compasión esté buscando personas que comen mantecado (adiós Ben & Jerry’s!), sería bastante tonto pensar que comer mantecado aumentaría tus probabilidades de morir por un ataque de tiburón.

bryan_fig4
RAWR. fuente de la imagen: Wikimedia Commons

Tomando un ejemplo del mundo real, no podemos asumir que todo nuestro conocimiento sobre la ciencia de cohetes está basado en causalidad. Por ejemplo, que el combustible de los cohetes espaciales quema a través de una boquilla detalladamente moldeada causando un empuje vertical que lanza el cohete a través de la atmósfera y hacia la órbita. Aun así, como dijo un ingeniero aeronáutico que es un buen amigo mío, “Cierto, pero aun así hacemos cohetes espaciales.” En la ciencia y la ingeniería, al igual que en la vida, la suposición practica apoyada en la evidencia gana sobre problemas filosóficos – sin importar cuan real e importante sean esos problemas.

Las suposiciones prácticas sobre la causalidad han sido catalíticos de la ciencia, ingeniería y medicina durante los últimos miles años. ¡Si alguien sugiriese que el ADN no es una de las principales causas de la herencia de rasgos porque nosotros no podemos realmente probar causalidad, recibirían extrañas miradas! Lo mismo se puede decir sobre que el fumar cigarrillos causa cáncer de los pulmones, la pérdida masiva de sangre lleva a la muerte, el flujo de electrones de forma circular causa campos magnéticos y sobre un número de otras relaciones causales apoyadas por la ciencia. Por ende, aun cuando la causalidad siempre viene con un poco de incertidumbre, la ciencia hace un muy buen trabajo en descubrir relaciones causales que hacen sentido y que funcionan en el diario vivir de los científicos y otros.

¿Pero cómo una persona puede saber cuándo está bien asumir causalidad en algún problema científico de gran importancia? Esto no es algo fácil de hacer. Cuando una persona sabe lo suficiente sobre cómo un campo trabaja o tiene suficiente experiencia práctica sobre un problema, se hacen buenos en saber cuándo está bien inferir causalidad. Esta es la razón por la cual las personas invierten años de su vida estudiando la biología, física, sociológica, o ingeniería. Los atajos no son fáciles de encontrar.

Una forma por la cual puedes verificar causalidad es utilizando el Criterio de Bradford Hill una lista de los requerimientos mínimos necesarios para que la relación causal sea verdad. Tienes que tener en mente, aun cuando la relación cumple con estos criterios, no garantiza causalidad. Solamente cuando la relación no cumple con los criterios es que usualmente y ciertamente no es causal. Más allá de esto, la mejor recomendación que puedo dar es confiar en el consenso de los expertos sobre el tema, o mejorar tu conocimiento sobre el campo mediante los estudios – particularmente sobre la estadística*, ya que forma una gran parte de cómo es que los científicos infieren la causalidad en casi todos los campos. Es una respuesta compleja y posiblemente insatisfactoria, pero así es como la ciencia funciona.

Nota por el autor: La estadística es un gran tema y no pudimos profundizar los detalles adecuadamente en este artículo. Hasta que un artículo pueda ser dedicado a la estadística de los experimentos, yo fomento el que usted revise esta serie de artículos sobre la estadística publicado en la revista Nature.  

Sobre el autor

bryanBryan Moyers, nuestro segundo Co-fundador, Coordinador de Logística y Editor en Jefe es un estudiante doctoral en el programa de Bioinformática de la Universidad de Michigan. El trabajo de tesis de Bryan está enfocad en problemas metodológicos de la evolución molecular y en la correcta inferencia de información a partir de datos. En otras palabras, su investigación nos ilumina sobre los problemas que los métodos comúnmente empleados en el campo de la Biología Evolutiva tienen para así poder hacer mejoras. Bryan tiene un grado en Biología y Psicología de Purdue University. Sus intereses están en los asuntos científicos y educacionales, la filosofía de la ciencia y en la intersección de la ciencia y el negocio. Fuera de la ciencia, Bryan disfruta leer, correr, excursionismo y en la creación/consumo de la cerveza.

Lee más sobre Bryan aqui.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

w

Connecting to %s