top of page

La IA está aprendiendo lo que significa tener vida


Carl Zimmer, resumido por Tony Salgado

Marzo, 2024

 

“En 1889, un médico francés llamado Francois Viault bajó de una montaña de los Andes, se extrajo sangre del brazo y la analizó bajo el microscopio. Sus glóbulos rojos, encargados de transportar oxígeno, habían aumentado 42 por ciento. Había descubierto que el cuerpo humano tenía un poder misterioso: cuando necesita tener más de estas células fundamentales, puede fabricarlas según las requiera.

A principios del siglo XX, los científicos plantearon la teoría de que la causa de ese fenómeno era una hormona, a la que llamaron eritropoyetina: “productora de glóbulos rojos”. Siete décadas después, los investigadores descubrieron la verdadera eritropoyetina después de filtrar 2536 litros de orina.

Y cerca de 50 años después de eso, biólogos de Israel anunciaron que habían encontrado una célula renal poco común que fabrica esa hormona cuando el oxígeno desciende demasiado. La nombraron célula Norn en honor a las deidades nórdicas que controlaban el destino de la humanidad.

Los seres humanos tardaron 134 años en descubrir las células Norn. El verano pasado, unas computadoras en California las descubrieron en solo seis semanas.

El descubrimiento ocurrió cuando los científicos de la Universidad de Stanford programaron las computadoras para que ellas mismas se enseñaran biología. Estas computadoras ejecutaban un programa de IA parecido al ChatGPT, pero los investigadores entrenaron sus computadoras con datos sin procesar acerca de millones de células reales y su composición química y genética.

No les dijeron a las computadoras lo que significaban estas mediciones; tampoco les explicaron que los diferentes tipos de células tienen distintos perfiles bioquímicos. No definieron, por ejemplo, qué células captan la luz en nuestros ojos, ni cuáles fabrican anticuerpos.

Las computadoras desentrañaron los datos por sí mismas y crearon un modelo de todas las células con base en el parecido de unas con otras en un espacio enorme y multidimensional. Cuando las máquinas terminaron, ya habían aprendido muchísimo. Pudieron clasificar una célula que nunca antes habían visto como una entre 1000 tipos diferentes. Una de ellas fue la célula Norn.

Eso fue extraordinario porque nunca nadie le dijo al modelo que las células Norn estaban en el riñón..

Este software es uno de los muchos programas nuevos impulsados por la IA que se conocen como modelos fundacionales de la biología. Estos no solo están ordenando la información que los biólogos recaban, sino que están realizando descubrimientos sobre cómo funcionan los genes y cómo se desarrollan las células.

A medida que aumenten los modelos, con cada vez más datos de laboratorio y capacidad informática, los científicos comenzarán a realizar descubrimientos más profundos. Es posible que descubran secretos sobre el cáncer y otras enfermedades y podrían idear recetas para convertir un tipo de célula en otro.

Qué tan lejos se llegará sigue siendo un tema de debate. Aunque algunas personas escépticas creen que los modelos llegarán a su tope, los científicos más optimistas piensan que los modelos fundacionales abordarán incluso la pregunta más grande de la biología: ¿Qué separa la vida de lo que no es vida?

 

Desde hace mucho tiempo, los biólogos han querido entender la manera en que las diferentes células del cuerpo usan los genes para hacer muchas cosas que necesitamos con el fin de mantenernos vivos.

Hace aproximadamente una década, los investigadores comenzaron a realizar experimentos a escala industrial para buscar fragmentos genéticos procedentes de células individuales. Los científicos registraron lo que hallaron en catálogos o “atlas celulares”, los cuales se llenaron de miles de millones de datos.

Christina Theodoris, una médico de Boston, estaba leyendo acerca de un nuevo modelo de IA fabricado en 2017 para traducciones lingüísticas. Los investigadores alimentaron el modelo con millones de oraciones en inglés, junto con sus traducciones al alemán y al francés. El modelo desarrolló la capacidad de traducir oraciones que nunca antes había visto. Theodoris se preguntó si un modelo similar podría aprender a interpretar los datos de los atlas celulares.

En 2021, no podía encontrar un laboratorio que le permitiera tratar de construir uno. Había mucho escepticismo acerca de que este método funcionara.

Shirley Liu, una bióloga computacional de Boston, le dio su oportunidad. Theodoris extrajo datos de 106 estudios en seres humanos que habían sido publicados, los que incluían 30 millones de células e introdujo todo en un programa llamado GeneFormer.

El modelo alcanzó un conocimiento profundo de la manera en que se comportan nuestros genes en las diferentes células. Por ejemplo, predijo que apagar un gen llamado TEAD4 en un cierto tipo de célula cardiaca la afectaría de manera considerable. Cuando su equipo puso a prueba esta predicción en células reales llamadas cardiomiocitos, la pulsación de las células cardiacas se debilitó.

En otra prueba, Theodoris y sus colegas le mostraron a GeneFormer células del corazón tanto de personas con ritmos cardiacos deficientes como de personas sanas. “Luego le pedimos que nos dijera qué modificaciones hay que hacerles a las células enfermas para poder sanarlas”, explicó Theodoris.

GeneFormer recomendó disminuir la actividad de cuatro genes que nunca antes se habían asociado con cardiopatías. El equipo del médico siguió el consejo del modelo y eliminó cada uno de los cuatro genes. En dos de los cuatro casos, el tratamiento mejoró cómo las células se contraían.

La Universidad de Stanford comenzó con los modelos fundacionales después de ayudar a construir una de las bases de datos de células más grandes del mundo, conocida como CellXGene. Los investigadores entrenaron a sus computadoras con 33 millones de células de esa base de datos y se concentraron en un tipo de información genética llamada ARN mensajero. También alimentaron el modelo con estructuras tridimensionales de proteínas, que son el producto de los genes.

Las computadoras aprendieron a clasificar más de mil tipos de células basándose en cómo se activan y desactivan sus genes.



A partir de estos datos, el modelo UCE (integración celular universal), calculó la similitud entre las células y las agrupó en más de 1000 grupos de acuerdo con la manera en que usaban sus genes. Los grupos correspondían a tipos de células descubiertas por varias generaciones de biólogos.

El UCE también se enseñó a sí mismo algunas cosas importantes sobre cómo las células se desarrollan a partir de un solo óvulo fecundado. Por ejemplo, el modelo reconoció que todas las células del cuerpo pueden agruparse dependiendo de cuál de las tres capas salieron en la fase inicial del embrión.

El modelo también fue capaz de transferir su conocimiento a nuevas especies. Cuando se le proporcionó el perfil genético de las células procedentes de un animal que nunca antes había visto (por ejemplo, una rata topo desnuda), el UCE pudo identificar muchos de sus tipos de células.

“Se puede traer un organismo totalmente nuevo (pollo, rana, pez, o lo que sea), introducirlo y obtener algo útil de eso”.

Después de que el UCE descubrió las células Norn, Leskovec y sus colegas ingresaron a la base de datos CellXGene para ver de dónde habían venido. Aunque muchas de las células habían provenido de los riñones, algunas procedían de los pulmones y de otros órganos. Los investigadores especularon que era posible que células Norn antes desconocidas estuvieran esparcidas por todo el cuerpo.

Katalin Susztak, una médico de Pensilvania que estudia las células Norn, mencionó que el hallazgo despertó su curiosidad. “Quiero revisar esas células”, dijo.

Susztak no cree que el modelo haya encontrado células Norn verdaderas afuera de los riñones porque no se ha encontrado la hormona eritropoyetina en otros lugares. Pero las nuevas células podían sentir el oxígeno como lo hacen las células Norn.

En otras palabras, es posible que el UCE haya descubierto un nuevo tipo de célula antes que los biólogos.

 

Al igual que ChatGPT, los modelos biológicos también se equivocan. Hace poco, Kasia Kedzierska, una bióloga de Oxford, y sus colegas les dieron a GeneFormer y a otro modelo fundacional, el scGPT, una serie de pruebas. Les presentaron atlas celulares que nunca habían visto y los hicieron clasificar las células en tipos. Los modelos hicieron bien algunas tareas, pero en otros casos tuvieron un mal desempeño en comparación con programas computacionales más simples.

Kedzierska comentó que tenía mucha esperanza en los modelos, pero advirtió que, por el momento, “no deben usarse sin que se tenga un conocimiento adecuado de sus limitaciones”.

Leskovec mencionó que los modelos estaban mejorando a medida que los científicos los entrenaban con más datos. Pero en comparación con el entrenamiento que recibió el ChatGPT con datos de todo el internet, los últimos atlas celulares solo brindan una cantidad reducida de información.

A medida que atlas celulares más grandes lleguen a internet, habrá más células. Además, los científicos están recolectando diferentes tipos de datos de cada una de las células de esos atlas. Algunos científicos están clasificando las moléculas que se adhieren a las células o tomando fotografías de las células para ilustrar la ubicación precisa de sus proteínas. Toda esa información permitirá que los modelos fundacionales saquen conclusiones acerca de qué hace que las células funcionen.

Los científicos también están desarrollando herramientas que permitan que los modelos combinen lo que están aprendiendo con lo que han descubierto los biólogos de carne y hueso. La idea sería relacionar los hallazgos de miles de artículos científicos publicados con las bases de datos de las mediciones de células.

Los científicos afirman que con datos suficientes y capacidad informática es posible que con tiempo generen una representación matemática completa de la célula.

Quake sospecha que los modelos fundacionales no solo aprenderán sobre los tipos de células que habitan actualmente en nuestro cuerpo, sino también sobre el tipo de células que podrían existir. El experto especula que solo algunas combinaciones bioquímicas pueden mantener una célula viva y sueña con usar los modelos para hacer un mapa que muestre el ámbito de lo posible, más allá del cual la vida no puede existir.

“Creo que estos modelos nos ayudarán a llegar a un entendimiento fundamental de la célula, lo que nos dará una idea de lo que es realmente la vida”.

Tener un mapa de lo que es posible e imposible para sustentar la vida quizá también signifique que los científicos puedan, de hecho, generar células nuevas que no existen en la naturaleza. El modelo fundacional podría ser capaz de elaborar recetas químicas que transformen las células comunes y corrientes en células nuevas y extraordinarias. Esas nuevas células podrían engullir la placa de los vasos sanguíneos o explorar un órgano enfermo e informarnos sobre su gravedad”.

“Es como un gran Viaje fantástico”, reconoció Quake. “Pero quién sabe lo que nos deparará el futuro”.

 

 

 

Personalmente, creo que la incursión de la IA en el mundo de la biología recién está dando sus primeros pasos y, a la luz de ellos, sus resultados son absolutamente impredecibles, tanto en su alcance como en su magnitud.

Reducir el tiempo requerido para llegar a una conclusión sobre una investigación celular, de 134 años a solo seis semanas, es un primer indicador de esa increíble potencia que estamos comenzando a percibir.

Por primera vez en la historia disponemos de la tecnología de información y de la capacidad de almacenamiento para correlacionar y extraer conclusiones verificables sobre los comportamientos de los cien billones de células que existen en nuestros cuerpos, y todo ellos con asombrosa rapidez.

La irrupción de la computación cuántica habrá de acelerar aún más estos procesos, llevándolos a una escala logarítmica en cuanto a sus procesamientos.

El perfeccionamiento de los modelos fundacionales utilizados en estos análisis, también contribuirán a una mayor eficacia en cuanto a los resultados obtenidos.

Tengo el firme convencimiento de que este es el único camino por el que algún día podremos comprender y superar ese viejo estigma que pende sobre la humanidad: el origen, formación y propagación del cáncer.

Dios quiera que no esté equivocado.  

0 comentarios

Comments


bottom of page