IA descifra el lenguaje secreto de la agregación de proteínas

Científicos del Instituto de Bioingeniería de Cataluña y del Centro de Regulación Genómica han desarrollado una nueva herramienta de Inteligencia Artificial que permite predecir cuándo y por qué tiene lugar la agregación de proteínas, un mecanismo vinculado al alzhéimer y otras 50 enfermedades.

El avance podrá utilizarse en la investigación en enfermedades neurodegenerativas y la mejora de la producción de fármacos. A diferencia de otros modelos de IA de ‘caja negra’, CANYA puede explicar sus decisiones. De hecho, reveló patrones químicos específicos que impulsan o previenen la agregación dañina de las proteínas.

El descubrimiento, publicado en la revista científica, ofrece nuevos conocimientos sobre los mecanismos moleculares que causan esta unión, que está relacionada con enfermedades que afectan a 500 millones de personas en todo el mundo.

La aglomeración de proteínas, o también denominada agregación amiloide, es un peligro para la salud que altera la función normal de las células. Cuando ciertas partes de las proteínas se adhieren entre sí, se convierten en masas densas y fibrosas que pueden llevar a problemas de salud.

Aunque el estudio tiene implicaciones para la investigación de enfermedades neurodegenerativas, su impacto más inmediato será en la biotecnología, ya que muchos fármacos son proteínas y, a menudo, su función se ve obstaculizada por uniones no deseadas.

«La agregación de proteínas es un gran dolor de cabeza para las compañías farmacéuticas», afirmó la coautora principal del estudio y líder de grupo en el Instituto de Bioingeniería de Cataluña (IBEC), Benedetta Bolognesi.

«Si una proteína terapéutica comienza a agregarse, los lotes de fabricación pueden fallar, lo que cuesta tiempo y dinero. CANYA puede ayudar a guiar los esfuerzos para diseñar anticuerpos y enzimas que tengan menos probabilidades de juntarse y reducir los contratiempos en el proceso», añadió.

Las agregaciones proteicas se forman mediante un lenguaje poco conocido. Las proteínas están creadas por veinte tipos diferentes de aminoácidos. En lugar de las habituales letras A, C, G, T que componen el lenguaje del ADN, el lenguaje de una proteína tiene veinte letras diferentes, cuyas combinaciones forman ‘palabras’ o ‘motivos’.

«Este proyecto es un gran ejemplo de cómo la combinación de la generación de datos a gran escala con la IA puede acelerar la investigación. También se trata de un método muy rentable para generar datos», aseveró el profesor de investigación ICREA Ben Lehner, coautor principal del estudio y jefe de grupo en el CRG y el Instituto Wellcome Sanger.

«Usando la síntesis y secuenciación de ADN, podemos realizar cientos de miles de experimentos en un solo tubo, generando los datos que necesitamos para entrenar modelos de IA. Este es un enfoque que estamos aplicando a muchos problemas difíciles de la biología, con el objetivo de que esta sea predecible y programable», manifestó Lehner.

Fuente: SINC

VTV/DR/CP