BIOINFO 101: ADN, ARN y proteínas

2 minute read

La bioinformática es amplia y difícil de definir pero podemos decir a groso modo que se trata de resolver preguntas biológicas usando computadoras. En especial suele centrarse en estudiar a las moléculas, como el ADN, el ARN y las proteínas. Vamos a empezar viendo que son estas moléculas y como las podemos estudiar usando técnicas bioinformáticas. Para hacerlo más interesante voy a usar al coronavirus en los ejemplos, por lo que les puede ayudar a entender algunas noticias científicas.

Para poner esto en un marco podemos usar el esquema Arthur Lesk, que dice que somos el producto de:

  material genético + ambiente + historia de vida + epigenética

En esta oportunidad vamos a hablar fundamentalmente del material genético para no complicarnos. Éste contiene información que pasa de una generación a otra, como pueden ser el color de pelos y ojos, la altura y la predisposición a enfermedades.

bioinfo1

El ADN es el material genético en la mayoría de los organismos, excepto algunos virus. Es una cadena formada por cuatro “ladrillos” diferentes que se llaman Adenina, Citosina, Timina, y Guanina. Muchas veces los representamos solo por su inicial (A, C, T y G) para simplificar.

bioinfo2

Todas las cadenas de ADN se escriben como una combinación de estas cuatro letras. Determinar esa combinación es lo que llamamos “secuenciar”. Por ejemplo este es un pedacito de la secuencia de la hemoglobina humana:

acatttgcttctgacacaactgtgttcactagcaacctcaaacagacaccatggtgcatctgactcctgaggagaagtctgccgt

El material genético del coronavirus SARs-CoV-2 es ARN. El ARN es muy parecido al ADN pero, entre otras diferencias, en lugar de Timina (T) tiene Uracilo (U). Este es un pedacito de secuencia del coronavirus:

auguuuguuuuucuuguuuuauugccacuagucucuagucaguguguuaaucuuacaaccagaacuca

A partir de esta secuencia de ADN la maquinaria celular puede producir una proteína. En este caso el producto es la proteína “Pincho” o Spike, que tiene una secuencia de aminoácidos (los bloques que forman la proteína) que empieza así:

MFVFLVLLPLVSSQCVNLTTRTQ

Esa cadena se pliega en en el espacio debido a las interacciones entre los aminoácidos, tomando una forma tridimensional.

bioinfo3

Esas interacciones se pueden modelar. Es decir que a partir de la secuencia de aminoácidos, en la mayoría de los casos, podemos predecir la forma que tomará la proteína utilizando ecuaciones que vienen de la física clásica y la cuántica. Pero eso quedará para otra oportunidad.

La forma está íntimamente relacionada con la función. En el caso de la proteína “Pincho” esa forma es la que le permite unirse a los receptores que están en las células de nuestro cuerpo, como si fueran una llave y una cerradura.

En la imagen se ve la proteína “pincho” (en rojo) uniéndose a un receptor ACE2 (en azul).

bioinfo4

Una vez dentro de la célula el virus “se aprovecha” de ella. Tengamos en cuenta que los virus son sólo material genético con un envoltorio. Como no cuentan con maquinaria propia para producir proteínas ni para replicarse “obligan” a la célula a hacer esas tareas.

Así muy brevemente fuimos desde la secuencia hasta la función, que podríamos definir como el ABC de la bioinformática.

Referencias

  • Gonzalez, G., Uran Landaburu, L., Palopoli, N., Banchero, M., Bustamante, J. P., Lanzarotti, E., Revuelta, M. V., Teppa, E., Zea, D. J., & Stocchi, N. (2022). Vida. exe: Desafíos y aventuras de la bioinformática. Fondo de Cultura Económica Argentina.
  • Para el que se quedó con ganas de más puede ver esta alucinante nota del New York Times sobre el material genético y las proteínas del coronavirus: Bad News Wrapped in Protein. Si quieren saber más sobre plegado de proteínas, lean a mi amigo Gonza Parra

Originalmente publicado como hilo de Twitter

Leave a comment