Español | English
rss facebook linkedin Twitter

Hackeando la gripe A

Hackeando la gripe A

En plena fiebre de la gripe A, leí un artículo escrito por Andrew «bunny» Huang
estudiante del MIT que pasó a ser mundialmente conocido por ser la primera persona en conseguir hackear la consola XBox de Microsoft y por la posterior publicación del paper Keeping Secrets in Hardware: the Microsoft XBoxTM Case Study en el que detallaba cómo consiguió «romper» el criptosistema hardware de la consola que me llamó mucho la atención por lo audaz de la reflexión y por las consecuencias que podría tener en el futuro lo que en él se planteaba.

Dado que el artículo original no tiene desperdicio, creo que sería imposible hacer un resumen del mismo sin una pérdida importante de información, así que, me he tomado la libertad de hacer una traducción más o menos libre del mismo que copio a continuación.



Sobre la gripe A (H1N1)


He leído un artículo fantástico en la revista Nature (vol. 59, pags. 931-939, publicado el 18 de junio de 2009) que resumía, no solo el estado actual en cuanto a conocimiento se refiere de la novedosa H1N1 —también conocida como «gripe porcina»— sino que, además, compara el virus H1N1 con otras cepas de gripe; en particular, describe en profundidad cómo los componentes patógenos —es decir, la parte que puede llegar matarnos— difieren entre si.

El virus de la gripe es realmente fascinante. Permitidme que me explaye un poco sobre él...

Comparación con los virus informáticos

¿Cuantos bits hacen falta para matar a un ser humano?

El virus H1N1 ha sido «desensamblado» (secuenciado) completamente y su «código» se encuentra disponible en la Base de Datos de Virus de la Gripe del NCBI (Centro Nacional de Información Biotecnológica). Por ejemplo, la secuencia completa de una muestra de gripe conocida como A/Italy/49/2009(H1N1) aislada de un homo sapiens femenino de 26 años que regresaba desde los EE.UU. de América a Italia (me encanta la precisión de los registros de esta base de datos), está disponible en la página web del NCBI; es sorprendente.

Estos son los primeros 120 bits de la secuencia:
atgaaggcaa tactagtagt tctgctatat acatttgcaa ccgcaaatgc agacacatta
Recordemos que cada símbolo representa 2 bits de información. Esta cadena se puede representar también como una secuencia de aminoácidos —a través de lo que, en informática, se conoce como tabla de lookup— en los siguientes péptidos:
MKAILVVLLYTFATANADTL
En este caso, cada símbolo representa un aminoácido que equivaldría a 6 bits (serían 3 codones de ARNm por aminoácido). En este «alfabeto», M sería Metionina, K Lisina, A Alanina, etc. (podéis encontrar la tabla de equivalencias aquí)

Para aquellos que no estén familiarizados con la biología molecular, el ADN tiene una equivalencia con el ARN en una relación uno a uno; el ADN, sería el equivalente al programa en disco, y, el ARN, sería la copia en memoria del mismo. Tras la «carga» del ADN, se produce una transcripción mediante la cual, las bases «T», se transforman en bases «U» (Uracilo). Recordad: cada par de bases representa uno de los cuatro posibles símbolos, es decir: A, T/U, G y C por lo que, cada una, se corresponde con 2 bits de información.

La proteínas son el resultado de la ejecución de un «programa» ARN. Estas, se sintetizan a partir de las instrucciones de ARN a través de una correspondencia «tres a uno». Como símil, podemos considerar las proteínas como pixels en un frame-buffer. Una proteína, vendría a ser una imagen completa en la pantalla; cada aminoácido de la proteína, sería un pixel y, cada uno de estos, tendría una profundidad de seis bits (correspondencia 3 a 1 empleando un «soporte» que almacena 2 bits por cada par de bases) y, el color de cada pixel, se obtendría tras realizar una búsqueda en una paleta de colores (la tabla de traducción de codones) para, finalmente, ser renderizado en la pantalla. A diferencia del típico frame-buffer, las distintas proteínas varían en cuanto al número de aminoácidos (número de pixels).

Para asentar esto, veamos un ejemplo concreto: seis bits almacenados como «ATG» en el disco duro (ADN) se cargan en memoria (ARN) como «AUG» (recordad el caso especial de la transcripción T→U). La «ejecución» del programa RNA provoca la transformación de la secuencia «AUG» en un pixel (aminoácido) de «color» «M» o Metionina (que, biológicamente, es el codón de «inicio», es decir, es la primera «instrucción» de cualquier programa ARN válido). Para abreviar, y dado que existe una equivalencia 1:1 entre ADN y ARN, los bioinformáticos representan las secuencias genéticas en el formato del ADN a pesar de que, el mecanismo biológico, esté en formato ARN (tal y como ocurre con la gripe; veremos la importancia de esto más adelante).

Volviendo a la idea central del artículo, la subrutina ARN mostrada arriba, representa el gen HA que codifica la proteína Hemaglutinina, en particular, la variante H1 (este sería el origen del «H1» de la denominación de la ya famosa gripe H1N1)

Si pensásemos en los organismos como ordenadores con direcciones IP, cada grupo funcional de células del organismo estaría «escuchando» el entorno a través de su propio puerto. Así, al igual que el puerto 25 se corresponde con los servicios SMTP de un ordenador, el puerto H1 se corresponde con la la región de la traquea en los humanos. Como curiosidad, ese mismo puerto —el H1— se corresponde con la sección del tracto intestinal en los pájaros. Por tanto, el virus H1N1 atacaría al sistema respiratorio en un humano y el intestino de un pájaro. Por contra, el H5 —la variedad presente en el virus H5N1, causante de la mortífera «gripe aviar»— tiene como «puerto» la región que se corresponde con los pulmones. Como resultado, la variante H5N1 es mucho más mortífera porque ataca al tejido pulmonar provocando graves pulmonías. El H1N1 no es tan mortífero ya que se limita a atacar un puerto mucho menos peligroso provocando congestión nasal, y estornudos en vez del cese de la respiración.

Los investigadores siguen descubriendo más cosas acerca del puerto H5; el artículo de Nature indica que, quizás, ciertas personas tengan una mutación genética que impida que sus pulmones «escuchen» en el puerto H5 por lo que, los individuos que tuviesen dicha mutación, tendrían una mayor probabilidad de sobrevivir ante una infección por gripe aviar mientras que, aquellos de nosotros que tuviéramos abierto el puerto H5 tendríamos menos oportunidades de sobrevivir lo cual se podría expresar como "al your base pairs are belong to H5N1".

Así que, ¿cuantos bits tiene una instancia de H1N1? Según mis cálculos, en bruto, serían 26.022; realmente habría 25.054 bits codificadores —y digo aproximadamente porque, el virus, posee el equivalente a código auto-modificable con el fín de secuenciar dos proteínas distintas a partir del mismo gen (una característica muy interesante, por cierto), por tanto, es difícil identificar qué contaría como código y qué sería equivalente a los NOP sleds típicamente utilizados cuando se escribe código auto-modificable—

Por tanto, hacen falta unos 25 kilobits —3,2 kbytes— de datos para programar un virus que posea ciertas oportunidades de matar a un ser humano. Es bastante más eficiente que un virus de ordenador como el MyDoom que precisa de unos 22 kbytes para realizar su «trabajo».

Es humillante que hagan falta apenas 3,2 Kb de información genética, para matarnos. Supongo que, con 850 Mbytes de información genética en nuestro genoma, entra dentro de lo posible que haya uno o dos exploits en él.

Hackeando la gripe porcina

Una consecuencia interesante de haber leido el artículo de Nature y tener acceso a la secuencia del virus es que, ahora, sé como modificar la secuencia del virus para hacerlo más mortífero.

Sería así:

El artículo de Nature menciona, por ejemplo, que las variantes del gen PB2 de la gripe con un aminoácido de tipo Glutámico en la posición 627 de la secuencia, tienen una patogenicidad bastante baja (no son especialmente mortíferos). Sin embargo, las variantes PB2 con Lisina en esa misma posición, son más peligrosas. Veamos, por tanto, la secuencia del PB2 de la variante H1N1. Buscando en la base de datos del NCBI nos encontramos:

601 QQMRDVLGTFDTVQIIKLLP
621 FAAAPPEQSRMQFSSLTVNV
641 RGSGLRILVRGNSPVFNYNK

Tal y como se puede ver en la anotación de arriba, en la posición 627 hay una E que es la representación del ácido Glutámico. Por suerte, se trata de la versión menos mortífera; quizás es la razón por la que, al final, en contra de los malos augurios pronosticados por los medios, no está habiendo tantos casos de fallecimiento por gripe A. Transformemos el código de arriba en código de ADN:

621 F A A A P P E Q S R
1861 tttgctgctg ctccaccaga acagagtagg

tal y como se puede ver, la secuencia «GAA» es la responsable de la codificación de «E» (ácido Glutámico); para modificar esta secuencia genética —y hacerla más peligrosa— simplemente hay que reemplazar la secuencia «GAA» por alguna de las codificaciones de la Lisina («K») que se puede expresar o bien como «AAA» como por «AAG». Por tanto, una variante más mortífera de H1N1 tendría una secuencia genética como la siguiente:

621 F A A A P P K Q S R
1861 tttgctgctg ctccaccaaa acagagtagg
^ changed

Ahí está. Un simple cambio en una de las bases —modificar dos bits— sería quizás suficiente para transformar la variante actual de gripe porcina H1N1, relativamente inofensiva, en una variante del virus de la gripe más peligroso.

Teóricamente podría aplicar una larga serie de procesos biológicos bien conocidos para sintetizar esta secuencia e implementar esta variante más mortífera; como primer paso, podría ir a cualquiera de las muchas páginas web de empresas dedicadas a la síntesis de ADN (como, por ejemplo, a esta llamada «Mr. Gene») y pedir la secuencia modificada para completar mi pequeño y mortífero proyecto por algo menos de $1.000. Hay que tener en cuenta, sin embargo, que Mr. Gene, dispone de un proceso de supervisión para evitar la síntesis de secuencias de ADN que pudieran ser utilizadas para crear productos biológicamente peligrosos. No sé si monitorizarán específicamente variantes de HA como este gen de H1 pero, incluso si lo hicieran, existen procedimientos bien conocidos para producir mutaciones dirigidas que, posiblemente, podrían ser utilizadas para alterar una única base de ARN obtenido de una muestra de la variante normal de H1N1.

[Nota: acabo de darme cuenta de la existencia de esta cita en el artículo de Nature: Neumann, G. et al Generation of influenza A viruses entirely from cloned cDNA. Proc. Natl Acad. Sci. USA 96, 9345-9350 (1999). Este artículo explica como fabricar tu propio virus de la gripe A. Una lectura interesante.]

Gripe adaptable

Antes de que alguien se pueda sentir insultado por este pequeño hack, démosle a la gripe el respeto que se merece; después de todo, es capaz de matar con apenas 3,2 Kbytes de información y, a pesar de todos nuestros esfuerzos, no somos capaces de erradicarla. Realmente ¿sería capaz la gripe de averiguar esto por sus propios medios?

La respuesta sencilla sería sí.

De hecho, el virus de la gripe, ha evolucionado para permitir este tipo de adaptaciones. Normalmente, cuando se realiza una copia del ADN, una proteína de «detección de errores» es ejecutada sobre el genoma copiado para verificar que no se ha cometido ningún error. Esto mantiene la tasa de errores bastante baja pero, dado que la gripe utiliza una arquitectura basada en el ARN, necesita un mecanismo distinto al del ADN para realizar las copias.

Resulta que la gripe contiene dentro de su cápsula vírica un complejo protéico (Polimerasa Del ARN ARN-Dependiente) que está ajustada a su estilo de copia basado en ARN y que, de forma significativa, omite la proteína de detección de errores. El resultado, es que se suele cometer un error por cada 10.000 pares de bases copiadas. ¿Y cuantas bases contiene el genoma de la gripe? pues, unas 13.000 por lo que, de media, cada copia del virus de la gripe contiene una mutación.

Algunas de estas mutaciones no suponen ninguna diferencia; otras, transforman el virus en algo inocuo; y, probablemente, muchas, transforman el virus en algo mucho más peligroso. Dado que los virus se replican y distribuyen en cantidades astronómicas, la probabilidad de que este pequeño hack pueda terminar ocurriendo de forma natural es, de hecho, bastante alta. Esta podría ser, en parte, la razón por la que las autoridades sanitarias están tan preocupadas por el H1N1: no tenemos defensas contra ella y, aunque a día de hoy no es demasiado peligrosa, probablemente está a un par de mutaciones de transoformarse en un problema mucho más grave de salud pública.

De hecho, quizás debería estar intentando coger la cepa de la gripe H1N1 actual ya que, su peligrosidad, actualmente, está en la linea de la gripe normal —según escribía este artículo, el centro de control de enfermedades, ha contabilizado 87 víctimas de 21.449 casos confirmados o, un 0.4% de mortalidad (por contra, la gripe normal tiene una tasa de mortalidad inferior al 0.1% mientras que la famosa gripe Española, tuvo un índice de mortaildad del 2,5%; la gripe Aviar o H5N1 está ¡por encima del 50%! pero, por suerte, tiene dificultades para propagarse entre humanos). Contrayendo a día de hoy la variante H1N1 tendría la ventaja de desarrollar una inmunidad natural por lo que, si posteriormente, mutara y volviese de nuevo, tendría mayores oportunidades de luchar contra ella aplicando el famoso refrán de que «lo que no te mata, te hace más fuerte» ... bueno, quizás sería mejor esperar a que se desarrolle una vacuna.

Hay otra pequeña pero importante particularidad en el diseño de la arquitectura basada en RNA del virus de la gripe —aparte de la perfectamente ajustada frecuencia de mutación que demuestra— esta particularidad, consiste en que, la información genética, está almacenada dentro del virus como 8 pequeños fragmentos de ARN en vez de en una simple hebra (tal y como aparece en otros muchos virus y en las células). ¿Por qué es importante esto?

Veamos qué ocurre cuando un paciente sufre la infección simultanea de dos tipos de gripe. Si los genes estuviesen almacenados en una única cadena de ADN habría pocas posibilidades de que se produjera un intercambio de genes; sin embargo, dado que la gripe almacena sus genes en ocho partes bien diferenciadas, los bloques pueden combinarse libremente dentro de la célula infectada y son transformados de forma aleatoria en nuevas cepas según van replicándose. Por tanto, si uno tiene la mala suerte de coger simultaneamente dos variantes de la gripe, el resultado es —potencialmente—, una nueva variante de gripe según el ARN es copiado, mezclado y seleccionado de un metafórico sombrero y es, posteriormente, encapsulado en partículas virales. El proceso es elegante en cuanto a que, el mismo mecanismo, permite la mezcla de un número arbitrario de cepas en un solo individuo cuyo resultado es una mayor variación todavía en las partículas gripales.

En parte, esta es la razón por la que el H1N1 es llamado un virus triplemente-recombinante: ya sea mediante una serie de infecciones duales o, quizás, una desastrosa infección de múltiples variedades de gripe, la nueva H1N1 ha adquirido una mezcla de fragmentos de ARN que ha perfeccionado más aún, si cabe, su velocidad de propagación que, junto a la vulnerabilidad innata que sufre la humanidad frente al virus, supone la confluencia perfecta de factores para que se desencadene una pandemia.

No he estado siguiendo los últimos movimientos por parte de los creadores de virus de ordenador pero, si existiese una equivalencia a este modelo de intercambio de ARN, sería la de un virus que se distribuyese a si mismo como ficheros de código objeto sin enlazar junto a un pequeño programa que, tras la infección del huesped, re-enlazaría esos ficheros de una forma aleatoria antes de copiarse y distribuirse a si mismo. Aparte de hacer esto, intentaría localizar virus similares que estuvieran ya presentes en dicho ordenador y enlazaría partes de código de otros virus que se ajustasen a unas determinadas plantillas. Esta reordenación —y la novedosa técnica de re-enlazado de código— permitiría evitar la detección por parte de algunos antivirus que se basan para la detección en ciertos patrones fijos de código. Adicionalmente, provocaría la proliferación de un variado conjunto de virus que camparían a sus anchas y con comportamientos menos predecibles.

Por tanto, el virus de la gripe es notable por sus técnicas para lograr un mecanismo de adaptación multi-nivel basado tanto en la lenta evolución —en cuanto a las mutaciones se refiere—, como en la capacidad para alterar de forma drástica sus propiedades en una sola generación a través de los mecanismos de intercambio a nivel genético con otros virus (no es exáctamente como el sexo, pero es probablemente tanto o incluso más eficiente que este). Es también significativo que estas dos importantes características del virus surjan como consecuencia del uso de ARN en vez de ADN como medio de almacenamiento genético.

Bueno, ya es suficiente por esta noche, y, si habéis sido capaces de llegar hasta aquí, aprecio vuestra atención. Tiendo a irme por las ramas en mis artículos «reflexivos»; de hecho, hay más información muy interesante sobre la gripe A en el artículo de Nature. Si deseáis saber más sobre el tema, os recomiendo firmemente su lectura.



Fernando Braquehais
S21sec. e-crime

5 comentarios:

jnovonj dijo...
Este comentario ha sido eliminado por el autor.
jnovonj dijo...

Hola,

Me parece un articúlo muy bueno, mucho. Hilar la estructura de un virus "animal" con la estructuctura de un virus informático. Me parece muy bueno, incluso aunque el artículo no sea tuyo, me parece brillante que le pongas ganas y lo traduzcas.

De verdad, muy impresionado me quedo.

Si, por cierto, he llegado el final.

Alon dijo...

Buenísimo el artículo!!! La comparación con los virus informáticos es la leche.

Anónimo dijo...

Muy interesante. Gran aportación.
Gracias

Anónimo dijo...

A parte de lo friki q es... podría haberlo analizado para hacerlo MENOS mortifero!!!


(+34 902 222 521)


24 horas / 7 días a la semana



© Copyright S21sec 2013 - Todos los derechos reservados


login