Hoy, por fin, salió publicado el cuarto trabajo en el que "he colaborado" y que tantos quebraderos de cabeza me ha traído. Éste es el que más conocéis o, al menos, del que más me habéis oído hablar. Se encuentra disponible, en abierto, en esta dirección:
Os paso a resumir, un poco, de qué va el artículo. Lo que no os voy a poner son imágenes del mismo ya que las podéis consultar en la revista y, en realidad, no se si tengo o no permiso para colocarlas aquí. Si la revista tuviera licencias abiertas lo haría, pero no lo pone así que mejor no arriesgarse.
El ADN de los organismos eucariotas se organiza dentro del núcleo celular y, para caber dentro del mismo, ha de empaquetarse en cromatina en diferentes niveles. El primero de ellos lo constituye la asociación de las proteínas histónicas con la fibra de ADN, constituyendo los nucleosomas. Nosotros estamos interesados en este proceso, en la localización y dinámica de los nucleosomas en la célula.
Es por ello que realizamos mapas de ocupación de nucleosomas. Un ejemplo de éstos lo podéis ver en la figura sumplementaria 1 del artículo. En estos mapas lo que podemos observar el el nivel de ocupación de nucleosomas que tiene cada nucleótido del genoma. Dicho así puede parecer confuso pero lo que vemos en realidad es dónde están localizados los nucleosomas del genoma (picos en el mapa) y dónde faltan, regiones que denominamos NDRs.
Además podemos inferir lo bien o mal posicionados que están los nucleosomas en cada zona concreta. Así, si en una zona hay picos muy juntos y con poca diferencia entre la altura del pico y la altura de los valles que lo flanquean, consideraremos que es una zona mal posicionada (cada célula de la población utilizada para el experimento tiene los nucleosomas en un punto diferente), mientras que si aparecen picos bien definidos, espaciados regularmente a 147 pares de bases o más y con una altura considerable (1.5 o más) consideraremos que están bien posicionados ya que en la mayoría de las células de la población los nucleosomas aparecen en la misma posición.
Habiendo realizado mapas de nucleosomas de muy alta resolución para 4 especies de levaduras diferentes, en las que podíamos encontrar cerca de los 80.000 nucleosomas que deberían empaquetar sus pequeños genomas, nos preguntamos si había algo en la secuencia del ADN empaquetado por los nucleosomas que nos ayudara a averiguar por qué se ponían en esas posiciones concretas.
De esta forma seleccionamos aquellos nucleosomas mejor posicionados de cada uno de los genomas que, por tanto, serán los que presenten una señal más marcada, si es que esa señal existe, y comprobamos si tenían alguna huella que los definiera. En la Figura 1 podéis observar estas huellas. Lo que representan las gráficas es el porcentaje de aparición de cada nucleótido (Adenina, Timina, Guanina y Citosina) en cada una de las posiciones de las miles de secuencias bajo los nucleosomas bien posicionados, calculado nucleotido a nucleotido. Podéis observar cómo no es un perfil plano (como si que es el de regiones seleccionadas al azar), presenta unas zonas de preferencia para la aparición de cada una de las bases. Además estas zonas son diferentes para cada una de las especies estudiadas. Esta diferencia es más visible en las gráficas inferiores de la figura, en las que se representa el porcentaje conjunto de uso de Adenina y Timina para cada especie y se observa perfectamente las diferencias que presentan entre ellas.
Al tener una querencia tan marcada presente tanto en las regiones del genoma que codifican genes (y, por tanto, sometidas a una fuerte selección natural) como en las que no lo hacen (Figura Suplementaria 2), y mantenerla incluso al representar la frecuencia de aparición de dinucleótidos y trinucleótidos (Figuras suplementarias 4 y 5), nos preguntamos si las proteínas se verían afectadas, de alguna forma, en su composición, para respetar este patrón.
En la Figura 2 representamos la forma en la que predecimos que aparecerá cada uno de los aminoácidos en las proteínas a lo largo de los nucleosomas. Para ello simplemente calculamos el perfil que daría agregar la frecuencia de uso de todos los codones (trinucleotidos) que codifican para cada aminoácido. Se puede ver cómo si la predicción fuera cierta, los aminoácidos aparecerían en determinadas posiciones del nucleosoma con más frecuencia que en otras y que, además, estas frecuencias serían diferentes para cada especie.
En la Figura 3 comprobamos como, efectivamente, cuando comparamos la predicción con la frecuencia de aparición real de los aminoácidos en los nucleosomas que empaquetan genes, se ajustan casi a la perfección. Además, en la Figura 4 mostramos cómo no es un efecto que se vaya perdiendo a lo largo de la proteína ya que si sólo seleccionamos nucleosomas del principio, el medio o el final, para representar cómo sería un gen promedio, el efecto se reproduce a lo largo de toda la codificación.
Obviamente ésto son sólo tendencias promedio y es prácticamente imposible (o directamente imposible) ver estos efectos en nucleosomas individuales. Pero bueno, están ahí y algo querrán decir, aunque sea, simplemente, una huella que han dejado los nucleosomas al paso de la evolución.
En esencia esto es lo que quiere decir el artículo, de una manera muy resumida y tratando de simplificarlo lo más posible. Me gusta tratar de hacer tarea de divulgación, aunque sea un poquito, para acercar la ciencia al mundo real y por ello os dejo estos tostones. Espero que, por lo menos, os haya resultado interesante, o sorprendente. Si tenéis cualquier duda, sugerencia o comentario, queréis profundizar más o lo que sea, ya sabéis que tenéis los comentarios.