jueves, agosto 30, 2012

Visita al NCBI

National Geographic

Trabajar en National Geographic en Washington DC fue una gran experiencia. Tanto por NatGeo como por la posibilidad de programar en Python. Eso solo hubiese bastado para que este viaje sea memorable.
Escribo esto camino a Miami desde Baltimore, al menos ahí lo empiezo.
Cuando creía que no podia tener mas suerte, me enteré que el día después que terminaba mi asignación en National Geographic en DC, había un workshop de bioinformática en el NCBI (en Bethesda, que queda a muy pocos km de DC). 


¿Qué es el NCBI?

La sigla significa Centro Nacional de Información Biotecnologica, es una institución que depende de la Biblioteca Nacional de Medicina y se encarga de proveer información indispensable para quienes trabajan en el área de biotecnología, bioinformática, genética y también medicina. La información que proveen es muy variada, pero básicamente es lo que se llama información genética: Secuencia de ADN, ARN, proteínas e información médica y bibliográfica. Si quiero saber el código genético de codifica la tirosina kinasa de la bacteria E. coli, lo voy a buscar en la base de datos genómica del NCBI (Genbank). Si quiero conocer la estructura tridimensional de dicha proteína, la buscaré en algunas de las bases de proteínas del NCBI. Prácticamente toda la información genética publicamente disponible esta en sus bases de datos. Es tan importante que para cualquier publicación (paper) que se refiera a una secuencia genética, el autor debe consignar el ID de dicha secuencia en Genbank, PIR, PDB o la base que corresponda. Por ejemplo cuando trabaje para el INTA en la secuenciación del genoma mitocondrial del tomate, parte de mi trabajo consistió en submitir lo que teniamos secuenciado hasta el momento (Genbank ID FI277973.1).
Otra función del NCBI además de mantener estas bases de datos, es proveer herramientas para hacer análisis de dichos datos. Herramientas de visualización de genes en los distintos genomas, de busca de similitudes entre genes y proteínas de distintas especies como su relación con la literatura biomédica y mucho mas. Proveer estos servicios es tan vital a los investigadores como proveer los datos. Si bien existen muchas herramientas de tipo para correr de manera local en muchos casos es muy difícil por el volumen de datos que habría que bajar y por el tipo de máquina que habría que tener para procesar tanta información. Esta gente ha hecho que los investigadores en ciencias biomédicas usen de manera cotidiana "la nube" antes que se llame de esa manera (paro de escribir porque está bajando y esto se esta moviendo mucho y le erro a las teclas) . Ahora sigo desde el vuelo Miami-Buenos Aires.

El NCBI y yo.

Hasta aca que significa el NCBI, ahora viene lo que significa el NCBI para mi.  Como especialista en bioinformática vengo usando los servicios del NCBI desde hace mas de 10 años, principalmente BLAST y Pubmed. Justamente por deficiencias del BLAST de ese momento fue que decidí hacer DNALinux en el 2004 (especialmente la edición server). En mis trabajos anteriores en Advanta semillas y en el INTA usé de manera constante los servicios del NCBI. Creo que a esta altura debe quedar claro la influencia de ese sitio en mi vida profesional. No podía perderme la oportunidad de ir a ese workshop y conocer la tanto el lugar como la gente involucrada (algunos de los cuales ya conocía por mail o por twitter). El programa del workshop era interesante ya que tocaba temas como BLAST y bases de datos.
Pedí permiso a Globant para quedarme esos días y cambiar el boleto de vuelta. No estaba seguro si me iban a autorizar, pero tenía confianza porque sé que están interesados en tecnologías de punta como es la bioinformática. Tal como pensaba, en Globant valoraron la oportunidad y me autorizaronn a ir.

Sabiendo que era un edificio federal, el día anterior miré en la página web cuales eran los requisitos para ingresar, y dice textualmente "Visitors will be required to show one (1) form of identification (a government-issued photo ID-driver's license, passport, green card, etc.) and to state the purpose of their visit.". Por lo tanto llevé mi DNI tarjeta que es un “a government-issued photo ID”, También tuitié anunciando la buena noticia. Esa misma noche me responde el tuit Chris Lasher, investigador del NCBI diciendo que el estará ahi y que nos podriamos reunir.

403

Llegué bien a tiempo, y presenté mi documento en la entrada del NIH (el equivalente a nuestro Ministerio de Salud). Para la gente de ingreso y para el policía que consultaron, mi DNI tarjeta no califica como un government-issued photo ID, sino que tiene que ser un permiso de conducir o un pasaporte, y yo había dejado ambos documentos en el departamento. Asi que eran las 9AM  y yo sin poder entrar. Volver al depto en Arlington, Virginia desde Bethesda, Maryland significaba perder entre 2 o 3 horas. Así que fui a mesa de entradas a quejarme y a ver como podia hacer, y no habia manera, a menos que me autorice alguien de adentro. Fue ahi cuando me acordé del tuit de Chris Lasher. Asi que le dije ese nombre, me dio el interno para que lo llame y asi pude explicarle la situación para que me autorice, a todo esto eran las 10AM, por lo que pude entrar y llegar a tiempo al comienzo de la clase, que si bien estaba pautada para las 9 se retrasó porque hubo que setear las PCs del resto (yo ya traía todo listo).


DSC01433 DSC01506 DSC01502


El lugar donde se daba el curso (Lister Hill Center Auditorium) es impresionante.  Es como un auditorio estilo aula magna pero limpia y moderna, cada lugar tenía luz, enchufe, parlante y microfono. Me parece un escenario ideal para una reunión internacional de científicos durante una emergencia por una epidemia. 

DSC01503 DSC01416


El workshop

El programa incluía un walktrought por los servicios del NCB. Como tenía alguna experiencia, la parte introductoria se me hizo aburrida pero del resto de los temas aprendí cosas interesantes. Por ejemplo la existencia de la herramienta Genome Workbench, que permite visualizar y analizar secuencias genéticas y está disponible para los 3 OS mas usados. En resumen lo visto fue:
  • Bases de datos del NCBI y servicio ENTREZ: Se trató de una introducción a los tipos de datos que se guardan como a las distintas bases usadas, mostrando diferencias y como están relacionadas. Formalizar estos conocimientos me sirvió mucho porque había temas de los que tenía una idea intuitiva (bastante aproximada) y algunos errores conceptuales.
  • Dominios de proteínas: Como está sistematizada la información sobre la estructura proteica, esta es la parte que menos me gustó, pese a que estaba bien presentada y hasta aprendí cosas, pero como nunca me especialicé en proteínas no lo pude aprovechar del todo.
  • NCBI BLAST: La herramienta mas popular del NCBI, el programa que permite comparar una secuencia (de DNA o proteína) con una base de datos de uno o varios organismos. Si bien es uno de los temas que mas domino, también es donde mas información útil saqué, especialmente sobre detalles de la implementación y setup particular que ellos están usando. Por otra parte la GUI de BLAST ha evolucionado mucho, a tal punto de dejar obsoletas algunas ideas mias para mejorarla.
  • Variaciones en genes humanos: Pequeñas variaciones en las secuencias, tanto en regiones codificantes como no codificantes pueden producir cambios fenotípicos importantes. Estas variaciones y sus cambios asociados están registrados en varias bases específicas, como OMIM, dbSNP y UniGene. Por lejos está es la parte mas compleja del curso
Fue muy jugosa la sección de preguntas donde me pude enterar de algunos mecanismos internos de los servicios del NCBI. También fui de tour por el NCBI y ví la sala de servidores, que es muy impresionante, pero lamentablemente había un cartel que decia que no se podía sacar fotos. Con lo que vi y el material que me dieron puedo organizar una charla en Globant para presentar los servicios del NCBI.

Conclusiones:

Por un lado queda confirmado que los americanos no entienden nada sobre documentación (valorizan mas un carné de conducir que un DNI).

La gente del NCBI sabe lo que hace.

Tuitear te puede salvar el día.