Centros Milenio SECOS y UPWELL realizan taller “Ciencia Abierta, Análisis de Datos e Investigación Reproducible”, en la UCSC

Profundizar sobre el uso, manipulación y análisis de bases de datos y meta datos,  fue el objetivo del curso organizado por ambos centros, que se llevó a cabo el pasado  11 y 12 de agosto en la Universidad Católica de la Santísima Concepción (UCSC). La instancia liderada por investigadores UPWELL y SECOS, contó con la participación de estudiantes de postgrado y posdoctorantes de diversas casas de estudios de Concepción.

Utilizar múltiples datos con un enfoque FAIR (por sus siglas en inglés, Findability, Accessibility, Interoperability, and Reusability), aumentar su impacto y su uso abierto para otros grupos de investigación, fue uno de los objetivos del curso “Ciencia abierta, análisis de datos e investigación reproducible”, organizado conjuntamente entre el Núcleo Milenio UPWELL y el Instituto Milenio en Socio-Ecología Costera (SECOS) y dirigido a estudiantes de postgrado, doctorado y magíster, además de posdoctorantes.

El curso, se realizó los días 11 y 12 de agosto en la Universidad Católica de la Santísima Concepción en la capital penquista, en formato presencial y con clases dictadas por los investigadores jóvenes de Upwell, Matías Frugone y Carlos Lara –también investigador colaborador del SECOS–, y Álvaro Paredes, Investigador de Fundación Data Observatory. Además, participaron Marcelo Rivadeneira, investigador del Centro Científico CEAZA, y Bernardo Broitman, académico de la Universidad Adolfo Ibáñez e investigador SECOS y Upwell.

El primer día, el curso abordó la herramienta Google Earth Engine (GEE) y el potencial de cómputo de esta aplicación online, mientras que el segundo día se enfocó en repositorios de datos paleoambientales y/o paleoceanográficos (LiPID, NOAA) y su análisis, usando el software R. Así, se buscaba que los estudiantes se familiarizaran con repositorios enfocados en el intercambio de información como GitHub, Dryad, Mendely, entre otros.

«Uno de los grandes desafíos de la interdisciplina en ciencias básicas es poder utilizar diversos datos de forma FAIR (por sus siglas en inglés, Findability, Accessibility, Interoperability, and Reusability), permitiendo que los datos que generamos en nuestras investigaciones individuales puedan trascender en el tiempo, aumentando de esta forma su impacto y asegurando el buen uso de los recursos públicos que financiaron su generación”, señala Bernardo Broitman, investigador SECOS y Upwell. 

“Existe un esfuerzo emergente por parte de la ANID en impulsar los estándares FAIR en el país, de manera que este taller pone a ambos centros Milenio en la vanguardia de la ciencia interdisciplinaria del futuro próximo», añade Broitman.

Pese a que el curso fue específicamente sobre repositorios, el académico sostuvo que las técnicas analíticas enseñadas, involucran o dependen del acceso a repositorios de información online, lo que, si bien es algo bastante común en disciplinas como la oceanografía, astronomía o geología, donde constantemente se generan vastos volúmenes de información, su adopción en la arqueología, ecología o biogeoquímica es relativamente reciente.  

“El taller ha sido súper interesante, lo mejor es que nos hemos conocido con otros compañeros que trabajan en temas diferentes, pero que a la vez son muy compatibles con lo que estamos haciendo. Las herramientas que nos han entregado sobre los programas, han facilitado mucho el trabajo que, hasta ahora, se demoraba y llevaba tiempo. Con este curso aprendimos que se puede hacer con otras herramientas, de manera más fácil”, dijo Elizabeth Curra, participante del taller y doctora en Ciencias Ambientales de la Universidad de Concepción, ex becaria de doctorado del SECOS.

Por su parte, Álvaro Paredes, desarrollador Data Science de Data Observatory (DO), compartió conocimientos acerca del uso de R como herramienta de análisis y procesamiento de imágenes satelitales, donde explicó que esto es parte del trabajo realizado en el proyecto DO «Open Data Cube», junto a la agencia de investigación australiana CSIRO y UAI. “R es un lenguaje de programación similar a otros como Python y lo ocupan principalmente estadísticos, por sus cualidades de usabilidad, visualización y análisis de procesos, permitiendo extraer datos y gráficos, índices espectrales, aplicar filtros, entre otras de sus bondades», explica.


“El curso busca cultivar una comunidad de jóvenes científicos y científicas que conozcan y adopten los principios FAIR desde temprano en sus carreras, ya que gran parte de la literatura está requiriendo su uso o los van a requerir en el futuro cercano, sobre todo en los journals de mayor impacto, donde se espera que todos los datos y softwares utilizados estén disponibles junto con el manuscrito. Es más, existen journals de muy alto impacto, como Nature Scientific Data, que están dedicados a la publicación de grandes bases de datos, abriendo nuevos horizontes a las próximas generaciones de profesionales e investigadores”, finaliza Bernardo Broitman.

Finalmente, al término del taller, la estudiante de doctorado de la Universidad de Concepción y parte de SECOS, Nicole Castillo, reflexiona que “es importante aprender sobre estos repositorios de datos abiertos en línea porque la disponibilidad de estos, nos permitiría mejorar la relevancia y alcance en cuanto a la reutilización de estos datos, lo que puede propiciar que la ciencia trascienda mediante el trabajo colaborativo e interdisciplinario entre grupos de investigación”.