El Marshall Space Flight Center de la NASA ha comenzado a trabajar con IBM para utilizar la tecnología de inteligencia artificial (AI) para descubrir nuevos conocimientos en sus datos científicos geoespaciales y de la Tierra. El esfuerzo conjunto aplicará por primera vez la tecnología del modelo básico de IA a los datos del satélite de observación de la Tierra de la NASA.
Estas observaciones son utilizadas por los científicos para estudiar y monitorear la Tierra. La NASA dijo que los datos se están recopilando a tasas y volúmenes sin precedentes, por lo que necesita nuevos enfoques para extraer conocimiento de estos crecientes recursos de datos. Ambos planean desarrollar una forma más fácil para que los investigadores analicen y extraigan información de los grandes conjuntos de datos, basándose en la tecnología del modelo básico de IBM.
Según IBM, los modelos básicos son tipos de modelos de IA que se entrenan en un amplio conjunto de datos no etiquetados, se pueden usar para diferentes tareas y pueden aplicar información sobre una situación a otra. Estos modelos han avanzado rápidamente en el campo de la tecnología de procesamiento de lenguaje natural (NLP) en los últimos cinco años, e IBM es pionera en aplicaciones de modelos básicos más allá del lenguaje.
“La belleza de los modelos básicos es que pueden usarse potencialmente para muchas aplicaciones posteriores”, dijo Rahul Ramachandran, científico investigador principal del Centro Marshall de Vuelos Espaciales de la NASA en Huntsville, Alabama. “La construcción de estos modelos básicos no puede ser abordada por equipos pequeños. Necesita equipos de diferentes organizaciones para aportar sus diferentes perspectivas, recursos y conjuntos de habilidades”.
IBM y la NASA planean desarrollar varias tecnologías nuevas para extraer información de las observaciones de la Tierra. Un proyecto entrenará un modelo de base de inteligencia geoespacial de IBM en el conjunto de datos Harmonized Landset-Sentinel-2 (HLS) de la NASA, un registro de los cambios en la cobertura y el uso del suelo capturados por los satélites en órbita terrestre.
Al analizar petabytes de datos satelitales para identificar cambios en la huella geográfica de fenómenos como desastres naturales, rendimientos de cultivos cíclicos y hábitats de vida silvestre, IBM y la NASA esperan que esta tecnología de modelo base ayude a los investigadores a proporcionar un análisis crítico de los sistemas ambientales de nuestro planeta.
La NASA también trabajará con IBM para hacer que la literatura de ciencias de la Tierra sea fácil de buscar. IBM ha desarrollado un modelo de procesamiento de lenguaje natural (NLP) entrenado en casi 300.000 artículos de revistas de ciencias de la Tierra para organizar la literatura y facilitar el descubrimiento de nuevos conocimientos. Según IBM, esto representa la carga de trabajo de IA más grande entrenada en el software OpenShift de Red Hat. El modelo totalmente capacitado utiliza PrimeQA, el sistema de preguntas y respuestas multilingüe de código abierto de IBM. Más allá de proporcionar un recurso a los investigadores, el nuevo modelo de lenguaje para las ciencias de la Tierra se integrará en los procesos de gestión y administración de datos científicos de la NASA.
Otro posible proyecto conjunto IBM-NASA es la construcción de un modelo básico para la predicción del tiempo y el clima utilizando MERRA2, un conjunto de datos de observaciones atmosféricas. Esta colaboración es parte de la Iniciativa científica de código abierto de la NASA, un compromiso para construir una comunidad científica abierta inclusiva, transparente y colaborativa durante la próxima década.