La integración de datos sigue siendo esencial para la IA y el aprendizaje automático

La naturaleza de la conciencia humana ha eludido hasta ahora a todos, desde los filósofos hasta los neurocientíficos. Por lo tanto, no debería sorprender que la inteligencia artificial (IA) que podemos construir actualmente se limite al reconocimiento de patrones más básicos dentro de conjuntos de datos.

Aunque los algoritmos de IA y aprendizaje automático (ML) son cada vez mejores para hacer más con menos, a menudo todavía necesitamos reunir datos de múltiples fuentes para que produzcan resultados que tengan sentido. Los humanos requieren mucha información para dar sentido al mundo, por lo que nuestros algoritmos informáticos actuales, más primitivos, seguramente necesitan mucha más.

Soy de la opinión de que hay dos tecnologías esenciales que jugarán un papel muy importante en el futuro de ML, pero actualmente están relativamente poco exploradas: la metacognición y la inferencia causal.

Como humanos, no solo podemos completar una tarea cognitiva, sino que también podemos considerar nuestro pensamiento al completar esa tarea. Aunque los científicos del comportamiento afirmarán que nuestros egos a veces pueden interponerse en el camino de que podamos hacer esto racionalmente, este proceso sigue siendo un proceso crítico para la forma en que nosotros, como humanos, aprendemos. Este proceso se conoce como metacognición.

Los seres humanos planifican, supervisan y evalúan nuestra comprensión a medida que aprendemos. Tanto es así que cuando observamos que una aspiradora robótica falla, a menudo lo consideraremos con diversión mientras damos por sentada nuestra propia capacidad de metacognición.

Hace varios años, trabajé accidentalmente en una solución a este mismo problema. Me encontré en la necesidad de hacer un algoritmo de procesamiento de lenguaje natural (NLP) sensible al riesgo de cometer un error, y más tarde fui coautor de un artículo que describía el enfoque adoptado para abordar este problema. Esencialmente, el algoritmo NLP procesaría el texto y generaría una respuesta adecuada para un ser humano, y una red neuronal diferente tomaría una decisión binaria sobre si la respuesta probablemente conduciría a una interacción positiva.

Más contenido para leer: La Declaración del Atlántico Reino Unido-Estados Unidos refuerza la colaboración en tecnología y datos

Otros científicos informáticos también han explorado este espacio y se están realizando otras investigaciones para idear formas novedosas de lograr una metacognición más avanzada en IA, intentando mejorar el nivel de resolución de problemas y comprensión que las máquinas son capaces de hacer.

Otro desafío para ML es la capacidad de los algoritmos para comprender la causalidad. Hasta ahora, gran parte de lo que hacen los algoritmos de IA es encontrar correlaciones entre puntos de datos, en lugar de comprender las relaciones causales.

Una forma científica de entender la causalidad es a través de ensayos controlados aleatorios (ECA), en los que los sujetos de prueba se asignan al azar a diferentes grupos de tratamiento. Dichos ensayos se utilizan en todo, desde el desarrollo de vacunas hasta las pruebas A/B de diferentes diseños de interfaz de usuario en sitios web. Los RCT son una de las formas más altas de evidencia científica y brindan una certeza significativamente mayor que los datos de observación, pero pueden requerir una gran cantidad de datos para la significación estadística y necesitan un diseño experimental cuidadoso desde el principio.

Mejorar el razonamiento causal en IA nos ofrece la oportunidad de hacer más con menos cuando se trata de datos. Microsoft Research es un equipo que tiene un grupo que actualmente trabaja para mejorar la causalidad en ML, pero aún queda más trabajo por hacer.

Hasta que superemos estos desafíos en IA, la integración de datos seguirá siendo una parte importante para garantizar que podamos proporcionar a nuestros algoritmos de ML restringidos los datos que necesitan para proporcionar resultados significativos. No se trata solo del volumen de datos, sino también de la dimensionalidad. Los algoritmos de ML necesitan una comprensión completa de todos los atributos de los datos para tener una mejor oportunidad de encontrar las conclusiones correctas. Por esta razón, antes de embarcarse en su revolución de IA, debe asegurarse de que sus patos estén en orden cuando se trata de sus datos.

Más contenido para leer: Gartner Symposium: More about AI

Junade Ali es un tecnólogo experimentado interesado en la gestión de ingeniería de software, la investigación de seguridad informática y los sistemas distribuidos.

La inversión en fintech del Reino Unido se multiplica por siete en un año

Formación del personal, gestión de incidencias y medios

Servicios

Recursos

¿Donde estamos?