En este podcast hablamos con Cody David, Arquitecto de soluciones con Syniti, que forma parte de Capgemini, sobre la importancia de garantizar la calidad de los datos para las cargas de trabajo de inteligencia artificial (IA).
Poder confiar en la IA es fundamental para su uso, dice. Y aquí debemos asegurarnos de que sus resultados sean confiables. Ese solo será el caso si AI está capacitado en un conjunto de datos que no está lleno de duplicados y datos incompletos.
Mientras tanto, AI, afirma que David, puede usarse para ayudar con la calidad de los datos, como encontrar problemas en conjuntos de datos que pueden conducir a resultados erróneos.
La gran conclusión es que las organizaciones necesitan una actitud de “datos primero” para que la IA pueda hacer su trabajo y producir resultados confiables en los que se pueda confiar, y describe las victorias rápidas que se pueden obtener.
Antony Adshead: ¿Cuáles son los desafíos clave en la calidad de los datos en la empresa para los casos de uso de IA?
Cody David: Uno de los mayores desafíos en la calidad de los datos para la IA que veo es la confianza.
Muchas personas ven un sistema de IA como una sola caja negra. Cuando produce una visión o acción incorrecta, lo llaman un error de IA y pierden la confianza. A veces permanentemente, pueden perder esa confianza.
Sin embargo, el verdadero problema a menudo radica en la mala calidad de los datos. Esto se ve agravado por la falta de comprensión de cómo funcionan realmente las soluciones de IA.
Considere una organización de ventas. Tienen un CRM y tiene registros de clientes duplicados. Y una solución de IA clasifica a sus principales clientes de manera incorrecta porque no está enrollando todas las transacciones a una cuenta.
Por lo tanto, el equipo de ventas culpa a la herramienta AI, sin darse cuenta de que la causa raíz es en realidad datos pobres o inconsistentes. Este es un ejemplo de lo que llamamos calidad de datos para AI; Asegurar que los datos sean precisos y listos para esos procesos impulsados por la IA.
Por otro lado, también hay IA para la calidad de los datos, donde una solución de IA puede ayudar a detectar y fusionar esos registros duplicados que acabamos de dar en ese ejemplo. Creo que un desafío más es que la calidad de los datos ha sido históricamente una ocurrencia tardía. Las organizaciones a menudo saltan a la IA sin esta mentalidad de datos y antes de garantizar que tengan esa sólida base de datos.
Por lo tanto, tiene estos sistemas heredados, estos sistemas ERP heredados con miles de tablas y décadas de problemas de datos compuestos.
Todo eso se suma a esta complejidad. Y es por eso que es crucial abordar los problemas de calidad de los datos de manera proactiva en lugar de tratar de modernizar soluciones después de que esas iniciativas de IA fallan. Tenemos que poner esos datos al frente y al centro de estas iniciativas de inteligencia artificial y luego establecer esa solución estable que respaldará esas salidas de IA confiables.
¿Cuáles son los pasos clave que puede tomar una organización para garantizar la calidad de los datos para la IA?
David: Creo que un enfoque sistemático siempre comienza con la gobernanza de datos.
Y esa es realmente las políticas de cómo se recopilan, almacenan, limpian, comparten los datos, se encuentran y descubren quién es el verdadero propietario de procesos comerciales o conjuntos de datos particulares. Es crucial descubrir quién es responsable de esos estándares.
Creo que a continuación, quieres priorizar. En lugar de tratar de arreglar todo a la vez, concéntrese en aquellas áreas que brindan el mayor impacto comercial. Esa es una frase muy clave allí: ¿cuál es el mayor impacto comercial de lo que está tratando de solucionar en cuanto a la calidad de los datos? Y descubra los que alimentan sus soluciones de IA.
Aquí es donde verás esas victorias rápidas. Ahora, habrá preocupaciones presupuestarias que a menudo surgen cuando comience a hablar sobre estos programas de calidad de datos de datos. E irónicamente, es más costoso trabajar con datos malos a largo plazo.
Creo que una solución práctica es comenzar a poco. Elija un proceso comercial crítico con impactos financieros medibles. Úselo como piloto para demostrar esos ahorros reales en el ROI.
Y una vez que muestre que las mejoras de calidad de los datos conducen a beneficios tangibles, como reducciones de costos o un mayor capital de trabajo, tendrá un caso más fuerte con la gerencia para una inversión de gobierno de datos más amplia. También debe incrustar esas prácticas de calidad de datos en el flujo de trabajo de datos. Por ejemplo, integrar las reglas de validación en la gestión de sus datos para que los errores puedan captarse de inmediato, evitando que los datos afecten esas soluciones.
Si no puede establecer validaciones como esa en su creación de datos, debe establecer los sistemas y procesos para atraparlos inmediatamente a través de informes automatizados.
Por último, diría que siempre concéntrese en esa mejora continua. Mida las métricas de calidad de datos y úselas para impulsar los refinamientos iterativos tejiendo esa gobernanza de datos en su organización, demostrando su valor a través de esos pilotos específicos, y luego crea esa base sostenible para las iniciativas de IA confiables.
Finalmente, me preguntaba si podría dar un ejemplo de una o dos victorias rápidas que las empresas pueden obtener en términos de calidad de datos y mejorar las cualidades de datos para la IA.
David: Hay algunos ejemplos diferentes de dónde tratamos de obtener victorias rápidas para la calidad de los datos, especialmente cuando tratamos de obtener ROI muy rápidos y procesos comerciales de alto impacto.
Si toma un sistema ERP, tenemos lo que llamamos materiales MRO. Esos son los que son piezas a equipos en un proceso de fabricación. Y cuando tiene esos materiales, generalmente mantiene un stock de seguridad o una cantidad de esos artículos que le permitirían reparar esas máquinas.
Si una planta cae, potencialmente perderá millones de dólares al día. Y si tiene materiales duplicados, como ejemplo, en realidad está almacenando más de lo que necesita. Y eso es realmente un capital de trabajo que, si corriera esa calidad de datos, libera ese capital de trabajo.
Y luego, por supuesto, puede usar ese capital de trabajo para otras partes de sus iniciativas.
Otro sería tal vez descuentos de proveedores. Si tiene proveedores que están duplicados en un sistema y tienen derecho a reembolsos basados en la cantidad de dinero que están gastando, no se darán cuenta de esos reembolsos particulares. Esa podría ser un área donde también podría tener ahorros de costos.