La Cámara de Comercio de Dinamarca, Dansk Erhverv, encabeza un consorcio nacional de organizaciones estatales y privadas para lanzar una versión en danés de ChatGPT.
El modelo de “inteligencia artificial responsable” (IA) propuesto por el recientemente creado Consorcio de Modelos de Lengua Danesa (DLMC) estará disponible gratuitamente para las llamadas organizaciones e individuos “con principios” en Dinamarca.
El proyecto, dirigido por Dansk Erhverv y sus socios principales IBM Dinamarca y el Alexandria Institute, se centrará inicialmente en desarrollar un modelo de idioma danés que pueda personalizarse según las necesidades individuales de diferentes empresas y usuarios privados.
El chatbot en danés que se está desarrollando en paralelo al proyecto principal pretende ser una herramienta de resolución de problemas y tareas complejas cotidianas que enfrentan las empresas y los particulares, incluido el procesamiento y la presentación de declaraciones de impuestos.
Los socios de DLMC han firmado un acuerdo para garantizar la transparencia y la protección de los derechos de autor de los datos daneses. Como resultado, el “modelo de lenguaje pequeño” desarrollado está protegido por una barrera que permite que la tecnología se utilice de manera segura y ética, dijo Thomas Kovsted, director gerente de IBM Dinamarca.
“Ha habido un apoyo excepcionalmente amplio para la formación de una alianza que pueda impulsar el desarrollo de un modelo lingüístico danés responsable. La puerta está abierta para que participen más socios con ideas afines. La iniciativa agregará un nuevo impulso a la digitalización en
Dinamarca
a medida que crece la confianza en el modelo de idioma danés que estamos construyendo”, dijo Kovsted.
El proyecto DMLC está trabajando actualmente para superar ciertos obstáculos para certificar que los datos utilizados y el modelo de lenguaje creado cumplen plenamente con la ley danesa y las reglas fundamentales de la Unión Europea (UE) bajo el Reglamento General de Protección de Datos (GDPR) que rige la protección de datos personales sensibles. datos.
DMLC espera desarrollar y presentar el primero de varios modelos de lenguaje potenciales durante el cuarto trimestre de 2024.
El viaje de desarrollo de una versión danesa de ChatGPT está lleno de problemas que requieren soluciones innovadoras, dijo Casper Klynge, ex subdirector de Dansk Erhverv. Klynge dejó el CoC en agosto (2024) para unirse a Zscaler, una corporación de transformación digital con sede en
San José
,
California
“Somos conscientes de que será muy difícil competir con los grandes modelos lingüísticos que existen. Dicho esto, hay ciertas áreas como productos de nicho o modelos de lenguaje pequeños y personalizados que resuelven problemas específicos, donde se puede avanzar”, dijo Klynges.
Diplomático de carrera, el ex ejecutivo de IBM se unió al CoC en 2022. En 2017, Klynges fue nombrado
Dinamarca
El proyecto DLMC ganó verdadera tracción e impulso en 2023, cuando el gobierno danés señaló que apoyaría financieramente iniciativas conjuntas entre actores del sector estatal y privado para desarrollar un chatbox en danés. El CoC y sus socios principales IBM Dinamarca y el Instituto Alexandra comenzaron inmediatamente a formar un consorcio público-privado para financiar y ejecutar un proyecto de modelo de idioma danés impulsado por inteligencia artificial que se lanzó en mayo de 2024.
Un aspecto fundamental del proyecto es que el DLMC proporcionará datos para su uso en la formación de modelos de lenguaje común danés. Estos se basarán en el modelo Munin desarrollado por Danish Foundation Models (DFM), una organización subvencionada por el estado centrada en potenciar el idioma danés en la era digital.
La construcción de Munin está influenciada por el modelo de código abierto del mismo nombre de la empresa francesa Mistral AI. Establecido en abril de 2023 por ex empleados de Meta Platforms y Google DeepMind, el disruptor Mistral produce grandes modelos de lenguaje de código abierto que están disponibles gratuitamente para su uso y personalización. El software gratuito de código abierto de la empresa la ha posicionado como una alternativa a los modelos propietarios.
La misión principal del DFM se centra en ser pionero en innovación en el campo del aprendizaje automático y el procesamiento del lenguaje natural (PLN). Estas iniciativas están dedicadas específicamente al idioma danés y mantienen modelos lingüísticos de última generación de acceso abierto para el idioma vinculados a aplicaciones tanto de texto como de voz.
Los modelos lingüísticos comunes, gratuitos y responsables basados en inteligencia artificial en danés deben verse como un activo nacional para impulsar el desarrollo digital continuo en Dinamarca, dijo Jens Kaas Benner, director de los laboratorios de inteligencia artificial del Instituto Alexandra.
“La función del consorcio es suministrar datos daneses. Está previsto que el desarrollo de los modelos básicos se lleve a cabo bajo el patrocinio de la Fundación Danesa Models. Este es un proyecto muy importante para
Dinamarca
”, dijo Benner.
El DFM funciona como una colaboración entre el Alexandria Institute y tres instituciones de tercer nivel:
Universidad
Universidad
Alexandria es una de las siete organizaciones de investigación y tecnología (RTO) aprobadas por el gobierno danés encargadas de desarrollar y brindar experiencia a empresas estatales y privadas en siete áreas principales de tecnología de próxima generación, que incluyen inteligencia artificial, visión por computadora, seguridad cibernética, sostenibilidad digital y salud digital. , internet de las cosas (IoT) y productos inteligentes.
El gobierno danés considera que el proyecto DLMC tiene el potencial de fortalecer la competitividad empresarial de Dinamarca, impulsar el crecimiento económico y al mismo tiempo apoyar la investigación y la educación abiertas en el idioma danés, dijo Marie Bjerre, ministra danesa de gobierno digital e igualdad de género.
“Este proyecto ha reunido fuerzas innovadoras en los negocios, la industria y el sector público para invertir en el desarrollo de un modelo lingüístico basado en el danés. La voluntad de invertir es un componente crítico de
Dinamarca
En cuanto a la marca, el DLMC está explorando posibles nombres para el modelo de idioma danés, incluido MyGPT. y DanGPT.
La lista de los más de 20 socios de DLMC incluye el municipio de Aarhus; el grupo danés de seguros de pensiones ATP; el Grupo Bagger Sørensen; Ccerebro; grupo de rescate y emergencia Falck; Datos JN; la Asociación Nacional de Municipios de Dinamarca; la empresa de energía Norlys; Topdanmark; el desarrollador de software Visma; y COSUDE, un proveedor de plataformas digitales centrales para bancos de toda la región nórdica.
Aunque es OpenSource y está generalmente disponible para usuarios públicos y privados, el DLMC ha implementado medidas para evitar la piratería y la infracción de derechos de autor de los métodos específicos y las configuraciones de datos utilizados en la creación del modelo de lenguaje.
En primer lugar, los conjuntos de datos en los que se demuestra y enseña el modelo de lenguaje no se pondrán a disposición del público. Estos conjuntos de datos permanecerán confidenciales y protegidos por criterios de acceso restringido. Sin embargo, el DLMC permitirá a los socios mejorar el modelo de lenguaje básico disponible para fines de capacitación, lo que permitirá a los socios agregar más valor y personalizarlos según sus necesidades específicas.
Como socio fundador de DLMC, Topdanmark planea introducir chatbots basados en el modelo de idioma danés en todo su negocio de servicios financieros. Topdanmark fue una de las primeras casas financieras nórdicas en aplicar tecnologías de inteligencia artificial cuando lanzó su chatbot Globus en 2019. Globus se utiliza actualmente para manejar más del 80% de las consultas del grupo de clientes relacionadas con seguros de viaje.