Deepseek: Bienvenido al momento Sputnik de la inteligencia artificial de EE. UU.

Después de la introducción del último fin de semana pasado del último modelo de lenguaje grande (LLM) de Deepseek, el nuevo rival de inteligencia artificial (AI) de ChatGPT ha encabezado la Apple App Store para descargas de iPhone.

El Deepseek R1 LLM es de código abierto y utiliza un razonamiento combinado con lo que la compañía llama “datos de inicio de frío”, lo que significa que, en lugar de rastrear los sitios de Internet y las redes sociales para acumular grandes cantidades de datos de aprendizaje automático, se basa en el aprendizaje reforzado para hacer un aprendizaje reforzado a mejorar la precisión.

En su página de GitHub, los desarrolladores de Deepseek describen R1 como un aprendizaje de refuerzo a gran escala en el modelo base. “Aplicamos directamente el aprendizaje de refuerzo al modelo base sin confiar en el ajuste supervisado como un paso preliminar”, dice. “Este enfoque permite que el modelo explore la cadena de pensamiento para resolver problemas complejos”.

Se estima que se registraron 2,1 millones de búsquedas para Deepseek durante el fin de semana, con al menos 1.6 millones de estas el domingo 26 de enero solo. Este es el 12.3% de los 13 millones de búsquedas de ChatGPT en el mismo plazo.

Además de adoptar un enfoque diferente para ChatGPT, el interés en Deepseek también está siendo impulsado por los precios competitivos y el hecho de que el código es de código abierto.

Mientras que OpenAi, el fabricante de ChatGPT, cobra $ 2.50 por millón de tokens de entrada por su modelo GPT-4O, Deepseek tiene un precio de $ 0.14 por millón de tokens de entrada en situaciones en las que el motor AI puede obtener información previamente almacenada en caché. Las entradas no consultadas tienen un precio de $ 0.55 por millón de tokens.

El grado de interés en la IA de la empresa china resultó en la agitación en la valoración de las acciones tecnológicas en los Estados Unidos. Reuters informó que NVIDIA vio caer el precio de su acción un 17%, lo que efectivamente eliminó $ 593 mil millones de la valoración de su mercado.

Llamada de atención

En un discurso el lunes, el presidente de los Estados Unidos, Donald Trump, describió a Deepseek como una llamada de atención para el sector tecnológico estadounidense.

Entre los numerosos temas de los que Trump habló en su discurso ante los miembros del Congreso del Partido Republicano se encontraban las órdenes ejecutivas que revocan las regulaciones de IA introducidas bajo el ex presidente Joe Biden. “No queremos que ningún futuro presidente sabotee nuestra economía con regulaciones fuera de control”, dijo. “La semana pasada firmé una orden que revocó las destructivas regulaciones de inteligencia artificial de Joe Biden para que las compañías de IA puedan centrarse una vez más en ser la mejor, no solo ser las más despertadas”.

Luego hizo referencia a Deepseek mientras continuaba hablando de por qué la desregulación es importante para la IA en los Estados Unidos. “Hoy y en los últimos días he estado leyendo sobre China y [one Chinese company] En particular, presentando un método más rápido de IA y un método mucho menos costoso. Esperemos que el lanzamiento de Deepseek AI de una empresa china sea una llamada de atención para nuestras industrias que necesitamos para estar centrados en el láser en competir para ganar “.

Los desarrolladores de Deepseek han podido combinar algoritmos de vanguardia para reducir las demandas de energía de la capacitación y el despliegue de IA. En su discurso, Trump describió lo que Deepseek había logrado como “bueno”, ya que las empresas que buscan desarrollar aplicaciones de IA que usan Deepseek no tienen que gastar tanto dinero en comparación con los LLM rivales. “Veo que como positivo, como un activo”, agregó.

Al comentar sobre qué ha significado el auge de Deepseek para los mercados financieros, Charu Chanana, estratega jefe de inversiones de la plataforma de inversión Saxo, señaló que Deepseek tardó solo dos meses en desarrollarse y menos de $ 6 millones para construir, utilizando chips de capacidad reducida de Nvidia llamada H800S. Esto es significativo dado que la administración Biden prohibió la exportación de procesadores de gráficos NVIDIA (GPU) de alta gama a China en 2023.

“Las compañías tecnológicas estadounidenses están comerciando con valoraciones premium, con los principales jugadores de IA como Nvidia, Microsoft y Alphabet al mando de P/E [price to earnings] Múltiples muy por encima de los promedios históricos ”, dijo. “Con estas acciones con un precio de perfección, incluso las interrupciones menores, como Deepseek que demuestre que la IA avanzada se puede construir sin chips de primer nivel, podría sopesar mucho los precios de las acciones. Para Nvidia, en particular, su papel como proveedor clave de chips de IA lo hace vulnerable si la demanda de sus productos de alta gama disminuye ”.

La idea de la IA de menor costo y más eficiente en la energía que proviene de Deepseek parece tener un impacto inmediato tanto en los gigantes tecnológicos de los EE. UU. Como en el sector energético, que ha estado depositando en el crecimiento del consumo de energía alimentado por IA.

“El avance de Deepseek señala un cambio hacia la eficiencia en la IA, que redefinirá tanto los mercados de energía como de IA”, dijo Nigel Green, CEO del gigante de asesoramiento financiero global Devere Group. “Las oportunidades para los inversores dispuestos a actuar ahora son enormes.

“Esto desafía la suposición de que el crecimiento de la IA está vinculado al consumo de energía cada vez mayor. Si bien el mercado está reaccionando a la incertidumbre a corto plazo, los modelos de IA impulsados ​​por la eficiencia ampliarán la adopción en nuevos mercados e industrias. Esto significa un uso más extendido, una integración más profunda y, en última instancia, una demanda sostenida de soluciones energéticas “.

Podría decirse que es el hecho de que DeepMind ha podido lograr resultados utilizando hardware inferior y ofrecer su LLM a un precio altamente competitivo que se establece para cambiar el enfoque de todas las organizaciones a la IA: no necesariamente requiere lanzar grandes cantidades de GPU costosas a la costos Hardware y tener que recuperar estos costos cobrando a los usuarios finales una prima.

“Al desarrollar modelos de IA generativos de vanguardia sin depender del último hardware más caro, Deepseek ha demostrado que la agilidad y la estrategia pueden superar la potencia computacional sin procesar”, dijo Kjell Carlsson, jefe de estrategia de IA en Domino Data Lab. “Sus logros también destacan la vulnerabilidad de los titulares en el espacio generativo de IA, lo que demuestra que la innovación de código abierto continúa siendo un empate poderoso, lo que permite a los retadores igualar e incluso superar a los jugadores establecidos años en la revolución”.

Lo que esto significa es que Deepseek significa la competencia china a los modelos de IA existentes de Silicon Valley. Michael Guan, CEO de Final Round AI, dijo que el modelo de precios es rentable, a diferencia de los modelos que ofrecen muchas otras organizaciones de IA. “Su código también es de código abierto”, agregó. “Esto es muy poco convencional, ya que las empresas tienden a mantener el código detrás de sus últimos modelos un secreto estrechamente guardado”.

Exit mobile version