
El Ascenso Disruptivo de DeepSeek en la IA
DeepSeek, un laboratorio chino de IA, ha ganado recientemente una atención significativa, encabezando las listas de tiendas de aplicaciones y generando debates sobre la carrera global de IA. Respaldados por High-Flyer Capital Management, los modelos de IA de DeepSeek, desarrollados con técnicas de computación eficientes, están llevando a los analistas a cuestionar el dominio de EE. UU. en la IA y la sostenibilidad de la demanda de chips de IA.
De Fondo de Cobertura a Innovador en IA
Fundada por el entusiasta de la IA Liang Wenfeng, High-Flyer Capital Management se centró inicialmente en algoritmos de negociación impulsados por IA. En 2023, DeepSeek surgió como un laboratorio separado dedicado a la investigación de IA, y finalmente se escindió como su propia empresa. A pesar de enfrentar desafíos como las prohibiciones de exportación de hardware de EE. UU., DeepSeek ha construido sus propios centros de datos para el entrenamiento de modelos, utilizando chips Nvidia H800.
El equipo de DeepSeek es conocido por ser joven y reclutar agresivamente a los mejores investigadores de IA de las universidades chinas. También contratan a personas de diversos orígenes para ampliar la comprensión de su IA en varios temas.
Avances del Modelo DeepSeek
La empresa reveló sus modelos iniciales en noviembre de 2023, pero fue la familia DeepSeek-V2 la que realmente captó la atención de la industria de la IA. DeepSeek-V2 sobresalió en los puntos de referencia de IA y fue notablemente rentable, lo que obligó a competidores como ByteDance y Alibaba a bajar sus precios de modelo.
DeepSeek-V3, lanzado en diciembre de 2024, solidificó aún más la reputación de DeepSeek. Las pruebas internas sugieren que DeepSeek V3 supera a los modelos de código abierto como Llama de Meta y los modelos cerrados como GPT-4o de OpenAI. Además, el modelo de "razonamiento" R1 de DeepSeek demuestra un rendimiento comparable al modelo o1 de OpenAI, destacándose en la verificación de hechos y la confiabilidad.
Preocupaciones e Implicaciones
Sin embargo, como una IA desarrollada en China, DeepSeek está sujeta a la regulación del contenido, lo que garantiza que sus respuestas estén alineadas con los "valores socialistas centrales". Esto plantea preocupaciones sobre la posible censura y sesgo. Si bien el modelo de negocio de DeepSeek sigue siendo algo confuso, su competitividad de costos y licencias permisivas han atraído a una gran base de desarrolladores, con modelos derivados que obtienen millones de descargas.
El rápido ascenso de DeepSeek ha interrumpido el panorama de la IA, lo que ha afectado el precio de las acciones de Nvidia y ha provocado respuestas del CEO de OpenAI, Sam Altman. Si bien algunas entidades están prohibiendo DeepSeek debido a preocupaciones de seguridad y al control estatal percibido, otras, como Microsoft, están integrando su tecnología. El gobierno de EE. UU. también está considerando prohibir DeepSeek en los dispositivos gubernamentales. El futuro de DeepSeek sigue siendo incierto, pero sus modelos innovadores y su impacto en la industria de la IA son innegables.
Source: TechCrunch