La startup china DeepSeek afirmó que su exitoso modelo sólo costó USD 300.000 de entrenamiento

El informe en Nature indicó que R1, enfocado en razonamiento, fue entrenado con 512 chips Nvidia H800 durante 80 horas.

Por Gonzalo Andrés Castillo

Redactor especialista en finanzas y mercado de capitales

Hace 2 horas

El desarrollador chino de inteligencia artificial (IA) DeepSeek reveló que el entrenamiento de su modelo R1 costó apenas USD 294.000, una cifra significativamente inferior a los montos reportados por compañías estadounidenses, donde proyectos similares superan los USD 100 millones.

 

La estimación apareció en un artículo publicado en la revista Nature, marcando la primera vez que la firma con sede en Hangzhou divulga detalles sobre los costos de desarrollo de su tecnología.

 

DeepSeek irrumpió en enero con modelos de IA de bajo costo que generaron inquietud en los mercados tecnológicos, al plantear la posibilidad de que Pekín desafíe el liderazgo de gigantes como Nvidia. Tras aquel impacto, tanto la empresa como su fundador, Liang Wenfeng, mantuvieron un perfil discreto, con escasas apariciones públicas y anuncios limitados de actualizaciones.

 

El informe en Nature indicó que R1, enfocado en razonamiento, fue entrenado con 512 chips Nvidia H800 durante 80 horas. Aunque la compañía aseguró que utilizó únicamente chips permitidos para el mercado chino, en documentos adicionales admitió haber empleado previamente GPU A100 en fases experimentales. Este reconocimiento reavivó las dudas sobre el acceso de DeepSeek a hardware restringido por los controles de exportación estadounidenses.

 

El uso de chips A100 y H800 fue un punto sensible en la competencia tecnológica. Estados Unidos prohibió en 2022 la venta de los procesadores más avanzados de Nvidia (H100 y A100) a China, lo que obligó a la compañía a desarrollar versiones adaptadas como el H800. Sin embargo, funcionarios estadounidenses señalaron que DeepSeek podría haber conseguido volúmenes significativos de hardware prohibido, algo que la empresa niega.

 

El caso refuerza la tensión entre los costos crecientes de los modelos occidentales y la capacidad china de entrenar sistemas avanzados con presupuestos mucho más bajos, un factor que podría alterar el equilibrio en la carrera global por la inteligencia artificial.

 

¿Quiere recibir notificaciones de alertas?