DeepSeek: el nuevo modelo chino que está transformando el mercado
Hace unas semanas, la empresa china DeepSeek lanzó DeepSeek R1, un modelo de inteligencia artificial que compite directamente con los últimos modelos de razonamiento de OpenAI (conocidos como o1 y o3) y con otros modelos destacados del mercado, como Google Gemini, LLaMa de Meta y Claude de Anthropic.
Este modelo ofrece resultados comparables a los mejores, pero a un costo significativamente menor, lo que ha impulsado su popularidad. De hecho, su irrupción en la industria fue tal que las acciones de NVIDIA—el principal proveedor de chips para IA—perdieron más de 500 mil millones de dólares en valor de mercado en tan solo un día.
En este artículo exploramos qué es DeepSeek, por qué DeepSeek R1 es tan efectivo y las implicancias de este nuevo modelo para el mundo de los negocios.
¿Qué es DeepSeek?
DeepSeek es una compañía china que surgió como laboratorio interno de High-Flyer, una empresa que utiliza la inteligencia artificial para realizar transacciones en el mercado accionario. A finales de 2023, DeepSeek comenzó a publicar modelos de lenguaje y estudios de investigación relevantes en este campo. Sin embargo, alcanzó notoriedad al lanzar DeepSeek R1, un modelo que “razona” para ofrecer respuestas con mayor precisión que otros en el mercado.
DeepSeek R1 y su comparativa con los modelos actuales
Lo que diferencia a DeepSeek R1 es su capacidad para alcanzar un rendimiento similar al de los modelos líderes, pero a un costo mucho menor. Esto desafía la idea de que solo se pueden obtener altos niveles de precisión con modelos costosos.
Por ejemplo, en pruebas realizadas en nuestra empresa, DeepSeek R1 respondió el examen de admisión a la educación superior en Chile (PAES) con un 94% de precisión, superando ligeramente al modelo o1 de OpenAI (92% de precisión). Además, el costo de estas pruebas fue más de 10 veces menor.
Impacto en el mercado tecnológico global
El lanzamiento de DeepSeek R1 ha tenido repercusiones significativas a nivel mundial. Tras su aparición, las acciones de NVIDIA (empresa estadounidense que es el proveedor principal de los chips que habilitan muchos casos de IA) cayeron en más de 500 mil millones de dólares en un solo día. Este descenso se atribuye a las dudas generadas sobre la necesidad de hardware costoso para entrenar modelos de IA, ya que DeepSeek R1 demostró que es posible lograr un alto rendimiento con una inversión menor en infraestructura.
Además, la aplicación de DeepSeek se ha posicionado entre las más descargadas en las tiendas de aplicaciones, superando a competidores consolidados y destacando su rápida adopción por parte de los usuarios.
¿Por qué es tan económico?
El bajo costo de DeepSeek R1 se debe a un enfoque técnico innovador que optimiza el rendimiento y reduce el uso de recursos computacionales en comparación con otros modelos líderes.
Según la empresa, el entrenamiento de DeepSeek R1 costó aproximadamente 5,6 millones de dólares, una cifra muy inferior a los más de 100 millones estimados para el entrenamiento de GPT-4 por OpenAI. Aunque algunos expertos cuestionan si se han considerado todas las variables en estos cálculos, lo cierto es que el uso de DeepSeek R1 a través de API resulta ser más de 50 veces más económico que el de ChatGPT o1 (costo por millón de tokens).
¿Es seguro?
La seguridad de DeepSeek R1 ha sido objeto de críticas. La versión alojada del modelo incorpora mecanismos de censura para ciertos temas, en línea con las políticas del gobierno chino.
Captura de pantalla de DeepSeek bloqueando un requerimiento sobre los eventos ocurridos en la Plaza de Tiananmén en 1989
Sin embargo, este modelo es Open Source, lo cual permite poder tomar los archivos y alojarlos en infraestructura propia. Cuando se ejecuta localmente, estos mecanismos pueden ser modificados o eliminados, lo que permite un mayor control por parte del usuario.
No obstante, al ser de código abierto, es posible descargar y alojar el modelo en infraestructura propia, lo que permite modificar o eliminar estos mecanismos de censura. Por otro lado, investigaciones realizadas por expertos en seguridad de Cisco y la Universidad de Pensilvania han demostrado que, si se manipula adecuadamente, DeepSeek R1 puede proporcionar información peligrosa (por ejemplo, instrucciones para fabricar armas o contenido tóxico). Esto obliga a quienes lo utilizan a implementar medidas adicionales para garantizar la seguridad y brand safety en sus aplicaciones.
Implicancias para el mundo de los negocios
Su eficiencia y menor costo permiten el desarrollo de aplicaciones más accesibles y económicas. Para los equipos técnicos, la transición al nuevo modelo es sencilla, ya que utiliza la misma biblioteca de API que OpenAI.
Además, la posibilidad de ejecutar DeepSeek R1 localmente es ideal para industrias altamente reguladas que requieren mantener su información en servidores propios, asegurando el cumplimiento de normativas de privacidad y seguridad. Por primera vez, un modelo de código abierto ofrece un rendimiento comparable a los mejores modelos de OpenAI, lo que podría democratizar el acceso a tecnologías avanzadas de IA en el sector empresarial.
Daniela Torrealba
Consultora asociada en EvoAcademy
Sebastián Cisterna
Socio en EvoAcademy y Profesor Universidad Adolfo Ibáñez
También te podría interesar: Futuro prometedor para la IA en Chile
Agentes – La nueva tendencia de IA que mejorará el Marketing en 2025