DeepSeek es una startup china de inteligencia artificial con sede en Hangzhou, fundada a finales de 2023 por Liang Wenfeng, un emprendedor en serie que también dirige el fondo de cobertura High-Flyer Al JazeeraTime. La empresa desarrolla modelos extensos de lenguaje (LLM) de código abierto y es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer. DeepSeek - Wikipedia, la enciclopedia libre
DeepSeek anunció V3.1 el 19 de agosto de 2025, una actualización de su modelo V3 que introduce mejoras significativas, particularmente una ventana de contexto más larga de 128,000 tokens, lo que le permite considerar una mayor cantidad de información por consulta y mantener conversaciones más largas con mejor memoria. The ZviDigit
Características Principales de V3.1
Escala Masiva El modelo cuenta con 685 mil millones de parámetros totales, un aumento desde los 671B de su predecesor, utilizando una arquitectura Mixture-of-Experts (MoE) que activa solo 37 mil millones de parámetros por token. DigitMarkTechPost
Modo de Inferencia Híbrida V3.1 introduce un sistema con dos rutas: el razonamiento profundo y la respuesta rápida, que se pueden elegir a través de un interruptor presente tanto en la versión web como en la app. Genbeta | Geeky Gadgets
Capacidades Mejoradas
- Obtuvo un 71.6% en la prueba de codificación de Aider, colocándolo por encima de Claude Opus 4. Deepseek lanza su nuevo modelo 3.1
- Mayor eficiencia de pensamiento: DeepSeek-V3.1-Think logra una calidad de respuesta comparable a DeepSeek-R1-0528, mientras responde más rápidamente. Hugging Face
- Mejor uso de herramientas: optimización post-entrenamiento que mejoró el rendimiento en tareas de agentes. Hugging Face
Optimización Técnica El modelo está entrenado usando el formato de datos de escala UE8M0 FP8, optimizado para chips de próxima generación. Lo que DeepSeek acaba de lanzar no gustará ni a NVIDIA
¿Por Qué es Tan Novedoso?
1. Disrupción Económica del Mercado de IA
DeepSeek dijo que había gastado solo $5.6 millones en energizar su modelo base de IA, comparado con los cientos de millones o miles de millones de dólares que las empresas estadounidenses invierten. CNN Business
El impacto fue inmediato: Nvidia perdió casi $600 mil millones en capitalización de mercado tras una caída del 17% en sus acciones. Al Jazeera
2. Desafío a la Hegemonía Tecnológica de EE.UU.
El modelo sorprendió a la industria al superar a OpenAI, desplazando a ChatGPT de la cima de la App Store de iOS. What Is DeepSeek, the New Chinese OpenAI Rival? | TIME
Además, Estados Unidos lleva años restringiendo chips de IA a China por seguridad nacional, lo que hace más notable que DeepSeek lograra su modelo con chips menos potentes. What is DeepSeek, the Chinese AI startup that shook the tech world? | CNN Business
3. Modelo de Código Abierto vs. Propietario
DeepSeek lanzó V3.1 bajo Licencia MIT, permitiendo que cualquiera lo use, modifique y comparta. What is DeepSeek-V3.1 and Why is Everyone Talking About It? - MarkTechPost
Esto contrasta con modelos cerrados de OpenAI y Google.
4. Rendimiento Competitivo
DeepSeek compite directamente con los mejores:
DeepSeek-R1 comparable a OpenAI-o1 en matemáticas, código y razonamiento. Hugging Face
En MATH-500 logró 97.3%, superando a OpenAI o1-1217 con 96.4%. DataCamp
Precios API:
- DeepSeek R1: $0.55 entrada / $2.19 salida (1M tokens).
- OpenAI o1: $15 entrada / $60 salida. → DeepSeek es 96.4% más barato. Comparación DeepSeek R1 vs OpenAI o1
Implicaciones Estratégicas
El Momento Sputnik de la IA
Marc Andreessen calificó a DeepSeek R1 como el “momento Sputnik de la IA”, aludiendo al inicio de la carrera espacial. PBS News
Respuesta de la Industria
El presidente de EE.UU., Donald Trump, dijo que DeepSeek debería servir como una “llamada de atención” para que la industria americana compita con mayor enfoque. Al Jazeera
Limitaciones y Desafíos
- Inserciones ocasionales de texto chino en salidas de código, que requieren correcciones manuales. Gizmochina
- Velocidades más lentas en entornos de nube, lo que limita la practicidad para tiempo real. Gizmochina
- Restricciones políticas: censura en relación a críticas al Partido Comunista Chino. TIME
Conclusión
DeepSeek V3.1 es un cambio sísmico en la IA global. Más que una mejora técnica, es una muestra de que:
- La innovación puede surgir con recursos limitados: Lograr resultados comparables a OpenAI con una fracción del costo desafía las suposiciones sobre la necesidad de inversiones masivas en IA.
- El código abierto puede competir con modelos propietarios: La naturaleza abierta de DeepSeek democratiza el acceso a IA avanzada.
- Las restricciones pueden impulsar la innovación: Las limitaciones de chips impuestas a China paradójicamente han llevado a soluciones más eficientes.
- El liderazgo en IA es disputado: La supremacía tecnológica estadounidense en IA ya no es incuestionable.
Este desarrollo no solo es técnicamente impresionante, sino que tiene profundas implicaciones geopolíticas y económicas, redefiniendo las dinámicas de poder en la carrera global en la IA de uso personal y para la IA de aplicación empresarial.