DeepSeek para niños
Datos para niños DeepSeek |
||
---|---|---|
![]() |
||
Tipo | negocio, empresa emergente y empresa tecnológica | |
Industria | tecnologías de la información y la comunicación inteligencia artificial |
|
Forma legal | empresa privada | |
Fundación | mayo de 2023 | |
Fundador | Liang Wenfeng | |
Sede central | Hangzhou (República Popular China) | |
Propietario | High-Flyer | |
Empresa matriz | High-Flyer | |
Sitio web | deepseek.com | |
DeepSeek (chino: 深度求索; pinyin: Shēndù Qiúsuǒ; en español: 'Búsqueda Profunda') es una empresa china de inteligencia artificial que desarrolla modelos extensos de lenguaje (LLM) de código abierto. Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer, cuyo cofundador, Liang Wenfeng, estableció la empresa en 2023 y se desempeña como su director ejecutivo.
El modelo DeepSeek-R1 proporciona respuestas comparables a otros LLM contemporáneos, como GPT-4o y o1 de OpenAI, a pesar de estar entrenado a un costo significativamente menor (se estima en 6 millones de dólares en comparación con los 100 millones de dólares para GPT-4 de OpenAI en 2023) y requiere una décima parte de la potencia informática de un LLM comparable. Los modelos de IA de DeepSeek se desarrollaron en medio de las sanciones de Estados Unidos a China por los chips Nvidia, que tenían como objetivo restringir la capacidad del país para desarrollar sistemas de IA avanzados.
El 10 de enero de 2025, DeepSeek lanzó su primera aplicación de bot conversacional gratuita, basada en el modelo DeepSeek-R1, para iOS y Android; para el 27 de enero, DeepSeek-R1 había superado a ChatGPT como la aplicación gratuita más descargada en la App Store (iOS) en los Estados Unidos, lo que provocó que el precio de las acciones de Nvidia cayera un 18%. El éxito de DeepSeek frente a rivales más grandes y establecidos ha sido descrito como «una revolución en la IA», constituyendo «el primer intento de lo que está surgiendo como una carrera espacial global en versión IA», y marcando el comienzo de «una nueva era de política arriesgada en materia de IA».
DeepSeek hace que sus algoritmos, modelos y detalles de entrenamiento de inteligencia artificial generativa sean de código abierto, lo que permite que su código esté disponible libremente para su uso, modificación, visualización y diseño de documentos con fines de construcción. Según se informa, la empresa recluta vigorosamente a jóvenes investigadores de IA de las mejores universidades chinas y contrata a personas ajenas al campo de la informática para diversificar el conocimiento y las habilidades de sus modelos.
El bot conversacional de inteligencia artificial de DeepSeek está desarrollado íntegramente por ingenieros de software chinos, mientras que los modelos de inteligencia artificial establecidos en Silicon Valley son creados por personas de diversas nacionalidades, incluidos titulares de visas H-1B de diferentes países que trabajan en Estados Unidos. Los modelos de IA de DeepSeek pueden considerarse un paso significativo hacia el desarrollo de tecnologías autóctonas de alta gama por parte de los países asiáticos, ayudando a retener talentos y reducir la fuga de cerebros de países como India y China.
Véase también
En inglés: DeepSeek Facts for Kids
- Industria de la inteligencia artificial en China