DeepSeek AI es una organización de investigación que ha ganado reconocimiento por desarrollar y liberar modelos de lenguaje grande (LLMs) de código abierto de alto rendimiento. Su portafolio incluye series notables como DeepSeek-Coder, optimizada para tareas de programación, y modelos de lenguaje general como DeepSeek-MoE y DeepSeek-V2, que destacan por su arquitectura innovadora y eficiencia. Esta guía de nivel intermedio explora cómo acceder a estos modelos a través de plataformas populares como Hugging Face y Ollama, discute sus principales fortalezas (razonamiento, capacidad de código, rendimiento en benchmarks) y las variantes disponibles (diferentes tamaños de modelo, versiones 'instruct' o finetuneadas). Cubre el uso básico para generación de texto y código, los requisitos generales de hardware para ejecución local, y su rol como alternativas potentes a otros LLMs de código abierto. Permite a desarrolladores y entusiastas aprovechar modelos avanzados para construir aplicaciones de IA, asistentes de programación o explorar la investigación en LLMs.

“Hola, mundo” en DeepSeek

El 'Hola, mundo' de DeepSeek con Ollama: ejecutar el modelo DeepSeek Coder localmente a través de Ollama e interactuar con él para generar o completar código fuente.

📋 Copiar

# **Prerrequisito:** Asegurate de tener Ollama instalado y corriendo. (Ver guia de Ollama)
# En tu terminal, ejecuta:
ollama run deepseek-coder
# La primera vez, Ollama descargara el modelo DeepSeek Coder (version por defecto). Luego podras ingresar codigo o prompts de programacion.
# Ejemplo: Ingresa 'def fibonacci(' y presiona Enter.

Resultado:

Output

Ollama descargará (si es necesario) el modelo DeepSeek Coder y lo ejecutará localmente. Podrás interactuar con él ingresando código o preguntas relacionadas con programación para que genere o complete texto/código. La velocidad dependerá de tu hardware.

Comandos básicos

Familiarizarse con estos comandos es esencial para interactuar eficientemente con DeepSeek:

Instalar Ollama (para ejecutar DeepSeek localmente)
📋 Copiar
```
Visita https://ollama.com/download. Descarga el instalador para tu SO o usa el script para Linux:
`curl -fsSL https://ollama.com/install.sh | sh`
```
Ollama es una de las formas más sencillas de descargar y ejecutar modelos DeepSeek (y otros LLMs de código abierto) directamente en tu máquina.
Ejecutar un modelo DeepSeek con Ollama (descarga si no existe)
📋 Copiar
```
ollama run <nombre_modelo_deepseek>
```
Usa el comando `run` de Ollama seguido del nombre del modelo DeepSeek (ej: `deepseek-coder`, `deepseek-v2`). Ollama lo descargará del Library si no lo tienes y luego iniciará una sesión interactiva.
Consultar el repositorio oficial de DeepSeek AI en GitHub
📋 Copiar
```
Visita https://github.com/deepseek-ai
```
Accede al repositorio de código fuente de DeepSeek AI en GitHub, donde a menudo publican sus modelos, código de investigación y herramientas asociadas.
Probar DeepSeek Chat (interfaz web oficial)
📋 Copiar
```
Visita https://chat.deepseek.com
```
Interfaz web proporcionada por DeepSeek AI para interactuar directamente con algunos de sus modelos de lenguaje general (como DeepSeek-V2) a través de un chat en el navegador.
Descargar un modelo DeepSeek específico por tag con Ollama
📋 Copiar
```
ollama pull <nombre_modelo_deepseek>:<tag>
```
Descarga una variante específica de un modelo DeepSeek (ej: `deepseek-coder:33b`, `deepseek-v2:236b-instruct`, `deepseek-coder:6.7b-instruct-q4_0`) utilizando el comando `pull` de Ollama. Consulta los tags disponibles en ollama.com/library/deepseek.

Usar modelos DeepSeek con Hugging Face Transformers (Python)

📋 Copiar

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch # Asegurate de tener PyTorch instalado con soporte GPU si es posible

model_id = "deepseek-ai/DeepSeek-Coder-6.7B-instruct" # O "deepseek-ai/DeepSeek-V2", etc.

tokenizer = AutoTokenizer.from_pretrained(model_id)
# Cargar en GPU si es posible (requiere suficiente VRAM)
model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float16).to("cuda")

# Preparar input (puede requerir formato chat/instruct especifico)
chat = [{"role": "user", "content": "Escribe un codigo Python para sumar dos numeros."}]
inputs = tokenizer.apply_chat_template(chat, return_tensors="pt", add_generation_prompt=True).to(model.device)

# Generar texto
outputs = model.generate(inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Cómo cargar y ejecutar modelos DeepSeek desde el Hub de Hugging Face utilizando la librería `transformers` en Python. Requiere tener PyTorch instalado y hardware compatible (especialmente GPU).

Ver modelos DeepSeek disponibles en Hugging Face Hub
📋 Copiar
```
Visita https://huggingface.co/deepseek-ai
```
Explora el espacio de DeepSeek AI en el Hub de Hugging Face para encontrar diferentes modelos (Coder, V2, etc.), variantes, tamaños y formatos de pesos disponibles para descarga o uso con la librería `transformers`.
Ver modelos DeepSeek disponibles en Ollama Library
📋 Copiar
```
Visita https://ollama.com/library/deepseek
```
Consulta las versiones y cuantizaciones de los modelos DeepSeek que han sido adaptadas específicamente para funcionar con la plataforma Ollama, facilitando su descarga y ejecución local.

Conceptos Clave

Comprender estos conceptos fundamentales te ayudará a dominar DeepSeek de forma más organizada y eficiente:

DeepSeek AI (La Organización):

La entidad detrás de los modelos DeepSeek. Es una empresa de investigación de inteligencia artificial que se dedica al desarrollo de grandes modelos de IA, con un enfoque en la eficiencia, el rendimiento y la contribución a la comunidad mediante la liberación de modelos de código abierto.
Filosofía de Código Abierto:

El compromiso de DeepSeek AI de liberar modelos de IA potentes bajo licencias permisivas. Esto permite que investigadores, desarrolladores y empresas utilicen, estudien, modifiquen y construyan sobre sus modelos libremente, impulsando la innovación y la transparencia en el campo de la IA.
Familias de Modelos DeepSeek:

DeepSeek ha desarrollado distintas series de modelos con propósitos o arquitecturas específicas: **DeepSeek-Coder** (modelos de lenguaje optimizados para tareas de programación), **DeepSeek-MoE** (modelos experimentales basados en arquitectura Mixture of Experts, conocidos por su eficiencia potencial), y **DeepSeek-V2** (un modelo generalista más reciente que utiliza arquitectura MoE y busca un equilibrio entre rendimiento y eficiencia).
Fortalezas Clave (Código, Razonamiento, Eficiencia):

Los modelos DeepSeek son reconocidos por su **solidez en tareas de programación** (especialmente DeepSeek-Coder), sus buenas **capacidades de razonamiento** (evaluadas en benchmarks estándar) y su **eficiencia**, logrando rendimiento competitivo a menudo con menor costo computacional o con arquitecturas que prometen mayor escalabilidad eficiente (como MoE).
Tamaños de Modelo y Variantes:

Los modelos DeepSeek están disponibles en una variedad de tamaños de parámetros (desde pequeños de unos pocos miles de millones hasta muy grandes, como DeepSeek-V2 236B), lo que permite elegir un modelo adecuado para diferentes necesidades de rendimiento y hardware. También existen variantes 'Base' (para fine-tuning) e 'Instruct' o 'Chat' (optimizadas para seguir instrucciones y mantener conversaciones).
Acceso a Modelos (Hugging Face, Ollama, APIs):

Puedes acceder y utilizar los modelos DeepSeek de diferentes maneras. La forma más común es a través del **Hub de Hugging Face**, usando librerías como `transformers` en Python. También son populares en plataformas de ejecución local como **Ollama**, que simplifica su descarga y uso con una CLI y API local. DeepSeek AI también ofrece acceso a través de una **API propia** para algunos de sus modelos (como el que impulsa chat.deepseek.com), aunque la disponibilidad y documentación pueden variar.
Arquitectura Mixture of Experts (MoE):

Una arquitectura neuronal utilizada en modelos como DeepSeek-MoE y DeepSeek-V2. En lugar de usar toda la red neuronal para procesar cada parte del input, los modelos MoE activan solo un subconjunto ('expertos') de la red. Esto puede permitir que los modelos tengan un gran número total de parámetros pero requieran menos computación por token que los modelos densos de tamaño similar, resultando en mayor eficiencia y escalabilidad potencial.
Benchmarks y Evaluación:

Los modelos DeepSeek son rigurosamente evaluados en benchmarks estándar de la industria (MMLU, HumanEval, GSM8K, etc.) para medir su rendimiento en tareas de lenguaje general, razonamiento y código. Sus resultados en estos benchmarks son un indicador clave de sus capacidades y se utilizan para compararlos con otros modelos de código abierto y propietarios.
DeepSeek Chat (Interfaz Web):

Una interfaz web proporcionada por DeepSeek AI (chat.deepseek.com) que permite a cualquier usuario interactuar con sus modelos de lenguaje general (como DeepSeek-V2) de forma gratuita a través de un chat en el navegador. Es una forma sencilla de probar sus capacidades sin necesidad de configuración técnica.
Licenciamiento:

Los modelos de código abierto de DeepSeek se publican bajo licencias específicas que rigen su uso, modificación y distribución. Generalmente son licencias permisivas que permiten el uso (incluso comercial), pero es crucial leer y cumplir con los términos de la licencia de la versión específica del modelo que utilizas.
Fine-tuning:

Aunque DeepSeek AI ya proporciona variantes finetuneadas ('Instruct', 'Chat'), los modelos DeepSeek 'Base' (si están disponibles) o incluso las versiones finetuneadas pueden ser fine-tuneados adicionalmente en datasets personalizados para adaptarlos a un dominio de conocimiento muy específico, una tarea particular o un estilo de respuesta deseado. Esto requiere datasets etiquetados y recursos computacionales (GPU).
Tokenización y Context Window:

Como otros LLMs, los modelos DeepSeek procesan texto utilizando tokenizadores, dividiendo el texto en 'tokens' (palabras, sub-palabras, caracteres). Cada modelo tiene una 'ventana de contexto' máxima, que es la cantidad máxima de tokens (input + output) que puede manejar en una sola interacción. Los modelos DeepSeek suelen tener ventanas de contexto generosas.

Casos de uso

Algunos ejemplos de aplicaciones prácticas donde se utiliza DeepSeek:

Generación y compleción de código avanzado con DeepSeek-Coder:

Utilizar DeepSeek-Coder (posiblemente ejecutándolo localmente con Ollama o a través de una API) en entornos de desarrollo para obtener sugerencias de código de alta calidad, completar funciones complejas, generar fragmentos de código a partir de descripciones en lenguaje natural, o ayudar en tareas de refactorización y análisis estático de código.
Creación de contenido técnico y documentación con modelos DeepSeek generales:

Emplear modelos de lenguaje general de DeepSeek (como DeepSeek-V2) para generar borradores de documentación técnica, explicaciones de conceptos complejos, resúmenes de artículos de investigación, guías paso a paso o incluso código de ejemplo, aprovechando sus capacidades de razonamiento y generación de texto coherente y preciso.
Construir chatbots y asistentes de IA con sólidas capacidades de razonamiento:

Integrar modelos DeepSeek (especialmente las versiones 'Chat' o 'Instruct' de modelos como DeepSeek-V2 o MoE) en aplicaciones de chatbot para crear asistentes que puedan entender prompts complejos, realizar razonamientos lógicos y proporcionar respuestas informadas.
Integrar modelos DeepSeek en aplicaciones web, móviles o de escritorio vía API local (Ollama) o remota:

Utilizar la API local de Ollama (si ejecutas el modelo en la máquina del usuario o un servidor local) o cargar modelos desde Hugging Face Hub en tus propias aplicaciones para añadir funcionalidades de IA (procesamiento de lenguaje, generación de texto/código) sin depender de APIs de otros proveedores principales.
Experimentar y evaluar el rendimiento y la eficiencia de modelos con arquitectura Mixture of Experts (MoE):

Utilizar modelos DeepSeek basados en MoE (DeepSeek-MoE, DeepSeek-V2) para explorar y evaluar las ventajas de esta arquitectura en tu propio hardware, comparando su velocidad y eficiencia en inferencia con modelos densos de tamaño similar y comprendiendo su comportamiento.
Utilizar modelos DeepSeek 'Base' como punto de partida para fine-tuning en datasets personalizados:

Si DeepSeek AI libera versiones 'Base' de sus modelos (sin fine-tuning de instrucciones), puedes utilizarlos como base para entrenarlos adicionalmente en tus propios datos (ej: datos de tu empresa, un nicho específico) para crear un modelo altamente especializado para un dominio o tarea concreta.
Construir pipelines de RAG (Retrieval-Augmented Generation) utilizando modelos DeepSeek locales o remotos:

Combinar modelos DeepSeek (ejecutados localmente con Ollama o cargados desde Hugging Face) con tu propia base de conocimientos (documentos, bases de datos vectoriales) para construir sistemas que permitan a los LLMs generar respuestas más precisas y fundamentadas en información específica, útil para asistentes de conocimiento interno o herramientas de investigación.
Investigar y comparar modelos de código abierto de diferentes proveedores:

Utilizar la disponibilidad de modelos DeepSeek de código abierto para compararlos sistemáticamente con otros modelos similares (LLaMA, Mistral, Gemma, Code LLaMA) en términos de rendimiento en benchmarks, requisitos de hardware, calidad de respuesta en diferentes tareas y características únicas.

Consejos para Principiantes

Aquí tienes algunas recomendaciones para facilitar tus inicios en DeepSeek:

Busca y Descarga Modelos DeepSeek en Plataformas Populares como Ollama o Hugging Face:

Los modelos DeepSeek (Coder, V2, etc.) no se descargan directamente de un solo lugar. La forma más sencilla es usar **Ollama** (`ollama run deepseek-coder`, `ollama pull deepseek-v2`, etc.) o encontrarlos en el **Hub de Hugging Face** (`huggingface.co/deepseek-ai`).
Empieza Usando la CLI de Ollama o un Ejemplo Simple con Hugging Face Transformers:

La forma más rápida de probar un modelo DeepSeek es con `ollama run <nombre_modelo_deepseek>` en tu terminal (requiere Ollama instalado). Si prefieres programar, usa la librería `transformers` de Hugging Face en Python (requiere PyTorch y GPU compatible) con un ejemplo básico de carga y generación.
Entiende los Principales Tipos de Modelos DeepSeek: Coder vs Generales (V2, MoE):

DeepSeek-Coder está optimizado para código. Los modelos generales (DeepSeek-V2, DeepSeek-MoE) son para tareas de lenguaje natural. Elige el modelo adecuado para tu tarea. Las versiones con 'instruct' o 'chat' en el nombre están finetuneadas para seguir instrucciones o conversar.
Verifica los Requisitos de Hardware (RAM y VRAM de GPU) para Diferentes Tamaños de Modelo:

Los modelos DeepSeek vienen en varios tamaños. Modelos más grandes (33B, 236B) requieren mucha más RAM y VRAM de GPU para ejecutarse localmente. Consulta los requisitos en Ollama Library o en las páginas de Hugging Face para el modelo y tag específico que te interesa. La cuantización (`q4_0`, etc.) ayuda a reducir estos requisitos.
Explora la Variedad de Modelos DeepSeek y Sus Tags en Ollama Library y Hugging Face:

En ollama.com/library/deepseek o huggingface.co/deepseek-ai, verás diferentes variantes (tags) de cada modelo DeepSeek. Experimenta con modelos más pequeños o cuantizados si tu hardware es limitado. Lee las descripciones para entender las diferencias (ej: base vs instruct).
Prueba la Interfaz Web DeepSeek Chat para Ver Sus Capacidades sin Configuración:

Si solo quieres ver cómo responden los modelos generales de DeepSeek (como DeepSeek-V2) sin instalar nada, usa la interfaz web gratuita en chat.deepseek.com. Es una forma rápida de evaluar su calidad de respuesta.
Lee la Documentación o las 'Model Cards' para Detalles Técnicos:

Para entender cómo usar un modelo DeepSeek correctamente (ej: formato de prompt específico para versiones 'instruct'), consulta la documentación en Ollama, la página del modelo en Hugging Face (Model Card) o el repositorio oficial de DeepSeek AI en GitHub. Allí encontrarás detalles sobre entrenamiento, uso y benchmarks.
Considera Ollama para Ejecución Local, Hugging Face para Flexibilidad o Integración en Código:

Ollama es genial para ejecutar modelos localmente con una CLI y API sencillas. Hugging Face Transformers te da más control programático en Python y acceso a diferentes formatos de modelo y herramientas avanzadas (fine-tuning, evaluación). Elige la plataforma según tu objetivo.
Mira Benchmarks para Comparar Rendimiento con Otros LLMs de Código Abierto:

DeepSeek compite con modelos como LLaMA, Mistral, Code LLaMA, Gemma. Consulta benchmarks públicos (ej: Open LLM Leaderboard en Hugging Face) para ver cómo se comparan en diferentes tareas. Esto te ayudará a elegir el mejor modelo para tu caso de uso.

DeepSeek por Santiago Soñora

“Hola, mundo” en DeepSeek

Comandos básicos

Conceptos Clave

Casos de uso

Consejos para Principiantes

Herramientas relacionadas

Recursos útiles