Tutorial de OpenClaw – Capítulo 6: Elegir y configurar el modelo de IA

📘 Esta serie es la versión gratuita de mi libro. Si quieres tenerlo todo ordenado y de principio a fin —22 capítulos, dos proyectos completos y temas que no están en el blog (Gateway, VPS, seguridad…)— te lo dejo aquí: OpenClaw: Tu Asistente Personal con IA.

En el capítulo 2 configuraste tu primer modelo de IA para que OpenClaw pudiera funcionar. Ahora que ya lo has probado y tienes una idea de cómo funciona tu asistente, es el momento de profundizar: ¿estás usando el modelo adecuado? ¿Podrías gastar menos? ¿Necesitas más calidad? En este capítulo vamos a ver todas las opciones disponibles para que puedas tomar la mejor decisión.

Recordatorio rápido: ¿qué es un modelo de IA?

Un modelo de IA es el «cerebro» de tu asistente. OpenClaw en sí no tiene inteligencia propia: envía tus mensajes a un modelo de IA externo que genera la respuesta. Tú eliges qué modelo usar, y puedes cambiarlo en cualquier momento.

Las tres rutas principales

Antes de ver todos los proveedores en detalle, déjame presentarte las tres rutas principales que tienes para usar OpenClaw. Cada una tiene sus ventajas:

RUTA 1: API en la nube (RECOMENDADA para empezar)

Mejor para: La mayoría de usuarios que quieren resultados rápidos sin complicaciones de hardware.

  • Rápido: Respuestas en segundos
  • Sin requisitos de hardware: Funciona en cualquier ordenador
  • Válido para todos los capítulos del libro (1-14)
  • Coste variable: Depende del proveedor, el modelo y la intensidad de uso. Consulta siempre los precios actualizados en la web de cada proveedor antes de elegir, ya que cambian con frecuencia.
  • ⚠️ Menos privado: Tus datos pasan por los servidores del proveedor

Opciones destacadas (de más barato a más caro al momento de escribir este libro):

  • DeepSeek → La mejor relación calidad-precio a día de hoy
  • Gemini → De Google, coste bajo y buena calidad
  • Claude Sonnet → Excelente para agentes inteligentes, precio medio
  • GPT-4o → Muy popular y confiable, precio medio
  • Claude Opus / GPT-4.5 → Los más potentes y los más caros

RUTA 2: Modelo local con Ollama (32GB+ RAM o tarjeta gráfica dedicada)

Mejor para: Usuarios que priorizan la privacidad y tienen un ordenador con suficiente memoria (RAM o VRAM de tarjeta gráfica).

  • 100% privado: Tus datos NUNCA salen de tu ordenador
  • Realmente gratuito: Cero costos recurrentes (solo electricidad)
  • Válido para todos los capítulos del libro (1-14)
  • ⚠️ Requiere mínimo 32GB de RAM, o bien una tarjeta gráfica dedicada con 8GB+ de VRAM (ver sección «El papel de la tarjeta gráfica» más abajo)

Modelo recomendado: qwen2.5:14b para 32GB de RAM o GPU con 12GB+ VRAM. Modelos de 7-8B parámetros para GPUs con 8GB VRAM.

⚠️ IMPORTANTE: OpenClaw necesita un mínimo de 16.000 tokens de contexto. Con solo 16 GB de RAM y sin tarjeta gráfica dedicada, los modelos locales darán errores de memoria o tardarán demasiado. Necesitas al menos 32 GB de RAM o una tarjeta gráfica con suficiente VRAM para usar modelos locales con OpenClaw de forma fiable.

RUTA 3: Modelo local profesional (64GB+ RAM o GPU potente)

Mejor para: Usuarios con hardware potente que quieren lo mejor de ambos mundos.

  • 100% privado
  • Rápido: Comparable a APIs en la nube
  • Válido para todo, incluso uso interactivo intensivo
  • ⚠️ Requiere hardware potente (64GB+ RAM o GPU con 16GB+ VRAM como una RTX 4080/4090)

Modelos recomendados: llama3:70b, qwen2.5:70b

Comparativa completa de proveedores

Ahora vamos a ver cada proveedor en detalle para que puedas elegir según tus necesidades.

DeepSeek — La mejor relación calidad-precio

DeepSeek es la opción que recomendamos a lo largo de este libro para empezar. Esta empresa ofrece modelos de excelente calidad a precios significativamente más bajos que la mayoría de competidores. Su modelo destaca especialmente en programación, análisis de datos y automatizaciones.

Un apunte importante sobre costes: Aunque DeepSeek es el proveedor más barato de los principales, ten en cuenta que OpenClaw consume bastantes más tokens de lo que podrías esperar. OpenClaw envía un «prompt de sistema» grande (más de 16.000 tokens) con cada conversación para gestionar sus herramientas, skills y memoria. Esto significa que cada interacción consume más de lo que consumiría una pregunta directa a la API. Consulta los precios actualizados en platform.deepseek.com y vigila tu consumo las primeras semanas para hacerte una idea de lo que gastarás según tu uso.

¿Es bueno? Sí. En las pruebas reales realizadas para este libro, DeepSeek ha demostrado ser excelente para automatización: clasificación de mensajes, redacción de respuestas profesionales, análisis de documentos, transcripción de audios y generación de código.

Configuración:

# Registro en platform.deepseek.com
# Después:
openclaw models set deepseek/deepseek-chat

# Configura la variable de entorno:
export DEEPSEEK_API_KEY="tu-clave-aqui"

Nota de privacidad: Tus datos pasan por servidores de DeepSeek. Si manejas información sensible, considera usar un modelo local con Ollama.

Google Gemini

Gemini es la alternativa de Google. Aunque anuncia un plan gratuito, en la práctica es probable que te pida activar la facturación para usar la API. El coste es bajo y sus modelos más recientes ofrecen una calidad muy buena para las tareas de OpenClaw.

Modelos disponibles:

  • Gemini 2.5 Flash — Rápido y capaz. Perfecto para el 95% de las tareas de OpenClaw.
  • Gemini 2.5 Pro — Más potente, para razonamiento profundo o tareas complejas.

Configuración:

# Registro en aistudio.google.com para obtener tu clave API
# Después:
openclaw models set google/gemini-2.5-flash

# Configura la variable de entorno:
export GEMINI_API_KEY="AIzaSy-tu-clave"

Consulta los precios actualizados en aistudio.google.com.

Anthropic (Claude) — El mejor para agentes

Claude es, en nuestra opinión, el mejor modelo para OpenClaw cuando el presupuesto lo permite. Es el que sigue instrucciones con más precisión y el que menos errores comete cuando tiene que usar herramientas (buscar en internet, crear archivos, ejecutar comandos…).

Modelos disponibles:

  • Claude Opus — El más potente e inteligente. También el más caro.
  • Claude Sonnet — El equilibrio entre calidad y precio. Muy capaz para el 95% de las tareas.
  • Claude Haiku — El más rápido y barato. Ideal para tareas sencillas.

Nota sobre Claude Pro/Max: Si ya pagas una suscripción a claude.ai (Pro, Max, etc.), debes saber que eso NO incluye acceso a la API. La suscripción es para usar la web/app de Claude. La API se paga aparte, por uso, desde console.anthropic.com. Son productos separados.

Consulta los precios actualizados en console.anthropic.com.

OpenAI (GPT) — El más popular

GPT tiene la comunidad más grande y la mayor cantidad de tutoriales y ejemplos disponibles. Si ya tienes experiencia con ChatGPT, te sentirás en casa.

Modelos disponibles:

  • GPT-4.5 — El modelo premium. Excelente calidad, el más caro.
  • GPT-4o — El modelo equilibrado. Muy buena calidad a precio medio.
  • GPT-4o mini — El modelo económico. Sorprendentemente capaz para su precio.

Igual que con Claude: la suscripción a ChatGPT Plus/Pro NO incluye acceso a la API.

Consulta los precios actualizados en platform.openai.com.

Otros proveedores

OpenClaw soporta muchos más proveedores:

  • xAI (Grok) — El modelo de Elon Musk
  • Mistral — Empresa francesa con modelos muy competitivos
  • Groq — Conocido por su velocidad extrema
  • OpenRouter — Acceso a múltiples modelos con una sola cuenta
  • Hugging Face — Miles de modelos open source

Ollama — Modelos locales (100% privado)

Si quieres total privacidad y coste cero real, puedes ejecutar modelos de IA directamente en tu ordenador con Ollama. Tus datos nunca salen de tu máquina. Esta es la única opción verdaderamente gratuita (los proveedores en la nube siempre tienen algún coste, por bajo que sea).

Verificado empíricamente: qwen2.5:14b funciona para TODOS los capítulos del libro, incluidos los proyectos avanzados (13-14).

⚠️ Sobre la ventana de contexto y la memoria: OpenClaw necesita un mínimo de 16.000 tokens de contexto para funcionar como agente. Esto es mucho más de lo que Ollama usa por defecto. Cuando ejecutas ollama run directamente, funciona en 16GB porque usa un contexto más pequeño. Pero OpenClaw necesita mínimo 16.000 tokens, lo que aumenta mucho el uso de memoria (ya sea RAM del sistema o VRAM de la tarjeta gráfica). Resultado: Con 16 GB de RAM y sin tarjeta gráfica dedicada, los modelos locales darán errores de memoria o tardarán demasiado.

El papel de la tarjeta gráfica (GPU)

Este es un punto que mucha gente desconoce: las tarjetas gráficas dedicadas pueden cambiar completamente la experiencia con modelos locales.

Cuando tu ordenador no tiene tarjeta gráfica dedicada (como la mayoría de portátiles), el modelo de IA se carga completamente en la RAM del sistema y se procesa con el procesador (CPU). Esto es lento y consume mucha memoria.

Pero si tu ordenador tiene una tarjeta gráfica dedicada (NVIDIA o AMD), Ollama la detecta automáticamente y carga el modelo en la memoria de la tarjeta gráfica (VRAM) en vez de en la RAM del sistema. La diferencia es brutal:

  • Sin tarjeta gráfica (solo CPU): Un modelo de 7B genera entre 5-10 palabras por segundo. Lento pero funcional para automatización.
  • Con tarjeta gráfica dedicada: El mismo modelo genera entre 40-80 palabras por segundo. Respuestas casi instantáneas, comparable a las APIs en la nube.

Es decir, una tarjeta gráfica puede hacer que un modelo local funcione entre 5 y 15 veces más rápido. No necesitas configurar nada: Ollama la usa automáticamente si la detecta.

¿Cuánta VRAM necesito? El contexto grande de OpenClaw (16.000 tokens) también consume VRAM, así que necesitas algo más de lo que indican las guías generales de Ollama:

  • 8GB de VRAM (ej. RTX 3060 Ti, RTX 4060): Suficiente para modelos de 7-8B parámetros con el contexto de 16K de OpenClaw. Funciona bien para los capítulos básicos e intermedios del libro.
  • 12GB de VRAM (ej. RTX 3060 12GB, RTX 4070): Ideal. Puede cargar qwen2.5:14b completamente en la tarjeta. Funciona para todos los capítulos del libro con buen rendimiento.
  • 16GB+ de VRAM (ej. RTX 4080, RTX 4090): Modelos grandes con rendimiento comparable a APIs en la nube.

¿Y si el modelo no cabe entero en la VRAM? Ollama es inteligente: si tu tarjeta tiene 8GB de VRAM pero el modelo necesita 10GB, Ollama divide el trabajo automáticamente. Carga lo que puede en la tarjeta gráfica (rápido) y el resto en la RAM del sistema (más lento). El resultado es más rápido que sin tarjeta gráfica, aunque no tan rápido como si cupiera todo en la VRAM.

En resumen: Si tienes un ordenador de sobremesa con 16GB de RAM y una tarjeta gráfica NVIDIA con 8-12GB de VRAM, puedes usar modelos locales con OpenClaw sin problemas. Es una alternativa real a tener 32GB de RAM.

Nota: Las tarjetas gráficas integradas (Intel HD, Intel Iris, AMD Radeon integrada) que vienen en la mayoría de portátiles no cuentan. Comparten la RAM del sistema y no ofrecen la aceleración que necesitamos. Hablamos de tarjetas gráficas dedicadas con su propia memoria (VRAM).

Requisitos de hardware

Orientación según tu hardware:

Si NO tienes tarjeta gráfica dedicada (portátiles, equipos de oficina):

  • 16GB RAM o menos → No recomendado con OpenClaw. Usa una API en la nube.
  • 32GB RAM (Ryzen 5000+, MacBook M1/M2) → qwen2.5:14b, buen rendimiento para todo uso
  • 64GB+ RAM → qwen2.5:70b o llama3:70b, rendimiento comparable a las APIs en la nube

Si TIENES tarjeta gráfica dedicada (sobremesas gaming, workstations):

  • GPU con 8GB VRAM (RTX 3060 Ti, RTX 4060) → Modelos de 7-8B parámetros. Rápido y funcional.
  • GPU con 12GB VRAM (RTX 3060 12GB, RTX 4070) → qwen2.5:14b completo en GPU. Excelente rendimiento.
  • GPU con 16GB+ VRAM (RTX 4080, RTX 4090) → Modelos grandes, rendimiento comparable a APIs en la nube.

Nota sobre MacBooks con Apple Silicon (M1, M2, M3, M4): Los Mac con chip Apple son un caso especial. Su memoria es «unificada» (compartida entre CPU y GPU), y Ollama aprovecha el acelerador neural del chip. Un MacBook con 16GB de memoria unificada rinde significativamente mejor que un PC con 16GB de RAM y sin tarjeta gráfica. Si tienes un Mac con Apple Silicon, prueba: es posible que te funcione bien incluso con solo 16GB.

Instalación paso a paso

1. Instala Ollama

Descarga desde ollama.com (disponible para macOS, Linux y Windows).

2. Descarga el modelo recomendado

ollama pull qwen2.5:14b

Nota: El modelo ocupa unos 9GB, la descarga puede tardar 10-20 minutos dependiendo de tu conexión. Si tu tarjeta gráfica tiene menos de 12GB de VRAM, usa un modelo más pequeño: ollama pull qwen2.5:7b (4.7GB).

3. Configura OpenClaw para usar Ollama

openclaw models set ollama/qwen2.5:14b

4. (Opcional) Prueba el modelo directamente

ollama run qwen2.5:14b "Escribe un email profesional confirmando una reunión"

Importante sobre rendimiento

¿La velocidad es un problema? NO para los casos de uso de este libro.

Los capítulos avanzados (13-14) tratan sobre automatización en segundo plano:

  • Procesar emails cada mañana → Tarda unos minutos → Mientras desayunas
  • Generar informe diario → Tarda 15 min → Mientras trabajas en otra cosa
  • Respuestas automáticas → Tarda 5 min → Se envían cuando terminan

La calidad importa, la velocidad no tanto. Y la calidad de qwen2.5:14b es excelente: clasificaciones correctas, respuestas profesionales, razonamiento sólido. Verificado empíricamente.

Dicho esto, si tienes tarjeta gráfica dedicada, la velocidad deja de ser un problema por completo: las respuestas serán casi instantáneas.

Otros modelos para Ollama

Si quieres experimentar con otros modelos:

# Modelos para GPU con 8GB VRAM o 32GB RAM
ollama pull qwen2.5:7b
ollama pull llama3.1:8b

# Modelos para GPU con 12GB+ VRAM o 32GB RAM
ollama pull qwen2.5:14b
ollama pull llama3.1:14b
ollama pull mistral-nemo:12b

# Modelos grandes (requieren GPU con 16GB+ VRAM o 64GB+ RAM)
ollama pull qwen2.5:32b
ollama pull llama3.1:70b

Para ver todos los modelos disponibles, visita ollama.com/library

Tabla resumen: ¿cuál elijo?

Mi recomendación según tu situación:

  • «Quiero empezar rápido y sin complicaciones»DeepSeek o Gemini
  • «Quiero lo mejor sin importar el precio»Claude Sonnet o Claude Opus
  • «No quiero que mis datos salgan de mi ordenador»Ollama (necesitas 32GB+ RAM o tarjeta gráfica dedicada con 8GB+ VRAM)
  • «Tengo un PC de sobremesa con tarjeta gráfica»Ollama. Aunque tengas solo 16GB de RAM, la VRAM de tu tarjeta gráfica puede ser suficiente.
  • «Tengo un portátil con 16GB de RAM y sin gráfica dedicada» → Usa una API en la nube. Los modelos locales no funcionarán bien con OpenClaw en tu configuración.
  • «Tengo un Mac con chip M1/M2/M3/M4» → Prueba Ollama. La memoria unificada de Apple Silicon rinde mejor que un PC equivalente. Con 16GB puede funcionar.
  • «Quiero gastar lo mínimo posible» → Lee la sección siguiente sobre OpenRouter

Cambiar de modelo

Cambiar de modelo es muy sencillo. Desde la terminal:

openclaw models set deepseek/deepseek-chat

Para ver todos los modelos disponibles:

openclaw models list

También puedes cambiar el modelo editando directamente ~/.openclaw/openclaw.json.

Modelos de reserva (fallbacks)

Una función muy útil de OpenClaw es la posibilidad de configurar modelos de reserva. Si tu modelo principal no está disponible (por mantenimiento o porque se agotó tu saldo), OpenClaw usa automáticamente el siguiente de la lista:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "deepseek/deepseek-chat",
        "fallbacks": ["google/gemini-2.5-flash", "anthropic/claude-sonnet-4-6"]
      }
    }
  }
}

En este ejemplo, si DeepSeek no funciona, prueba con Gemini. Si Gemini tampoco, usa Claude Sonnet. Es como tener un plan B y un plan C. Para que funcione, necesitas tener configuradas las claves API de todos los proveedores.

Configurar claves API manualmente

Si quieres añadir claves de proveedores adicionales (para tener fallbacks, por ejemplo), puedes hacerlo configurando variables de entorno:

En macOS/Linux

Añade estas líneas al final de tu archivo ~/.bashrc o ~/.zshrc:

export DEEPSEEK_API_KEY="sk-tu-clave"
export GEMINI_API_KEY="AIzaSy-tu-clave"
export ANTHROPIC_API_KEY="sk-ant-api03-tu-clave"
export OPENAI_API_KEY="sk-proj-tu-clave"

Después, reinicia la terminal o ejecuta source ~/.zshrc.

En Windows (PowerShell)

[System.Environment]::SetEnvironmentVariable('DEEPSEEK_API_KEY', 'sk-tu-clave', 'User')
[System.Environment]::SetEnvironmentVariable('GEMINI_API_KEY', 'AIzaSy-tu-clave', 'User')
[System.Environment]::SetEnvironmentVariable('ANTHROPIC_API_KEY', 'sk-ant-api03-tu-clave', 'User')
[System.Environment]::SetEnvironmentVariable('OPENAI_API_KEY', 'sk-proj-tu-clave', 'User')

Rotación automática de claves

Si tienes varias claves API del mismo proveedor (por ejemplo, varias cuentas), OpenClaw puede rotar entre ellas automáticamente si una alcanza su límite:

export OPENAI_API_KEYS="sk-clave-1;sk-clave-2;sk-clave-3"

Separa las claves con punto y coma. Cuando una devuelve error 429 (límite alcanzado), OpenClaw pasa a la siguiente.

Modelos especializados

OpenClaw permite configurar modelos diferentes para tareas específicas:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "deepseek/deepseek-chat"
      },
      "imageModel": {
        "primary": "openai/gpt-4o"
      },
      "pdfModel": {
        "primary": "google/gemini-2.5-pro"
      }
    }
  }
}

Con esta configuración, el modelo general es DeepSeek, pero para analizar imágenes usa GPT-4o (que tiene muy buena visión) y para PDFs usa Gemini 2.5 Pro (más potente para documentos largos). Esto te permite optimizar la calidad según el tipo de tarea.

Un apunte sobre los costes de las APIs en la nube

Es importante que entiendas cómo se cobra el uso de APIs de IA, porque puede haber sorpresas si no lo tienes en cuenta.

Las APIs cobran por tokens (unidades de texto procesadas). Cada vez que le envías un mensaje a tu asistente, OpenClaw envía al modelo no solo tu mensaje, sino también un prompt de sistema grande (más de 16.000 tokens) con toda la información que necesita para funcionar: sus herramientas, sus skills, la memoria, el contexto de la conversación… Esto significa que cada interacción consume significativamente más tokens de lo que consumiría una pregunta directa al chatbot del proveedor.

Nuestra recomendación:

  • Consulta siempre los precios actualizados en la web de cada proveedor. Los precios de la IA cambian constantemente (generalmente a la baja, pero no siempre).
  • Vigila tu consumo las primeras semanas para hacerte una idea del gasto real según tu uso.
  • Configura alertas de gasto en la web del proveedor si las ofrece (DeepSeek, OpenAI y Anthropic lo permiten).
  • Si quieres coste cero garantizado, usa un modelo local con Ollama (requiere 32GB+ RAM o tarjeta gráfica dedicada).

Consejo para empezar

No te compliques demasiado eligiendo modelo. Empieza con lo que ya tengas configurado (probablemente DeepSeek o Gemini del capítulo 2) y ve probando. Lo bueno de OpenClaw es que cambiar de modelo es un solo comando. Si no te convence uno, prueba otro.

Recuerda: Puedes cambiar de modelo en cualquier momento con openclaw models set proveedor/modelo.

¿Sabías que puedes usar OpenClaw con modelos gratuitos?

Existe un servicio llamado OpenRouter que te da acceso a decenas de modelos de IA gratuitos — incluyendo DeepSeek, Llama y Qwen — sin necesidad de tarjeta de crédito. Y cuando necesites más potencia, sus modelos de pago son incluso más baratos que usar los proveedores directamente.

Con OpenRouter podrías usar OpenClaw a diario sin gastar nada. Sí, has leído bien: cero euros.

En los capítulos exclusivos del libro explicamos paso a paso cómo configurar OpenRouter con OpenClaw, qué modelos gratuitos elegir según tu caso de uso y las mejores estrategias para minimizar costes. Si te interesa exprimir al máximo tu asistente gastando lo mínimo (o nada), no te lo pierdas.


OpenClaw: Tu Asistente Personal con IA — portada del libro

¿Te está gustando el tutorial? Tienes el libro completo en Amazon

OpenClaw: Tu Asistente Personal con IA (248 páginas) incluye 22 capítulos, 8 de ellos exclusivos del libro (no publicados en el blog):

  • Multi-agente y configuración avanzada
  • Automatizaciones del mundo real: facturas, redes sociales y control de gastos
  • OpenRouter: modelos gratis y ultra-baratos
  • Llevar OpenClaw a un VPS: tu asistente en producción 24/7
  • Prompt injection y seguridad avanzada
  • …y 3 capítulos más sobre Gateway, Hooks/WebHooks y estrategia de modelos

Disponible en tapa blanda, tapa dura y edición Kindle.

Un saludo, y si aún no lo has hecho no olvides suscribirte a mi blog para no perderte los próximos posts  :-),

También puedes seguirme en Twitter en ‎@revi_apps y no olvides que me ayudas mucho si compartes este post en las redes sociales.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Scroll al inicio