OpenClaw con IA local
Pruebas reales de IA local con OpenClaw, Ollama ROCm y varios modelos en el Beelink SER9 Pro: qué funciona, qué no y dónde están los límites.
La pregunta de este vídeo no era si un mini PC puede abrir un chat con un modelo local y pedirle que cuente un chiste. Eso ya lo hago yo :D
Lo que quería comprobar era algo bastante más útil: qué puede hacer una IA local cuando le pides tareas reales. No solo en un chat, sino trabajar como agente: leer contexto, tocar archivos, conectarse a servicios, revisar sistemas, generar informes o intentar resolver problemas completos.
Para probarlo usé el Beelink SER9 Pro, un mini PC con AMD Ryzen AI 9 HX 370, Radeon 890M integrada, NPU de AMD, 32 GB de RAM y 1 TB de SSD. Todo lo ejecuté sobre Proxmox, levantando distintos LXC para probar backends, modelos y agentes.




Muestra rápida de resultados
Para que se entienda el tipo de pruebas que hice, aquí va una muestra concreta: pedirle al agente que lea Home Assistant y sugiera automatizaciones útiles usando los dispositivos reales de la casa.
| Modelo | Backend | Resultado | Tiempo | Lectura rápida |
|---|---|---|---|---|
| Qwen3.5 9B | Ollama ROCm | ❌ | 10m 01s | Muy buen equilibrio general, pero esta tarea tenía demasiado contexto. |
| Qwen3-Coder 30B A3B | Ollama ROCm | ⚠️ | 8m 17s | Leyó entidades reales y propuso ideas, pero la calidad fue irregular. |
| Mistral Small 3.2 | Ollama ROCm | ✅ | 11m 07s | Consiguió la tarea, aunque fue lento y con avisos de carga. |
| GLM-4.7 Flash | Ollama ROCm | ⚠️ | 11m 09s | Generó sugerencias usando entidades reales, pero el resultado quedó mixto. |
Esta tabla no pretende elegir un ganador absoluto. Sirve para ver rápido la idea central: en IA local no basta con que el modelo responda rápido; importa si entiende la tarea, usa bien las herramientas y termina con un resultado comprobable.
👉🏼👉🏼 Tablas y pruebas completas en el foro: Beelink SER9 Pro para IA local y agentes en el foro
La idea: no medir solo tokens por segundo
Cuando se habla de IA local es muy fácil acabar mirando solo tokens por segundo. Es una métrica útil, pero no responde a la pregunta importante para un usuario normal.
La pregunta real es:
- ¿La tarea se completa?
- ¿El resultado es correcto?
- ¿Cuánto tarda?
- ¿Se puede conectar a un agente como OpenClaw de forma razonable?
Por eso las pruebas no fueron solo prompts simples. Probé tareas como arreglar código, trabajar con contexto largo, generar informes, conectarse a Home Assistant, listar automatizaciones, revisar entidades problemáticas, clasificar documentos, analizar Proxmox y resolver peticiones que dejaron usuarios en el foro.
Cómo funciona la pila de IA local
Para entender los resultados conviene separar varias capas:

- Modelo: Qwen, Gemma, GPT-OSS, etc. Cada modelo tiene capacidades y tamaño distinto.
- Motor: Ollama, llama.cpp, Lemonade, LM Studio y otros.
- Backend de aceleración: ROCm, Vulkan, CUDA, Metal, DirectML, etc.
- Hardware: GPU AMD, GPU NVIDIA, Apple Silicon, NPU, CPU.
En este equipo, la ruta que mejor resultado me dio para OpenClaw fue Ollama usando ROCm sobre la GPU AMD. También probé Vulkan, Lemonade y FastFlowLM con la NPU, pero para este caso concreto no fueron la recomendación principal.
GPU, NPU y el marketing de la IA
Una parte importante de la prueba fue separar GPU y NPU. La NPU no es una GPU pequeña que puedas usar igual. No se puede usar cualquier modelo de Ollama y ejecutarlo directamente ahí.
Para usar la NPU necesitas un backend compatible y modelos preparados para ese camino. FastFlowLM permite hacer pruebas con NPU, pero en mis pruebas no supuso una mejora clara para tareas agénticas con OpenClaw.
El equipo como mini PC
Antes de centrarme en IA, también hice algunas mediciones básicas del equipo:

- Consumo en reposo aproximado: 14 W.
- Temperatura de CPU en reposo: 33-34,5 ºC.

- Consumo bajo estrés de CPU: alrededor de 74 W.
- Temperatura bajo estrés: alrededor de 63 ºC.
- Geekbench 6: unos 2895 puntos en single-core y casi 15000 en multi-core. Enlace a mi resultado
- Ruido: prácticamente ruido ambiente incluso bajo carga de CPU. El sistema de refrigeración está perfectamente resuelto para que sea un equipo totalmente silencioso
Como mini PC para homelab, Proxmox y pruebas de IA local, el punto fuerte es que tiene bastante CPU, una iGPU AMD interesante y un consumo razonable para tenerlo trabajando de forma continua.
La combinación que usé
Después de muchas pruebas, la combinación más estable y práctica fue:
- Agente: OpenClaw
- Motor: Ollama
- Aceleración: ROCm
- Modelo: Qwen3.5 9B
No fue siempre la combinación más espectacular sobre el papel, pero sí la más equilibrada para este equipo: entra bien, se mueve de forma razonable y completó muchas tareas reales sin exigir una configuración absurda.
Con esa combinación logró hacer tareas como:
- ✅ Arreglar código con instrucciones guiadas.
- ✅ Trabajar con contexto largo de unas 20.000 tokens.
- ✅ Buscar noticias de IA del día y resumirlas.
- ✅ Generar informes y convertirlos en PDF.
- ✅ Conectarse a Home Assistant.
- ✅ Listar automatizaciones.
- ✅ Detectar entidades problemáticas.
- ✅ Apagar luces desde Home Assistant.
También hubo tareas donde empezó a romper: sugerir automatizaciones complejas con mucho contexto, crear automatizaciones completas sin ayuda, resolver ciertas tareas de programación más grandes o generar integraciones completas cuando el alcance crecía demasiado.
Modelos grandes: más capacidad, más paciencia
También probé modelos más grandes o cuantizados, como variantes de Qwen3 Coder de 30B y Qwen3.6 de 27B. Algunos tardan bastante más, pero en ciertas tareas consiguen cosas que modelos más pequeños no hacen.
Ahí está el equilibrio: un modelo más pequeño puede responder antes, pero no necesariamente resolver mejor. Un modelo más grande puede acertar más en algunas tareas, pero el tiempo de espera puede hacer que deje de ser práctico para el día a día.
Por eso en las tablas del foro no solo apunto velocidad. También marco si la tarea se completó o no. Para mí, esa es la métrica que realmente importa cuando hablamos de agentes.
Veredicto
Puede una IA local correr OpenClaw en un Beelink SER9 Pro? Sí. Y no solo para jugar con prompts. Puede hacer tareas reales y puede ser útil.
Puede sustituir a un modelo cloud potente o a una persona para tareas serias y largas? No todavía. Al menos no de forma general. Cuando la tarea crece, cuando hay demasiado contexto o cuando tiene que tomar muchas decisiones encadenadas, los límites aparecen rápido.
Mi resumen: el Beelink SER9 Pro es una máquina muy interesante para empezar a probar agentes locales, automatizar tareas concretas y entender qué se puede hacer con IA local en casa. La combinación más recomendable ahora mismo sigue siendo OpenClaw + Ollama ROCm + Qwen3.5 9B.
La IA local ya ayuda. Pero todavía conviene saber muy bien dónde está la línea entre una tarea viable y una tarea que va a necesitar un modelo más grande, más memoria o directamente un servicio en la nube.
¿Quieres que pruebe algún modelo o tarea?
He dejado un hilo en el foro con las tablas, modelos, tiempos y resultados. Si quieres que pruebe un modelo concreto o una tarea específica, puedes dejarlo como respuesta allí.
Mis agentes de IA están vigilando los comentarios y pueden ejecutar nuevas pruebas directamente en el SER9 Pro.
👉🏼👉🏼 Pedir nuevas pruebas en el foro
Video en Youtube
🚀 ¿Quieres ir un paso más allá? ¡Hazte miembro!
Apoya mi trabajo y accede a ventajas exclusivas uniéndote a mi membresía desde solo 4€/mes con pago anual:
- ✅ Mira vídeos antes de su publicación.
- ✅ Accede a sorteos mensuales.
- ⛔ Grupo privado exclusivo en Telegram.
- 🛍️ Descuentos exclusivos para miembros
- 🤯 Servidor privado de copias de seguridad (Proxmox Backup Server).
- 🗳️ Vota para elegir próximos vídeos y cursos.
🔥 Solo 48€/año (¡34% de descuento vs pago mensual!)
— JC