El asistente de voz de Home Assistant se renueva: más idiomas, mejor rendimiento y funciones locales avanzadas
Controlar tu casa con la voz nunca ha sido tan privado y potente: Home Assistant da un gran paso con una actualización que mejora el rendimiento, amplía el soporte de idiomas y añade funciones avanzadas completamente locales y sin nube. A continuación, repasamos las novedades más destacadas del ecosistema.
ESPHome mejora el rendimiento y se vuelve más completo
La última versión de ESPHome (2025.5.0) ya incluye de forma nativa todas las funciones que antes solo estaban disponibles en la edición de vista previa del asistente de voz. Entre ellas:
- Activación por palabras clave (“Ok Nabu”, “Stop”) gestionada localmente.
- Reproducción de música de alta calidad con ducking (reducción de volumen automática al hablar).
- Anuncios simultáneos mientras suena música.
- Activación o desactivación dinámica de palabras clave según el contexto (por ejemplo, “Stop” solo durante alarmas o temporizadores).
Todo ello se ha optimizado para reducir el uso del procesador. En dispositivos como el Voice Preview Edition, el uso de CPU en tareas intensivas ha pasado del 72 % al 35 %. Incluso dispositivos más modestos, como el ATOM Echo, pueden ahora soportar reproducción multimedia y conversación local.
Crea tu propio asistente: hardware totalmente abierto
Para impulsar la creación de nuevos dispositivos compatibles, Home Assistant ha liberado los esquemáticos y diseños de placa del Voice Preview Edition. Ahora cualquier usuario puede fabricar su propio asistente personalizado, añadiendo sensores, pantallas o altavoces más potentes, partiendo de una base abierta y optimizada.

Speech-to-Phrase: más inteligente y en más idiomas
El sistema local de reconocimiento de voz Speech-to-Phrase, basado en frases predefinidas para maximizar la velocidad y la privacidad, recibe varias mejoras clave:
- Mejoras en la estructura de frases, que facilitan las contribuciones de la comunidad.
- Compatibilidad más precisa por dispositivo (por ejemplo, solo permite “pon luz roja” si la luz soporta cambio de color).
- Tratamiento correcto de artículos y nombres en idiomas complejos, como el francés (l’entrée, l’humidificateur, etc.).
Nuevos idiomas compatibles
Speech-to-Phrase pasa de 6 a 21 idiomas compatibles. A los ya existentes (inglés, español, francés, alemán, italiano y neerlandés) se suman:
Catalán, ruso, checo, griego, rumano, portugués, polaco, hindi, euskera, finés, mongol, esloveno, suajili, tailandés y turco.
Todos los modelos se basan en el trabajo open source del extinto proyecto Coqui STT, y podrán mejorarse con nuevos entrenamientos en función del feedback de la comunidad.

Piper: más voces y más idiomas en texto a voz local
Piper, el motor TTS local de Home Assistant, también se actualiza con nuevos idiomas y voces:
- Nuevos idiomas: persa (farsi), malayalam y nepalí.
- Nuevas voces:
- Neerlandés: Pim y Ronnie
- Portugués (Brasil): Cadu y Jeff
- Inglés: Sam (no binario), Reza
- Sueco, galés, letón, esloveno, eslovaco y más
En total, Piper ya ofrece soporte para 39 idiomas y dialectos, convirtiéndose en una de las soluciones TTS locales más completas del mundo.
Soporte de idioma por niveles: nube, local y local total
Para ayudar a los usuarios a elegir la configuración más adecuada, Home Assistant ha clasificado el soporte de idiomas en tres niveles:
Categoría | Descripción |
---|---|
Cloud | Basado en Home Assistant Cloud con servicios de Microsoft Azure. |
Local centrado | Usa Speech-to-Phrase + Piper. Ideal para hardware modesto. |
Local total | Usa Whisper + Piper. Permite comandos abiertos, pero requiere hardware más potente. |
Cada idioma del asistente de voz recibe una puntuación del 0 al 3 en cada nivel, en función del grado de compatibilidad. Estas puntuaciones ya se muestran tanto en el asistente de configuración de voz como en la página de idiomas soportados.
Assist se vuelve más conversacional
El asistente de voz Assist también gana nuevas capacidades gracias a la integración con modelos LLM (Large Language Models):
- Conversaciones continuas: ya no es necesario repetir “Ok Nabu” tras cada interacción.
- Iniciar conversaciones desde automatizaciones o paneles mediante
start_conversation
. - Nuevo intent de búsqueda y reproducción de medios, compatible con Music Assistant y comandos como:
“Pon música relajante en el salón.”
Próximas funciones en desarrollo:
- Confirmaciones críticas: para operaciones sensibles como desbloquear puertas.
- Solicitar parámetros faltantes: por ejemplo, preguntar “¿cuánto tiempo?” si pides un temporizador.
- Conversaciones personalizadas: creación de diálogos locales adaptados a rutinas o situaciones específicas.
Estas funciones aún están en fase experimental y podrían tardar en llegar a la versión estable.

Conclusión
Esta gran actualización del asistente de voz de Home Assistant consolida su apuesta por un control inteligente más privado, flexible y sin dependencia de la nube. Las mejoras en rendimiento, compatibilidad de idiomas y posibilidades de personalización lo convierten en una solución ideal tanto para entusiastas como para usuarios avanzados.
Con esta actualización, Home Assistant se posiciona como uno de los asistentes de voz más avanzados del mercado, ideal para quienes buscan un sistema domótico sin nube, en español y compatible con ESPHome o Raspberry Pi.
También podría interesarte SwitchBot se certifica oficialmente con Home Assistant: primeros dispositivos «Works with Home Assistant» ya disponibles