El asistente de voz de Home Assistant se renueva: más idiomas, mejor rendimiento y funciones locales avanzadas

Controlar tu casa con la voz nunca ha sido tan privado y potente: Home Assistant da un gran paso con una actualización que mejora el rendimiento, amplía el soporte de idiomas y añade funciones avanzadas completamente locales y sin nube. A continuación, repasamos las novedades más destacadas del ecosistema.


ESPHome mejora el rendimiento y se vuelve más completo

La última versión de ESPHome (2025.5.0) ya incluye de forma nativa todas las funciones que antes solo estaban disponibles en la edición de vista previa del asistente de voz. Entre ellas:

  • Activación por palabras clave (“Ok Nabu”, “Stop”) gestionada localmente.
  • Reproducción de música de alta calidad con ducking (reducción de volumen automática al hablar).
  • Anuncios simultáneos mientras suena música.
  • Activación o desactivación dinámica de palabras clave según el contexto (por ejemplo, “Stop” solo durante alarmas o temporizadores).

Todo ello se ha optimizado para reducir el uso del procesador. En dispositivos como el Voice Preview Edition, el uso de CPU en tareas intensivas ha pasado del 72 % al 35 %. Incluso dispositivos más modestos, como el ATOM Echo, pueden ahora soportar reproducción multimedia y conversación local.


Crea tu propio asistente: hardware totalmente abierto

Para impulsar la creación de nuevos dispositivos compatibles, Home Assistant ha liberado los esquemáticos y diseños de placa del Voice Preview Edition. Ahora cualquier usuario puede fabricar su propio asistente personalizado, añadiendo sensores, pantallas o altavoces más potentes, partiendo de una base abierta y optimizada.

Esquemático eléctrico detallado del hardware Voice Preview Edition de Home Assistant. El diagrama muestra los circuitos interconectados, incluyendo el microcontrolador principal (XMOS), la memoria flash, la alimentación de los micrófonos (MIC Power), el control de datos (MIC Data Ctrl) y el interruptor físico de silencio (Mute Switch).

Speech-to-Phrase: más inteligente y en más idiomas

El sistema local de reconocimiento de voz Speech-to-Phrase, basado en frases predefinidas para maximizar la velocidad y la privacidad, recibe varias mejoras clave:

  • Mejoras en la estructura de frases, que facilitan las contribuciones de la comunidad.
  • Compatibilidad más precisa por dispositivo (por ejemplo, solo permite “pon luz roja” si la luz soporta cambio de color).
  • Tratamiento correcto de artículos y nombres en idiomas complejos, como el francés (l’entrée, l’humidificateur, etc.).

Nuevos idiomas compatibles

Speech-to-Phrase pasa de 6 a 21 idiomas compatibles. A los ya existentes (inglés, español, francés, alemán, italiano y neerlandés) se suman:

Catalán, ruso, checo, griego, rumano, portugués, polaco, hindi, euskera, finés, mongol, esloveno, suajili, tailandés y turco.

Todos los modelos se basan en el trabajo open source del extinto proyecto Coqui STT, y podrán mejorarse con nuevos entrenamientos en función del feedback de la comunidad.

Ilustración comercial de una casa en el centro, que representa a Home Assistant, rodeada por docenas de bocadillos de diálogo vacíos y de múltiples colores, simbolizando el nuevo y amplio soporte para múltiples idiomas.

Piper: más voces y más idiomas en texto a voz local

Piper, el motor TTS local de Home Assistant, también se actualiza con nuevos idiomas y voces:

  • Nuevos idiomas: persa (farsi), malayalam y nepalí.
  • Nuevas voces:
    • Neerlandés: Pim y Ronnie
    • Portugués (Brasil): Cadu y Jeff
    • Inglés: Sam (no binario), Reza
    • Sueco, galés, letón, esloveno, eslovaco y más

En total, Piper ya ofrece soporte para 39 idiomas y dialectos, convirtiéndose en una de las soluciones TTS locales más completas del mundo.


Soporte de idioma por niveles: nube, local y local total

Para ayudar a los usuarios a elegir la configuración más adecuada, Home Assistant ha clasificado el soporte de idiomas en tres niveles:

CategoríaDescripción
CloudBasado en Home Assistant Cloud con servicios de Microsoft Azure.
Local centradoUsa Speech-to-Phrase + Piper. Ideal para hardware modesto.
Local totalUsa Whisper + Piper. Permite comandos abiertos, pero requiere hardware más potente.

Cada idioma del asistente de voz recibe una puntuación del 0 al 3 en cada nivel, en función del grado de compatibilidad. Estas puntuaciones ya se muestran tanto en el asistente de configuración de voz como en la página de idiomas soportados.


Assist se vuelve más conversacional

El asistente de voz Assist también gana nuevas capacidades gracias a la integración con modelos LLM (Large Language Models):

  • Conversaciones continuas: ya no es necesario repetir “Ok Nabu” tras cada interacción.
  • Iniciar conversaciones desde automatizaciones o paneles mediante start_conversation.
  • Nuevo intent de búsqueda y reproducción de medios, compatible con Music Assistant y comandos como:
    “Pon música relajante en el salón.”

Próximas funciones en desarrollo:

  • Confirmaciones críticas: para operaciones sensibles como desbloquear puertas.
  • Solicitar parámetros faltantes: por ejemplo, preguntar “¿cuánto tiempo?” si pides un temporizador.
  • Conversaciones personalizadas: creación de diálogos locales adaptados a rutinas o situaciones específicas.

Estas funciones aún están en fase experimental y podrían tardar en llegar a la versión estable.

Dos dispositivos de asistente de voz de Home Assistant uno al lado del otro. A la izquierda, el Voice Preview Edition con su pantalla encendida mostrando la mascota Nabu sonriente. A la derecha, el hardware S3 Box 3 con su anillo de luz azul iluminado.

Conclusión

Esta gran actualización del asistente de voz de Home Assistant consolida su apuesta por un control inteligente más privado, flexible y sin dependencia de la nube. Las mejoras en rendimiento, compatibilidad de idiomas y posibilidades de personalización lo convierten en una solución ideal tanto para entusiastas como para usuarios avanzados.

Con esta actualización, Home Assistant se posiciona como uno de los asistentes de voz más avanzados del mercado, ideal para quienes buscan un sistema domótico sin nube, en español y compatible con ESPHome o Raspberry Pi.

También podría interesarte SwitchBot se certifica oficialmente con Home Assistant: primeros dispositivos «Works with Home Assistant» ya disponibles

Fuente

También podría interesarte