Una palabra de activación es una frase que hace que un dispositivo Amazon Echo comience a grabar la solicitud de un usuario final para que pueda enviarse a la nube para su procesamiento. Cuando Amazon Echo detecta su palabra de activación, registra la siguiente solicitud hablada y envía una grabación de la solicitud del usuario a Amazon Web Services (AWS). Las computadoras de Amazon en la nube procesan la solicitud del usuario y envían una respuesta o inician una acción.
Los usuarios de Amazon Echo pronuncian la palabra de activación cuando quieren activar e interactuar con el dispositivo. "Alexa" es la palabra de activación predeterminada de Echo, pero los usuarios pueden cambiar la predeterminada a "Amazon", "Echo" o "Computadora" si lo desean. El término palabra de activación es análogo a palabra activa, que se utiliza para activar la interfaz de usuario de voz (VUI) en Google Home.
Si bien el dispositivo Echo escucha constantemente, solo graba y transmite audio después de que se ha pronunciado la palabra de activación. Los usuarios pueden revisar y eliminar sus grabaciones de voz de los servidores de Amazon a través de la aplicación Alexa o visitando la página web Configuración de privacidad de Alexa. Los usuarios finales también pueden solicitar que Alexa reproduzca un tono breve para indicar que el dispositivo ha escuchado la palabra de activación y el audio se está enviando a la nube.
¿Cómo funcionan las palabras de activación?
Amazon Echo utiliza el aprendizaje profundo, un aspecto de la inteligencia artificial, para enseñar al software Echo cómo reconocer la palabra de activación. Aunque Amazon Echo escucha constantemente, el búfer de audio de Echo evita que el dispositivo escuche y grabe conversaciones enteras.
Según Amazon, los dispositivos Echo tienen un búfer de grabación de solo unos segundos, que es lo suficientemente largo para detectar la palabra de activación. Amazon utiliza interacciones de voz de clientes del mundo real para ayudar a entrenar sus algoritmos de redes neuronales. Cuando las grabaciones de audio se transmiten a los servicios de voz de Alexa (AVS) basados en la nube de Amazon, el dispositivo Echo también alertará al usuario final visualmente. (El anillo delgado del Amazon Echo se volverá azul y parpadeará). Cuando se cambie la palabra de activación, la luz del dispositivo parpadeará brevemente en naranja.
Todos los dispositivos Amazon Echo tienen varios micrófonos incorporados que ayudan al dispositivo a ignorar el ruido de fondo y a descifrar las palabras de activación habladas desde la distancia. Para evitar que Alexa se despierte accidentalmente, companies puede enviar muestras de audio a Amazon para que se ignoren instancias específicas de la palabra de activación. Por ejemplo, una empresa que realiza un comercial de televisión sobre "Alexa" puede enviar el audio a Amazon.
Mediante una técnica llamada huella digital acústica, Amazon puede detectar cuándo varios dispositivos escuchan el mismo comando aproximadamente al mismo tiempo (durante un comercial de televisión de Alexa, por ejemplo). Cuando se transmitió el Super Bowl entre los New England Patriots y Los Angeles Rams en enero de 2019, se emitió un comercial de Amazon Echo con el actor Forest Whitaker. Amazon utilizó una grabación del comercial, junto con huellas dactilares acústicas, para ignorar la palabra de activación, "Alexa", cada vez que Whitaker la pronunció.