VoxML (Voice Markup Language) es una tecnología de Motorola para crear un diálogo de voz con un sitio web en el que un usuario puede llamar a un sitio web por teléfono e interactuar con él a través del reconocimiento de voz y las respuestas del sitio web. VoxML (TM) permite a un desarrollador crear un guión de la conversación que un usuario puede tener con un programa de aplicación ejecutado por un servidor web. El usuario que llama está conectado a un programa cliente llamado navegador de voz. El navegador de voz, a su vez, pasa las solicitudes al servidor web. El marcado definido en VoxML es consistente con el Lenguaje de marcado extensible (XML), el lenguaje de definición de datos estratégicos para Internet. El uso de VoxML no es más difícil que escribir una página web utilizando el lenguaje de marcado de hipertexto (HTML).
Motorola está proporcionando VoxML como una interfaz abierta y los desarrolladores potenciales pueden descargar el kit de desarrollo del sitio web de Motorola. Motorola ya ha proporcionado la tecnología a algunos de los primeros desarrolladores de productos, incluido The Weather Channel. Las aplicaciones típicas pueden incluir la entrega de información meteorológica, información de vuelos y resultados deportivos, así como pedidos de productos y servicios en línea.
Cómo el usuario usa VoxML
- El usuario identificaría un sitio web que ofreciera interacción telefónica. Por ejemplo, algunos sitios de e-tailing pueden permitir a los usuarios realizar pedidos desde el sitio web por teléfono en lugar de completar un formulario.
- La empresa con el sitio web publicaría un número de teléfono para llamar a su sitio web.
- El usuario llamaría al número en un teléfono normal. (Inicialmente, es decir, no se admite la conexión telefónica a través de Internet).
- El usuario se conectaría a un navegador de voz en el sitio web.
- Cuando se conectaba, el usuario escuchaba una voz grabada que invitaba al usuario a interactuar con el sitio web, por ejemplo, para realizar un pedido o elegir alguna otra opción.
- Como respondió el usuario, las respuestas seleccionadas podrían desencadenar solicitudes desde el navegador de voz a una aplicación de servidor web. El servidor web también puede enviar nuevas páginas web a la computadora del usuario, por ejemplo, imágenes de artículos del catálogo y confirmaciones de pedidos.
- El usuario y la aplicación VoxML interactuarían hasta que se completara la transacción. Luego, el usuario colgaba y terminaba la sesión.
Cómo el desarrollador desarrolla una aplicación VoxML
- Primero, el desarrollador diseña y especifica la aplicación, anotando los posibles diálogos de voz que serán posibles.
- Trabajando en una PC normal que tiene el software de desarrollo instalado, el desarrollador usa VoxML, las declaraciones de diálogo del usuario y los nombres de los archivos de respuesta de audio grabados para crear un archivo que define formalmente los diálogos.
- El desarrollador (u otra persona) registra cada posible consulta de voz, creando un archivo de voz con el que se pueden comparar las entradas de voz de los usuarios. El desarrollador organiza las respuestas de voz predefinidas, que pueden estar disponibles en otra aplicación.
- El desarrollador tiene el cliente de voz en la PC para que se pueda probar el script VoxML.
- Después de la prueba, todos los archivos se colocan en el servidor del sitio web.
- El desarrollador modifica el sitio web para invitar a los usuarios a solicitar la aplicación de voz.
- Una vez que la aplicación VoxML está configurada, los usuarios pueden interactuar con el sitio web a través de su mouse y teclado como de costumbre, y también, para propósitos invitados, por teléfono.