Solo no tiene voz el ser que no tiene sangre». Esta concluyentes oración, incluida en la pieza maestra argentina La vuelta de Martín Hierro, es excepcionalmente precisa en el momento de comprender que nuestra voz es uno de los rasgos más propios del humano, eso que nos aparta de las máquinas y que sirve de escaparate de lo más oculto en nuestro interior. No obstante, este valor único de las personas de carne y hueso ya no lo es tanto: asistentes virtuales como Siri, Alexa o bien Cortana ya se pueden comunicar con nosotros a través de la voz, si bien sea de forma torpe. Y aún son más los sistemas que pueden comprendernos, transcribir nuestros mensajes y recoger nuestras impresiones de forma clara y directa. Es esa torpeza, esa necesidad de amoldar nuestra forma de charlar a lo que las máquinas son capaces de procesar, la que prosigue estableciendo la frontera natural entre el hombre y la máquina. Si bien semeja que esta división podría perdurar menos de lo que nos imaginamos, puesto que absolutamente nadie duda ya de que la voz es la próxima gran interfaz tras los ordenador y los móviles inteligentes. Un terreno muy prometedor en el que una compañía de España, Verbio, es la que alardea de una madurez tecnológica más avanzada que cualquier otro contrincante.El catedrático de la Universidad Politécnica de Cataluña José Adrián Fonollosa es uno de los 4 creadores de la compañía, quien recuerda para INNOVADORES esos inicios del proyecto, allí por 1999: «Estábamos interesados en trasferir a la sociedad los resultados de la investigación en tecnología del habla; cosechando éxito en distintos proyectos de investigación desarrollados en la UPC y con unas primeras colaboraciones con empresas locales y también internacionales, tras lo que se decide crear Verbio para poder continuar produciendo y propagando tecnología renovadora con la estructura y recursos de una compañía».De esos humildes inicios poco queda ya, a juzgar por una compañía con presencia multinacional -5 oficinas en todo el planeta- y 80 empleados. Carlos Puigjaner, dueño de la firma al lado de Antonio Terradas, explica a este respecto que Verbio ha experimentado un «desarrollo un grande en los últimos tiempos, con muchos clientes del servicio en las Américas, desde Canadá hasta Argentina o bien Chila y Asia, que está empezando a ser una parte muy relevante de nuestro negocio». Mas, ¿qué hace a su tecnología de reconocimiento de voz singular entre tantas que brotan diariamente? «Cubrimos todo el proceso, desde la síntesis de voz hasta la biometría de exactamente la misma, el procesamiento del lenguaje natural y su análisis en un cerebro cognitivo», especifica Puigjaner.»Empleamos asimismo arquitecturas concretas, como los chips FPGA de Intel, para poder hacer las inferencias en tiempo real y con múltiples funciones. Pues el mayor reto que tenemos es que los humanos somos capaces de hacer la transcripción de la voz de manera automática, mas las máquinas todavía deben hacer cada uno de ellos de esos procesos separadamente». Además de esto, su innovación no solo es capaz de comprender lo que se afirma o bien se oye, sino más bien asimismo de interpretarlo. «Podemos extraer mucha información de la voz a través de el análisis de sentimiento, como la edad o bien el estado anímico de la persona», agrega el ejecutivo.Obviamente, su sistema de reconocimiento de voz precisa de un extenso adiestramiento, amoldado además de esto a las diferentes casuísticas en que se puede aplicar la tecnología (desde contact centers hasta seguridad, pasando por el subtitulado en tiempo real de programas televisivos o bien la indexación automática de audios). Una tarea ingente de la que depende asimismo el éxito de Verbio y que no ha estado exenta de anécdotas curiosas. «Por servirnos de un ejemplo, procuramos adiestrar a nuestros algoritmos con datos teatralizados para comprender las emociones, mas entonces dimos marcha atrás por el hecho de que nos percatamos de que las personas no charlamos igual que en el teatro», acepta el colíder de la start-up.A pesar del camino recorrido, Puigjaner es siendo consciente de que apenas estamos empezando esta aventura vocal. «Ya estamos desarrollando nuevos sistemas de reconocimiento y síntesis de voz que explotan al límite las posibilidades de la inteligencia artificial y de las redes neuronales, que nos dejará reducir a días el adiestramiento de nuevos idiomas. Esto nos dejará apresurar al límite el acceso a nuevos mercados y proyectos». Y es que, por rizar el rizo, su tecnología es singularmente atinada en la sempiterna laguna de las lenguas alén del inglés.

De oír llamadas en Estados Unidos a examinar el nipón Verbio cuenta por decenas sus grandes proyectos internacionales. Uno de ellos es con la ‘telco’ de Norteamérica Esprint, para la que ha creado un sistema conversacional capaz de atender de forma automatizada hasta tres.000 llamadas simultáneas de sus clientes del servicio en inglés y de España. Para un fabricante de chips, la start-up ha desarrollado un chatbot que se comunica en lenguaje natural, libre aun en portugués. Y algo más lejos, en el país nipón, Verbio trabaja con otra ‘telco’ en un sistema de análisis de voz en nipón, que dejará medir de forma eficaz la satisfacción y  la experiencia de empleo de sus clientes del servicio

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *