DeepL, la empresa conocida por sus herramientas de traducción de texto, anunció hoy el lanzamiento de su nueva suite de traducción de voz a voz, expandiendo sus capacidades más allá del texto escrito. La plataforma de traducción de voz incluye integraciones para reuniones virtuales, conversaciones móviles y web, además de aplicaciones personalizadas para trabajadores de primera línea en entornos grupales.

Según declaró el CEO de DeepL, Jarek Kutylowski, a TechCrunch, la compañía también está lanzando una API que permite a desarrolladores externos y empresas construir soluciones personalizadas sobre la tecnología de DeepL, con casos de uso específicos como centros de llamadas. La empresa con sede en Alemania busca posicionarse en el mercado de traducción en tiempo real, un segmento en crecimiento dentro de la industria tecnológica.

Desafíos técnicos de la traducción de voz en tiempo real

Kutylowski explicó que los principales desafíos al crear un producto de traducción en tiempo real se centran en equilibrar dos factores críticos: reducir la latencia entre el momento en que alguien habla y la reproducción del audio traducido, mientras se mantiene la precisión de los resultados. Después de años dedicados a perfeccionar la traducción de texto y documentos, la compañía identificó una oportunidad en el mercado de voz.

El sistema actual de DeepL convierte el habla a texto, aplica la traducción y luego convierte nuevamente a voz. Sin embargo, la empresa afirma que su experiencia en traducción de texto le proporciona una ventaja competitiva en calidad. Adicionalmente, DeepL planea desarrollar un modelo de traducción de voz end-to-end que elimine el paso intermedio del texto.

Integraciones y aplicaciones de la plataforma de traducción de voz

DeepL está lanzando complementos para plataformas como Zoom y Microsoft Teams, donde los oyentes pueden escuchar la traducción en tiempo real mientras otros hablan en sus idiomas nativos o seguir el texto traducido en pantalla. Este programa se encuentra actualmente en acceso anticipado, y la compañía está invitando a organizaciones a unirse a una lista de espera.

La empresa también ofrece un producto para conversaciones basadas en dispositivos móviles y web que pueden realizarse en persona o de forma remota. Para entornos grupales como sesiones de capacitación o talleres, DeepL permite que los participantes se unan a conversaciones multilingües mediante un código QR.

Personalización y vocabulario especializado

Según la compañía, su tecnología de traducción de voz puede aprender y adaptarse a vocabulario personalizado, incluyendo términos específicos de la industria y nombres de empresas y personas. Esta característica busca mejorar la precisión en contextos profesionales especializados donde la terminología técnica es crucial.

Implicaciones para el servicio al cliente y competencia en el mercado

Kutylowski señaló que la inteligencia artificial está reimaginando el panorama del servicio al cliente en los próximos años. Una capa de traducción ayuda a las empresas a proporcionar soporte en idiomas donde el personal calificado es escaso y costoso de contratar, según el ejecutivo.

No obstante, DeepL enfrenta competencia de varias startups bien financiadas que operan en segmentos adyacentes del mercado. Sanas, que el año pasado recaudó 65 millones de dólares de Quadrille Capital y Teleperformance, utiliza IA para modificar el acento de un hablante en tiempo real, principalmente para agentes de centros de llamadas.

Mientras tanto, Camb.AI, con sede en Dubái, se enfoca en síntesis y traducción de voz para empresas de medios y entretenimiento como Amazon Web Services, ayudándoles a doblar y localizar contenido de video a escala. Palabra, respaldada por Seven Seven Six, la firma del cofundador de Reddit Alexis Ohanian, está construyendo un motor de traducción de voz en tiempo real diseñado para preservar tanto el significado como la voz original del hablante, posicionándose en competencia directa con DeepL.

La disponibilidad general de las integraciones de reuniones virtuales dependerá del proceso de acceso anticipado actual, aunque DeepL no ha especificado una fecha definitiva para el lanzamiento público completo. El éxito de la plataforma dependerá de su capacidad para equilibrar latencia y precisión mientras compite con empresas establecidas y emergentes en el espacio de traducción asistida por IA.

Compartir.

Fernando Parra Editor Jefe en Social Underground. Periodista especializado en economía digital y tecnología financiera con base en Madrid. Su trabajo se centra en analizar el impacto de los neobancos, la regulación europea y el ecosistema cripto en España. Apasionado por traducir las finanzas complejas en noticias accesibles.

Los comentarios están cerrados.