Las reuniones virtuales se han vuelto cada vez más congestionadas debido a la proliferación de asistentes de transcripción impulsados por inteligencia artificial. Fathom, una startup especializada en herramientas de transcripción con IA, ha lanzado una actualización que permite a su aplicación transcribir llamadas sin necesidad de que un asistente virtual se una a las videollamadas, abordando directamente el problema del exceso de participantes en reuniones en línea.

Según informó TechCrunch, la nueva funcionalidad busca resolver la saturación que se produce cuando múltiples participantes incorporan sus propios bots de toma de notas a una misma conferencia. La compañía anunció que su herramienta ahora puede capturar y transcribir conversaciones de forma automática sin agregar participantes adicionales a las salas virtuales.

Características de la nueva herramienta de transcripción

A diferencia de soluciones existentes como Granola, Talat, Notion y ChatGPT que ofrecen capacidades similares, Fathom asegura diferenciarse al permitir la grabación de video además del audio. Los usuarios pueden seleccionar entre diversos modos de grabación para adaptar la transcripción a sus necesidades específicas, según indicó la empresa.

La compañía enfatizó que su desarrollo se centró especialmente en perfeccionar la diarización de hablantes, una función que identifica quién dijo qué durante las conversaciones. Richard White, CEO de Fathom, explicó a TechCrunch que muchas herramientas sin bot no indican correctamente la atribución de comentarios en las transcripciones capturadas.

White señaló que los usuarios frecuentemente enfrentan problemas de atribución incorrecta al consultar sobre declaraciones específicas realizadas en reuniones anteriores. Esta limitación puede dificultar la recuperación precisa del contexto en conversaciones pasadas, un aspecto crítico para la productividad empresarial.

Mejoras en inteligencia artificial impulsan la innovación

El ejecutivo afirmó que Fathom siempre había planeado lanzar un cliente sin bot para transcribir reuniones en línea, pero esta actualización se hizo posible gracias a los avances en IA durante los últimos seis meses. Los progresos en diversos modelos de lenguaje permitieron implementar funcionalidades más sofisticadas de procesamiento de voz.

Adicionalmente, la compañía incorporó capacidades de consulta mediante inteligencia artificial sobre la base de datos de reuniones, lo que resulta especialmente útil para organizaciones que necesitan alimentar contexto más amplio a sus sistemas. Esta función permite a los usuarios buscar información específica a través de múltiples sesiones grabadas.

Integración con herramientas de IA existentes

Fathom también está lanzando un servidor de Model Context Protocol (MCP), que permite a los usuarios extraer datos de reuniones e integrarlos con sus herramientas de IA preferidas. Esta característica responde a una necesidad del mercado que se evidenció recientemente cuando Granola enfrentó quejas de usuarios tras modificar su base de datos local.

Dichos cambios en Granola interrumpieron flujos de trabajo de IA que dependían de datos de transcripción de esa fuente, según reportes de usuarios. La decisión de Fathom de implementar un protocolo estandarizado busca evitar problemas similares de compatibilidad.

Planes de expansión hacia dispositivos móviles

White indicó que la compañía continúa trabajando para mejorar la precisión de sus datos de transcripción y ofrecer más opciones para capturar reuniones. Entre los desarrollos futuros, Fathom planea lanzar una aplicación para iOS capaz de grabar encuentros presenciales, expandiendo su funcionalidad más allá del entorno digital.

La actualización de Fathom representa un paso hacia la simplificación de las videollamadas profesionales al reducir el número de participantes artificiales. La compañía deberá demostrar que su enfoque en la diarización precisa y la integración con herramientas existentes ofrece ventajas tangibles sobre competidores establecidos en el mercado de asistentes de reuniones impulsados por IA. El lanzamiento de la aplicación móvil será un indicador clave de si la startup puede expandir su alcance hacia entornos de trabajo híbridos.

Compartir.

Fernando Parra Editor Jefe en Social Underground. Periodista especializado en economía digital y tecnología financiera con base en Madrid. Su trabajo se centra en analizar el impacto de los neobancos, la regulación europea y el ecosistema cripto en España. Apasionado por traducir las finanzas complejas en noticias accesibles.

Los comentarios están cerrados.