Anthropic ha revelado los resultados de un experimento innovador donde agentes de inteligencia artificial actuaron como compradores y vendedores en un mercado real, completando transacciones con dinero genuino. El proyecto, denominado Project Deal, involucró a 69 empleados de la compañía que utilizaron agentes de IA para negociar la compra y venta de productos entre colegas, con un presupuesto inicial de $100 por participante distribuido mediante tarjetas de regalo.

La empresa reconoció que esta prueba representó un experimento piloto con una población de participantes autoseleccionada. Sin embargo, los resultados generaron 186 transacciones completadas, alcanzando un valor total superior a los $4,000, según informó Anthropic en su comunicado oficial.

Funcionamiento del Mercado con Agentes de IA

Anthropic diseñó cuatro mercados separados utilizando diferentes modelos de inteligencia artificial para evaluar el desempeño de los agentes. Uno de estos mercados fue catalogado como “real”, donde todos los participantes estuvieron representados por el modelo más avanzado de la compañía, y las transacciones acordadas se ejecutaron efectivamente después del experimento. Los otros tres mercados funcionaron exclusivamente con propósitos de investigación y análisis comparativo.

El experimento permitió que los agentes de IA negociaran de manera autónoma en nombre de los empleados, estableciendo precios y condiciones de venta sin intervención humana directa durante el proceso de negociación. Esta metodología buscaba evaluar la capacidad de los sistemas de inteligencia artificial para realizar transacciones comerciales complejas en escenarios del mundo real.

Disparidades en el Rendimiento de los Agentes de IA

Los hallazgos revelaron un aspecto preocupante sobre la equidad en el uso de agentes de inteligencia artificial para transacciones comerciales. Según Anthropic, cuando los usuarios fueron representados por modelos más avanzados, obtuvieron “resultados objetivamente mejores” en sus negociaciones. Esta ventaja resultó en términos más favorables para aquellos con acceso a tecnología superior.

No obstante, los participantes aparentemente no detectaron estas disparidades durante el experimento. La compañía señaló que esto plantea la posibilidad de “brechas en la calidad de los agentes”, donde las personas en desventaja podrían no percatarse de que están obteniendo resultados inferiores en comparación con otros usuarios.

Implicaciones para el Comercio Digital

Este descubrimiento sugiere desafíos significativos para la implementación futura de agentes de inteligencia artificial en mercados comerciales. La existencia de diferencias no detectables en el rendimiento podría crear desequilibrios sistemáticos entre usuarios con acceso a diferentes niveles de tecnología de IA.

Adicionalmente, el experimento reveló que las instrucciones iniciales proporcionadas a los agentes no afectaron significativamente la probabilidad de venta ni los precios negociados. Este resultado sugiere que los modelos de inteligencia artificial operan con un grado considerable de autonomía una vez iniciado el proceso de negociación.

Perspectivas sobre Automatización Comercial

A pesar de las limitaciones del estudio, Anthropic manifestó estar “impresionada por cuán bien funcionó Project Deal”. La empresa destacó la capacidad de los agentes de IA para completar transacciones complejas que involucran evaluación de productos, negociación de precios y acuerdos finales sin supervisión constante.

Este experimento representa un paso hacia la automatización de transacciones comerciales mediante inteligencia artificial, aunque plantea interrogantes sobre regulación, transparencia y equidad en sistemas automatizados de comercio. La diferencia en resultados según la calidad del agente sugiere la necesidad de establecer estándares mínimos de desempeño para proteger a los consumidores.

Anthropic no ha anunciado planes específicos para expandir Project Deal más allá de esta fase experimental. La empresa probablemente evaluará estos hallazgos para determinar si desarrolla aplicaciones comerciales de esta tecnología o si realiza estudios adicionales con poblaciones más amplias y diversas. Las cuestiones sobre equidad algorítmica y transparencia requerirán consideración adicional antes de cualquier implementación a escala comercial.

Compartir.

Fernando Parra Editor Jefe en Social Underground. Periodista especializado en economía digital y tecnología financiera con base en Madrid. Su trabajo se centra en analizar el impacto de los neobancos, la regulación europea y el ecosistema cripto en España. Apasionado por traducir las finanzas complejas en noticias accesibles.

Deja una respuesta