Las herramientas de programación con inteligencia artificial están generando más código que nunca, pero nuevos datos de empresas especializadas en productividad de desarrolladores revelan una paradoja preocupante: gran parte de ese código debe ser reescrito semanas después de su aceptación inicial. Según múltiples informes de la industria, el código generado por IA presenta tasas de revisión significativamente más altas que el código tradicional, lo que cuestiona las métricas convencionales de productividad en ingeniería de software y plantea dudas sobre el verdadero retorno de inversión de estas tecnologías.
Alex Circei, CEO de Waydev, una plataforma que trabaja con más de 10,000 ingenieros de software, indicó que los gerentes de ingeniería observan tasas de aceptación inicial del 80% al 90% para el código generado por IA. Sin embargo, según Circei, estas cifras omiten la revisión posterior que ocurre en las semanas siguientes, reduciendo la aceptación real a entre el 10% y el 30% del código generado.
Productividad de desarrolladores: métricas engañosas en la era de la IA
La medición de la productividad de desarrolladores ha sido objeto de debate durante décadas, comenzando con las líneas de código como indicador principal. No obstante, la llegada de agentes de codificación con IA como Claude Code, Cursor y Codex ha complicado esta ecuación al producir volúmenes masivos de código en poco tiempo.
Los presupuestos de tokens—esencialmente, la cantidad de poder de procesamiento de IA que un desarrollador está autorizado a consumir—se han convertido en una insignia de honor entre los desarrolladores de Silicon Valley. Sin embargo, medir un insumo del proceso en lugar del resultado final representa un enfoque problemático cuando el objetivo es la eficiencia real.
El problema del código desechable y la deuda técnica
GitClear publicó un informe en enero que reveló que los usuarios regulares de herramientas de IA promediaron 9.4 veces más rotación de código que sus contrapartes sin IA, más del doble de las ganancias de productividad que proporcionaron las herramientas. La rotación de código se refiere a líneas eliminadas versus líneas añadidas, un indicador clave de retrabajos.
Faros AI, utilizando dos años de datos de clientes, reportó en marzo de 2025 que la rotación de código había aumentado un 861% bajo alta adopción de IA. Estos hallazgos sugieren que, aunque se escribe más código inicialmente, una proporción desproporcionada no perdura en la base de código final.
Jellyfish, otra plataforma de inteligencia para ingeniería integrada con IA, analizó datos de 7,548 ingenieros en el primer trimestre de 2025. La empresa descubrió que los ingenieros con los mayores presupuestos de tokens produjeron más solicitudes de cambio, pero la mejora de productividad no escaló proporcionalmente: lograron el doble de rendimiento a 10 veces el costo en tokens.
Diferencias entre desarrolladores senior y junior
Los datos revelan patrones distintos entre desarrolladores de diferentes niveles de experiencia. Los ingenieros junior tienden a aceptar significativamente más código generado por IA y, como consecuencia, enfrentan mayor cantidad de reescrituras posteriores. Additionally, los desarrolladores senior muestran mayor capacidad para evaluar críticamente las sugerencias de IA antes de incorporarlas.
Estas estadísticas resuenan con las experiencias reportadas por desarrolladores, quienes encuentran que la revisión de código y la deuda técnica se acumulan incluso mientras disfrutan de la libertad que ofrecen las nuevas herramientas. La capacidad de generar código rápidamente no se traduce automáticamente en software de calidad sostenible.
La industria se adapta con nuevas herramientas de análisis
La proliferación de herramientas de codificación con IA ha impulsado a empresas de análisis a repensar sus plataformas. Waydev rediseñó completamente su plataforma en los últimos seis meses para rastrear los metadatos generados por agentes de IA, ofreciendo análisis sobre la calidad y el costo del código para proporcionar a los gerentes de ingeniería mayor visibilidad sobre la adopción y eficacia de la IA.
Atlassian adquirió DX, otra startup de inteligencia de ingeniería, por mil millones de dólares el año pasado para ayudar a sus clientes a comprender el retorno de inversión en agentes de codificación. Esta adquisición refleja el reconocimiento de las principales organizaciones de que aún están determinando cómo utilizar eficientemente las herramientas de IA.
Las empresas tecnológicas enfrentan ahora el desafío de desarrollar métricas más sofisticadas que capturen no solo el volumen de código producido, sino su calidad y durabilidad a largo plazo. Circei indicó a TechCrunch que la adaptación es inevitable: “Esta es una nueva era del desarrollo de software, y tienes que adaptarte, y te ves obligado a adaptarte como empresa. No es como si fuera un ciclo que pasará”.
A medida que más organizaciones implementan herramientas de codificación con IA, se espera que evolucionen las métricas de evaluación y las mejores prácticas para equilibrar velocidad con calidad. Los próximos meses serán cruciales para determinar qué metodologías de medición ofrecen mayor utilidad práctica y cómo las empresas ajustarán sus procesos de desarrollo para maximizar los beneficios reales de estas tecnologías emergentes.

