NEWSLETTER

El efecto real de la IA generativa en la academia: productividad, lenguaje y oportunidad

Google_AI_Studio_2025-10-12T04_44_40.815Z

El efecto real de la IA generativa en la academia: productividad, lenguaje y oportunidad

Desde fines de 2022, cuando los grandes modelos de lenguaje pasaron del laboratorio a la mesa de trabajo, la universidad dejó de ser inmune a los atajos inteligentes. Lo que primero pareció un juguete brillante se volvió herramienta cotidiana. En departamentos de sociología, seminarios de economía y laboratorios de psicología, la escritura asistida por IA comenzó a funcionar como una infraestructura blanda: invisible, ubicua, difícil de prohibir y, sobre todo, eficaz para tareas tediosas que consumían tiempo y energía cognitiva. La pregunta de fondo, sin embargo, no es tecnológica sino empírica: ¿esa asistencia mejora el desempeño académico o solo maquilla los textos con una prosa más tersa?

Un estudio reciente, titulado Can GenAI Improve Academic Performance? Evidence from the Social and Behavioral Sciences, enfrenta el dilema con datos y no con impresiones. En lugar de encuestas o testimonios, construye un panel longitudinal de autores que publicaron entre 2021 y 2024 en ciencias sociales y del comportamiento, y observa qué cambió tras la irrupción pública de ChatGPT. La lógica es contundente: si la IA generativa realmente ayuda, el rastro debe verse en los resultados, no en las opiniones.

Con un diseño que combina diferencias en diferencias y emparejamiento por puntaje de propensión, el trabajo estima efectos sobre dos variables que importan a cualquier investigador: cuántos artículos publica y en qué revistas logra publicarlos.

El diagnóstico es claro. La productividad aumenta con fuerza entre quienes adoptan IA generativa y la calidad editorial crece de manera moderada pero consistente. El impacto no se reparte de modo uniforme, y ahí está una de las claves interpretativas del trabajo: los mayores beneficios se observan entre investigadores jóvenes, autores en subcampos técnicamente exigentes y, sobre todo, entre quienes escriben desde países donde el inglés no es lengua dominante. No es un detalle menor. La IA, cuando se usa como andamiaje de escritura, no solo acelera la producción, también recorta asimetrías históricas en la comunicación científica internacional.

Este artículo reorganiza la discusión en bloques temáticos para aclarar implicancias y límites. La apuesta es narrativa y didáctica: contar qué mide el estudio, cómo lo mide, qué encontró y por qué esos hallazgos importan para estudiantes, docentes, editores, financiadores y, al final, para la salud del sistema científico.

La primera capa del hallazgo es contundente: entre los adoptantes de IA generativa la cantidad de artículos publicados crece con signo positivo y con una curva ascendente entre el primer y el segundo año tras la irrupción del nuevo ecosistema de herramientas. Esta progresión temporal tiene una explicación sencilla y verosímil. Tras la aparición de los modelos, la curva de aprendizaje exige un periodo de ajuste. Los equipos prueban flujos de trabajo, definen rutinas, afinan instrucciones, integran la herramienta en el ciclo de escritura y, recién después de algunos meses, la mejora se anota en el marcador que de verdad cuenta: el artículo aceptado.

La aceleración productiva tiene un componente mecánico. Cuando la IA se encarga de tareas de bajo valor creativo, la fricción desciende. Estructurar una introducción, clarificar un párrafo, uniformar el tono de una sección de métodos, proponer alternativas de títulos, detectar repeticiones, sugerir transiciones más fluidas, limpiar anglicismos o corregir inconsistencias estilísticas, todo toma minutos con un asistente bien usado. Sumado a lo largo de un manuscrito, el ahorro es sustantivo. Replicado en varios proyectos en paralelo, la curva de salida de borradores se empina.

Conviene no confundir velocidad con ligereza. Escribir es solo una parte del trabajo académico. Diseñar preguntas, construir marcos, depurar datos, ejecutar análisis, interpretar resultados, dialogar con literatura y responder revisiones no se automatiza por completo. La productividad no crece porque la IA “escribe el paper”, crece porque reduce el peaje de la comunicación científica y permite mover el foco hacia las tareas más intensivas en criterio.

En economía, psicología y subcampos con fuerte apoyatura estadística o experimental, el salto es más visible. No es casual. En esos territorios, el estándar editorial exige claridad argumental y precisión terminológica. La IA, bien guiada, ayuda a homogeneizar estructura y legibilidad, y a mantener la consistencia entre texto, tablas y figuras. En sociología y áreas de tradición cualitativa o teórica, donde la voz autoral y la elaboración conceptual pesan más, el aumento existe, pero luce más moderado. También es lógico: hay menos trabajo de “limpieza” que un asistente de lenguaje pueda acelerar sin comprometer la impronta del autor.

El segundo núcleo del estudio toca una fibra sensible: la dominancia del inglés en la ciencia. Durante décadas, escribir en inglés fue un peaje cultural, cognitivo y económico para millones de investigadores. Traductores, correctores, colegas angloparlantes que oficiaban de revisores informales, manuales de estilo con fórmulas fijas, glosarios de expresiones, plantillas de cortesía para cartas a editores. Todo eso conformaba una infraestructura artesanal de adaptación al centro editorial anglo.

La IA generativa no resuelve el problema de fondo, pero achica la distancia. Ofrece, al instante, una prosa más limpia, un registro formal estándar y una gramática robusta. Lo decisivo es otra cosa: permite iterar con bajo costo. Antes, una ronda de edición profesional tomaba días y dinero. Ahora, un autor puede probar varias versiones de un párrafo en minutos, comparar voces, calibrar tecnicidad, evitar coloquialismos, pedir sinónimos, reducir adjetivación, corregir falsos cognados. Ese ciclo de prueba y ajuste, multiplicado por todo un manuscrito, produce un efecto acumulativo.

En países con mayor distancia lingüística respecto del inglés, el salto es notorio. El beneficio agregado no se agota en pasar el filtro idiomático de los referatos, opera también en la velocidad de respuesta durante la revisión por pares. Un autor que puede contestar con claridad y precisión, que arma tablas de cambios con redacciones inequívocas, que resume con nitidez qué se modificó y por qué, ahorra fricción social en el proceso editorial. Menos idas y vueltas, menos malentendidos, más foco en el contenido.

Este desplazamiento tiene implicaciones políticas. Si escribir en inglés deja de ser un obstáculo tan costoso, el mapa de la ciencia se vuelve más denso en regiones históricamente subrepresentadas. Aparecen más voces, se amplían los repertorios, se diversifican preguntas y casos. También surgen desafíos: la tentación de uniformar el estilo, la dependencia de giros estándar propios de la IA, la necesidad de conservar una voz genuina que no quede sepultada bajo una prosa de manual.

El impacto en jóvenes investigadores

La tercera capa ya no es lingüística sino generacional. El efecto de la IA es más pronunciado entre quienes están en los primeros años de carrera. Hay razones organizacionales y culturales. Quien recién se inserta en la academia tiende a experimentar sin resistencia con flujos de trabajo digitales y a aprovechar soluciones que reducen tiempos muertos. Además, suele tener menos acceso a redes de edición informal, a traductores internos, a colegas que corrijan borradores extensos.

Para un investigador novel, cada hora importa. La IA recorta tareas repetitivas en la redacción, propone planes de sección razonables, sugiere títulos en registro académico, ayuda a sintetizar contribuciones sin grandilocuencias, detecta inconsistencias de nomenclatura y prepara listas tentativas de limitaciones sin caer en frases hechas. El resultado es doble: mejor utilización del tiempo y menor ansiedad al encarar el ciclo de escritura. La diferencia se nota al final del año cuando hay que convertir resultados en manuscritos listos para enviar.

Esto no implica que la experiencia deje de importar. De hecho, los investigadores sénior suelen aprovechar la IA de otra manera: como apoyo para comunicaciones con audiencias no especializadas, para pulir secciones de introducción y discusión, para estandarizar instrucciones a coautores y para uniformar el estilo de artículos que integran proyectos de grupo. La distinción no es de talento, sino de necesidades. Quien está construyendo su portfolio percibe la IA como un multiplicador directo de producción. Quien ya lo tiene, la usa como herramienta de gestión del tiempo y del equipo.

Hay una diferencia sustantiva entre fluidez lingüística y rigor técnico. La IA generativa mejora con facilidad la primera, la segunda depende de la solidez del autor. En subcampos con estructura metodológica definida, la herramienta funciona mejor cuando el investigador domina el esqueleto lógico del artículo. La introducción debe mover al lector desde el contexto hacia una pregunta concreta, el marco teórico ubica la contribución, los datos y métodos requieren especificaciones claras, los resultados deben organizarse con tablas y figuras que conversen con el texto, la discusión sitúa el aporte sin hipérboles. Ahí la IA es un asistente de orquesta, no el director.

Donde ese esqueleto está ausente, el riesgo crece. La IA puede producir frases impecables que camuflan una debilidad conceptual. Un argumento mal definido, por elegante que suene, no supera el filtro experto. Por eso el estudio insiste en medir resultados, no impresiones. Si la IA solo maquillara, sería razonable esperar rechazo editorial en etapas avanzadas. Lo que aparece en los datos, en cambio, es un leve corrimiento hacia revistas de mayor impacto. Esa señal sugiere que mejora la superficie y también la capacidad de cumplir estándares formales que facilitan la evaluación del contenido.

 

Marcadores lingüísticos GenAI

                                                                                                                             (a) Selección                                                                     (b)Tendencias

El panel (a) ilustra el proceso de selección según los cambios en la frecuencia de las palabras clave asociadas con el uso de GenAI, con los términos calificadores en rojo. El panel (b) muestra las tendencias de frecuencia de los términos seleccionados relacionados con GenAI.

El método de detección textual

El estudio no se apoya en autodeclaraciones. Para clasificar adopción, emplea un conjunto de marcadores léxicos cuya frecuencia se disparó tras la irrupción de los modelos, con un umbral de crecimiento temporal que filtra términos de moda y reduce falsos positivos. La idea es pragmática: si un autor aumenta de manera consistente el uso de ciertos patrones lingüísticos propios de la prosa asistida por IA en títulos y resúmenes, hay alta probabilidad de que esté integrando estas herramientas en su flujo de escritura.

El procedimiento es transparente y reproducible. También es limitado, y los autores lo admiten sin eufemismos. No captura usos de IA en etapas no visibles del texto final, como ideación, organización de la literatura, depuración de código o verificación de supuestos. Es, por construcción, un indicador del componente comunicacional de la adopción. Pero eso es, justamente, lo que la investigación quiere medir: el efecto de bajar la fricción de la escritura en el resultado observable, no el reemplazo del trabajo intelectual que define la contribución científica.

Hay otra virtud metodológica. El diseño de diferencias en diferencias, con efectos fijos por autor y año, y la construcción de un grupo de control emparejado por características relevantes, permiten aislar con más credibilidad el efecto asociado a la adopción. No es un experimento aleatorizado, pero eleva la vara en un terreno plagado de anécdotas y sensaciones.

Para separar moda de tendencia, el trabajo estresa su propio diseño. Varía los umbrales de selección de palabras, ajusta criterios de clasificación de usuarios, prueba distintos esquemas de emparejamiento. El cuadro que emerge es consistente. En todos los ejercicios razonables, la dirección de los resultados se mantiene. Las ganancias en productividad no desaparecen cuando se endurecen los filtros. Tampoco el corrimiento en calidad. El mensaje para tomadores de decisión es pragmático: el fenómeno no es un espejismo metodológico, es una regularidad que merece política.

Los autores también reconocen el margen de incertidumbre. Siempre existen factores no observados que podrían correlacionar con la adopción. Por eso el énfasis en efectos fijos por autor, que anclan lo inmutable de cada trayectoria, y en la comparación dinámica año a año, que permite ver si había tendencias distintas antes del shock. El patrón no muestra pre-tendencias que invaliden el contraste, otro punto a favor de la inferencia.

Ética, transparencia y reglas del juego

Que la IA generativa mejore la producción y el posicionamiento editorial no agota la conversación. Trae obligaciones nuevas. La primera es transparencia. Las revistas, los comités y los grupos de investigación necesitan pautas claras y realistas sobre el uso de asistentes en la escritura. Si la herramienta se usó para editar estilo y corregir gramática, conviene declararlo con fórmulas estandarizadas. Si se empleó para sintetizar literatura, hay que extremar cuidado para evitar errores factuales. Si ayudó a proponer alternativas de interpretación, el equipo debe verificar cada afirmación con fuentes primarias.

La segunda obligación es equidad. No todos los equipos tienen acceso al mismo ecosistema de modelos. Las instituciones y financiadores pueden ofrecer licencias institucionales, capacitación y repositorios de buenas prácticas para que la adopción no dependa del bolsillo individual. El estudio muestra que los mayores beneficios se concentran en quienes más los necesitan, por su situación lingüística o por su menor seniority. Sería un contrasentido que el acceso desigual a herramientas de pago termine invirtiendo ese efecto.

La tercera, de integridad. La frontera entre ayuda estilística y manipulación del contenido es nítida si se usa con criterio, difusa si se buscan atajos. El mejor antídoto es la responsabilidad del equipo autoral. La IA puede sugerir, no decidir. Puede proponer, no probar. Puede pulir, no descubrir. La evidencia alienta a aprovecharla, pero no exonera a nadie de sostener estándares.

Dos ideas para actuar ya
  • Capacitar a equipos en flujos de trabajo donde la IA automatiza tareas de bajo valor, y reservar tiempo de calidad para diseño de preguntas, análisis y discusión.
  • Establecer lineamientos institucionales simples para la declaración de uso de IA en manuscritos, con foco en transparencia y verificación humana.

Escenarios a corto y mediano plazo

En el corto plazo, veremos consolidación de prácticas. Los equipos que integraron IA en su ciclo de escritura tenderán a estandarizar instrucciones, a construir bibliotecas de prompts y a documentar decisiones. Los editores ajustarán instrucciones a autores y revisores, no para perseguir usos, sino para clarificar responsabilidades. Los comités de ética adoptarán plantillas de declaración de asistencia y registrarán, sin estigmas, el uso declarado.

En el mediano plazo, la conversación se desplaza a cuestiones de evaluación. Si la productividad global sube, la presión sobre revisores y editores crece. Habrá que invertir en mejorar la experiencia de revisión, acortar tiempos muertos, priorizar la calidad de las observaciones y reconocer el trabajo experto de arbitraje. La IA también jugará allí un rol, como asistente de chequeos formales y de consistencia metodológica, siempre con supervisión humana.

Otra derivada será pedagógica. Las maestrías y doctorados incorporarán módulos de escritura con IA, no para enseñar a que la herramienta “escriba por uno”, sino para instruir en prácticas responsables: control de hechos, trazabilidad de citas, manejo de sesgos, límites de las paráfrasis, recuperación de la voz autoral. Los cursos de métodos incluirán unidades sobre validación automatizada de supuestos, generación controlada de resúmenes de literatura y diseño de estrategias de respuesta a revisores con ayuda del asistente, todo supervisado por el equipo docente.

El propio estudio traza su perímetro. Al usar marcadores lingüísticos, capta bien el componente de escritura, pero no ilumina otras capas de adopción, por ejemplo en análisis de datos o programación, donde la IA también opera como copiloto. Tampoco mide efectos de largo plazo en citación, influencia o durabilidad de resultados. Y, por construcción, se concentra en ciencias sociales y del comportamiento, con sus estilos y ritmos. Falta explorar con la misma fineza qué ocurre en biomedicina, ciencias naturales o ingenierías, donde la densidad técnica del artículo cambia la ecuación del asistente de lenguaje.

Estas limitaciones son pistas para investigaciones futuras. Integrar verificación manual de casos, diseñar comparaciones en instituciones con políticas distintas de acceso, cruzar resultados con métricas de citación a tres y cinco años, seguir trayectorias de coautoría para ver si la IA reconfigura redes intelectuales. Cada línea ayudaría a discernir si lo observado es una transición o el nuevo piso de productividad.

 

Resumen estadístico por campo

Campo Variable N Media Desv. Est. Mín Máx
Economía Años de carrera 5059 8.584 8.256 0.0 56.0
Inglés: nativo 5059 0.226 0.418 0.0 1.0
Inglés: distante 5059 0.246 0.431 0.0 1.0
Mujer 5059 0.378 0.485 0.0 1.0
Impacto de revista (2021) 5059 4.142 2.794 0.1 34.4
Publicaciones (2021) 5059 2.546 2.657 1.0 54.0
Impacto de revista (2022) 5059 3.792 2.505 0.1 29.4
Publicaciones (2022) 5059 3.692 4.010 1.0 65.0
Psicología Años de carrera 9846 11.018 9.478 0.0 60.0
Inglés: nativo 9846 0.413 0.492 0.0 1.0
Inglés: distante 9846 0.161 0.368 0.0 1.0
Mujer 9846 0.519 0.500 0.0 1.0
Impacto de revista (2021) 9846 4.932 2.353 0.1 29.4
Publicaciones (2021) 9846 3.265 2.851 1.0 33.0
Impacto de revista (2022) 9846 4.877 2.293 0.1 29.4
Publicaciones (2022) 9846 3.587 3.110 1.0 38.0
Sociología Años de carrera 17575 8.397 7.987 0.0 60.0
Inglés: nativo 17575 0.330 0.470 0.0 1.0
Inglés: distante 17575 0.201 0.401 0.0 1.0
Mujer 17575 0.471 0.499 0.0 1.0
Impacto de revista (2021) 17575 4.566 3.038 0.1 56.5
Publicaciones (2021) 17575 2.342 1.948 1.0 24.0
Impacto de revista (2022) 17575 4.458 3.170 0.1 56.5
Publicaciones (2022) 17575 2.535 2.068 1.0 24.0

Esta tabla muestra promedios calculados por persona dentro de cada área (Economía, Psicología y Sociología). “Años de carrera” indica cuántos años pasaron desde la primera publicación de cada autora o autor. Los rótulos “Inglés: nativo” e “Inglés: distante” sirven para estimar el manejo del inglés según el país de afiliación: por ejemplo, Estados Unidos y Reino Unido se clasifican como nativos, mientras que China o Japón se consideran distantes. La variable “Mujer” es un indicador binario inferido automáticamente a partir del nombre de pila mediante un algoritmo de clasificación de género, por lo que puede cometer errores en casos particulares. “Impacto de revista (2021)” y “Impacto de revista (2022)” reflejan el factor de impacto promedio de las revistas donde publicó cada persona en esos años. Finalmente, “Publicaciones (2021)” y “Publicaciones (2022)” señalan la cantidad de artículos firmados por cada autora o autor en esos periodos.

 

Implicancias para políticas científicas

Los hallazgos no piden soluciones épicas, piden medidas sensatas. Las universidades y agencias de financiamiento pueden incluir acceso a asistentes de lenguaje en sus paquetes de apoyo, especialmente para grupos en desventaja lingüística. También pueden convocar a mesas con editores para consensuar guías de declaración de uso realistas y útiles, que no castiguen la herramienta, sino que refuercen la trazabilidad.

En paralelo, conviene invertir en alfabetización avanzada de IA. No alcanza con saber pedirle algo a un modelo. Hay que enseñar a evaluar la plausibilidad de una sugerencia, a detectar errores sutiles, a triangular información con fuentes primarias. En ciencias sociales, donde la interpretación es central, ese entrenamiento vale oro. La productividad no debe pagarse con superficialidad.

Para estudiantes de posgrado, la moraleja es concreta. La IA puede acortar la distancia entre una idea y un borrador decente, pero no reemplaza el oficio de pensar. La herramienta gana cuando la pregunta es buena y el diseño, sólido. Si se usa para inflar textos vacíos, el efecto es el contrario: se produce más ruido, se diluye la señal y se desperdicia tiempo de revisión.

Para docentes, el reto es doble. Por un lado, integrar la IA como apoyo didáctico, explícito y controlado. Por otro, enseñar límites, hábitos y ética de uso. El objetivo no es prohibir atajos, sino entrenar criterio. La mejor defensa contra el facilismo es la exigencia bien orientada: claridad en los objetivos de aprendizaje, rúbricas transparentes, evaluación de argumentos antes que de adornos retóricos.

Hay una tentación fácil que conviene evitar: creer que la prosa perfecta es siempre mejor. En ciencia, la claridad importa, pero también la voz. El riesgo de la IA es que, si se la deja sola, converja hacia una textura lingüística de manual, impecable y anodina. La solución es prosa disciplinada, no prosa domesticada. El autor debe apropiarse de la herramienta, no someterse a ella. Mantener metáforas con sentido, preservar giros propios cuando sirven al argumento, combinar precisión con carácter. Ese equilibrio separa un texto eficaz de un texto intercambiable.

Los datos sugieren un patrón temporal que vale destacar. El año de la irrupción muestra un salto inicial y, al siguiente, un salto mayor. Esto obedece al ciclo editorial y a la maduración del uso. Quienes incorporaron la IA en 2023, al llegar 2024, ya tenían un catálogo de prácticas que funcionaban. Aprendieron a evitar errores frecuentes, a modular el tono, a no confiar ciegamente en sugerencias cuando el tema es delicado, a combinar la herramienta con gestores bibliográficos y verificadores. Ese aprendizaje institucionaliza el uso, y la institución, cuando aprende, multiplica.

Este efecto acumulado también plantea una pregunta hacia adelante. Si la productividad aumenta de manera sostenida, el sistema deberá adaptarse para no asfixiar la revisión. Una solución posible será priorizar preprints con filtros básicos y arbitrajes por etapas, acompañados por verificaciones automatizadas que alivien tareas repetitivas. La otra será reconocer con más fuerza el trabajo de los revisores, con incentivos simbólicos y materiales. No hay productividad sustentable si el ecosistema que valida calidad se sobrecarga.

 

Efecto del uso de GenAI en la productividad y calidad científica

(a)Productividad                                                                           (b) Calidad

Notas: Esta figura representa gráficamente los coeficientes dinámicos de diferencias en diferencias (DID) con intervalos de confianza del 95%, donde 2022 es el año de referencia. Las líneas discontinuas verticales indican el lanzamiento público de ChatGPT (finales de 2022), lo que marca claramente la introducción del tratamiento. El panel (a) muestra el efecto en la productividad (logaritmo del número de publicaciones + 1) y el panel (b) el efecto en la calidad de la investigación (logaritmo del factor de impacto medio de las revistas + 1).

 

Reflexiones finales

La conclusión operativa es clara. La IA generativa ya no es una curiosidad en el campus, es un componente estable del trabajo académico. Su adopción, medida con cuidado, se asocia con más artículos y con publicaciones en revistas algo mejores. No reemplaza la inteligencia de los equipos ni crea ideas de la nada, pero elimina arena en los engranajes. Allí donde la fricción era lingüística, reduce asimetrías. Donde la barrera era organizacional, ordena procesos. Donde el cuello de botella era tiempo, libera horas para pensar mejor.

Nada de esto significa que la ciencia se vuelva fácil. Significa que la energía se redistribuye. Si el sistema acompaña con reglas sensatas y acceso equitativo, la oportunidad es ampliar la base de participación, acelerar ciclos sin degradar estándares y, quizá, abrir ventanas para preguntas nuevas que antes quedaban afuera por falta de tiempo, de voz o de idioma. La tecnología, cuando se usa con criterio, no borra el oficio. Lo devuelve al centro.

Referencias

Filimonovic, D., Rutzer, C., & Wunsch, C. (2025). Can GenAI Improve Academic Performance? Evidence from the Social and Behavioral Sciences. Universidad de Basilea, CESifo, DIW Berlin e IZA.

Publicaciones Recientes

ChatGPT Image 15 oct 2025, 02_50_09

Extinción o despegue: los escenarios de IA según la Fed de Dallas

El artículo del Federal Reserve Bank of Dallas, de junio de 2025, “Advances in AI will boost productivity, living sta
Leer Más
3339bb68-0021-4526-976d-b40765fb726f

Los modelos de IA revelan un sesgo arraigado por la escritura humana

En las profundidades de un laboratorio digital en Princeton, un relato breve sobre un altercado en un autobús se transf
Leer Más

Para estar informado, Ingresá o Creá tu cuenta en MundoIA...

Entrar

Recordá revisar la carpeta de "no deseados", el correo puede llegar allí