Según un estudio una IA puede simular el voto de un legislador europeo. Pero no representa a todos por igual.

ChatGPT Image 17 jun 2025, 21_59_58

Según un estudio una IA puede simular el voto de un legislador europeo. Pero no representa a todos por igual.

Modelos que votan: inteligencia artificial y representación simulada en el Parlamento Europeo

Desde hace más de medio siglo, los estudios sobre comportamiento parlamentario han buscado comprender qué factores explican cómo votan los legisladores. Algunas teorías atribuyen peso central a la ideología, otras a la disciplina partidaria, otras a la estructura de incentivos internos de las cámaras legislativas. En los últimos veinte años, se ha sumado un enfoque más tecnificado: el uso de grandes bases de datos de votación y técnicas estadísticas para mapear patrones de lealtad, divergencia, coaliciones, rupturas. Sin embargo, incluso los modelos más complejos enfrentan un límite evidente: no pueden acceder al razonamiento real del legislador. Observan el voto, pero no pueden entrar en la cabeza del que vota.

El estudio Persona-driven Simulation of Voting Behavior in the European Parliament with Large Language Models, publicado en junio de 2025 por Martin Kreutner y sus colegas, introduce un cambio de perspectiva radical. No se trata solo de predecir cómo votará un legislador, sino de hacer que un sistema de inteligencia artificial “razone” desde el punto de vista de ese legislador, como si pudiera hablar con su voz. Para lograrlo, los autores construyen perfiles textuales personalizados de cientos de eurodiputados, describen detalladamente los proyectos de ley que se votan, y formulan a un modelo de lenguaje la pregunta clave: si fueras esta persona, en este contexto, ¿cómo votarías y por qué?

Esta metodología invierte la lógica tradicional. Ya no es el investigador quien observa la conducta del legislador desde fuera. Ahora es un sistema computacional el que ocupa el lugar del representante, lo simula, lo encarna en texto. Y no lo hace a ciegas, sino utilizando un conjunto de datos cuidadosamente seleccionados: afiliación partidaria, país, trayectoria profesional, comisiones parlamentarias, antecedentes ideológicos, declaraciones públicas. A partir de estos insumos, el modelo —en este caso GPT-4— produce no solo una predicción de voto (“sí”, “no” o “abstención”), sino una justificación textual que intenta sonar como lo haría el legislador simulado.

La pregunta de fondo no es solo si puede predecir correctamente, sino si puede producir una argumentación coherente. ¿El sistema genera razonamientos verosímiles? ¿Responde de forma ajustada al perfil asignado? ¿Sus decisiones reflejan tensiones reales entre convicción personal y disciplina partidaria? Estas preguntas no son técnicas. Son profundamente políticas. Y el trabajo no las elude.

De los datos al discurso: el giro narrativo en la simulación política

Lo que diferencia este estudio de otros intentos de modelar comportamiento legislativo es el uso central del lenguaje como escenario de agencia. El modelo no trabaja con vectores numéricos ni con árboles de decisión. Trabaja con texto. Y ese texto no es decorativo: es el lugar donde se construye la representación. Cada legislador es traducido a un perfil narrativo. Cada proyecto de ley es presentado con contexto, antecedentes, posiciones en disputa. A partir de ese guion, el modelo genera su intervención.

No se trata de automatizar decisiones. Se trata de dramatizarlas. De hacer que el modelo actúe desde una identidad política asignada, y que ese punto de vista se exprese en forma de argumento. La decisión no es una salida calculada, sino una postura con motivación política.

Para que esto sea posible, el trabajo se apoya en una enorme tarea de construcción previa. Los autores redactan descripciones individualizadas de más de 700 eurodiputados, basadas en datos públicos. Las combinan con más de 8.000 votaciones legislativas ocurridas entre 2019 y 2022. Y diseñan un sistema de prompts que incluye biografía, contexto legislativo, posición del grupo parlamentario, y finalmente la pregunta al modelo: ¿qué votarías y por qué?

El resultado no es un número. Es un texto.

Y ese texto no solo predice: interpreta. Toma posición. Articula razones. A veces con sorprendente coherencia.

Cuando el modelo razona como si creyera en algo

Uno de los hallazgos más significativos del estudio es que los modelos de lenguaje son capaces de simular un razonamiento político ajustado al perfil que se les asigna. Si se les da un personaje de izquierda con trayectoria en derechos sociales, tienden a votar en ese sentido. Si se cambia el perfil por uno conservador, con énfasis en orden y seguridad, las decisiones también cambian, y no solo en el voto final: también en el modo de argumentar. El sistema adapta el tono, el vocabulario, el marco ideológico. El mismo texto de ley puede ser aprobado por uno y rechazado por otro, pero cada uno lo hace en sus propios términos.

Esto no es trivial. Implica que el modelo no responde por repetición, sino por simulación contextual. No aplica una lógica general. Adopta un punto de vista.

Cuando se omite el perfil individual y se formula la pregunta de forma abstracta, la tasa de acierto cae más de diez puntos. Las respuestas se vuelven vagas, genéricas, menos plausibles. Cuando se incorpora el perfil personalizado, el modelo mejora. Y no solo mejora en términos de precisión, sino también en términos narrativos. Las respuestas suenan más reales. Más políticas. Más creíbles.

El perfil como lente: identidad textual y decisión simulada

Una de las claves del estudio es la manera en que transforma la idea de identidad política en una estructura narrativa que puede ser procesada por un modelo de lenguaje. No hay aprendizaje supervisado, ni ajustes internos al modelo. Todo el comportamiento emerge del prompt, es decir, del modo en que se le formula la situación. Y el prompt incluye algo más que datos: incluye una voz. No una instrucción autoritaria, sino un marco dentro del cual el modelo tiene que operar.

Cada perfil se convierte así en una lente desde la cual se interpreta el mismo proyecto de ley. Cambia la comisión a la que pertenece la persona simulada, y cambia la prioridad argumentativa. Cambia su país, y cambian las sensibilidades. Cambia su historia pública, y cambia el punto de tensión que estructura la decisión. Esta flexibilidad no es un defecto del sistema. Es precisamente su fuerza: el modelo no se limita a responder, sino que asume un rol.

En este punto, el modelo actúa casi como un actor de reparto bien entrenado. Se le entrega un papel, un conflicto, un texto base, y se lo deja actuar. Lo notable es que, si el papel está bien construido, el modelo lo encarna con fidelidad. Y cuando se hacen pruebas de cambio —por ejemplo, tomar a una misma persona y cambiarle de partido o de país—, el razonamiento también cambia. No por azar. No como un glitch. Cambia con lógica. Con adecuación al nuevo marco. Y eso lo transforma en una herramienta poderosa para el análisis contrafáctico.

Experimentar con la política como si fuera una hipótesis

Los autores no se contentan con observar si el modelo puede simular bien lo que ocurrió. También prueban qué pasa cuando cambian las condiciones. ¿Qué habría votado este legislador si hubiera pertenecido al grupo de los Verdes? ¿Y si su biografía incluyera experiencia empresarial, en lugar de activismo sindical? ¿Qué pasaría si un socialista portugués tuviera que votar desde la lógica de un nacionalista flamenco? Estas preguntas son imposibles de responder en la realidad, pero el modelo permite ensayarlas con precisión textual.

El resultado es que se puede observar cómo se reorganizan los argumentos, cómo cambia la estructura justificativa, cómo se reconfigura la tensión entre partido, país, comisión y trayectoria. Y eso permite ver con claridad qué aspectos son determinantes, cuáles son secundarios, cuáles pesan más en la decisión.

No se trata de construir una máquina que adivina el futuro, sino una herramienta que ensaya posibilidades internas al discurso político.

Y en ese espacio, la simulación se convierte en análisis profundo.

Deliberar artificialmente no es trivializar la deliberación

Una objeción frecuente a este tipo de aproximaciones es que convierten la política en un juego de lenguaje sin consecuencias. Pero el estudio deja en claro que eso es falso. La estructura del Parlamento Europeo, como toda institución deliberativa, está hecha de lenguaje. Los votos se justifican, se debaten, se inscriben en registros. Se pronuncian. Se razonan. Que un modelo pueda recrear eso con coherencia no es reducir la política a texto, sino asumir que el texto es una dimensión constitutiva de la política misma.

Esto no implica que el modelo entienda. Pero sí implica que puede reproducir formas consistentes de agencia discursiva, a partir de una identidad que se le asigna y de un conflicto que se le presenta. No es conciencia. Pero es imitación estructurada. Y esa imitación, si está bien diseñada, permite explorar patrones de argumentación y estructura de preferencias sin acceder a la mente del legislador.

Lo importante es no confundir la simulación con la representación real. Pero sí reconocer que, en muchos casos, la simulación dice más sobre las condiciones del sistema que el comportamiento empírico aislado. Porque permite contrastes, ensayos, exploraciones que en el mundo real serían imposibles, o políticamente inaceptables.

El sesgo ideológico en los modelos: la izquierda como punto ciego disfrazado de centro

Aquí aparece uno de los puntos más delicados del estudio, aunque los autores lo tratan con cautela. Todo modelo de lenguaje está entrenado sobre un corpus. Y ese corpus no es ideológicamente neutro. Los grandes modelos como GPT-4 han sido entrenados con millones de textos, artículos periodísticos, publicaciones académicas, sitios web, redes sociales. Y la distribución de opiniones, el tipo de marco conceptual dominante, las categorías morales implícitas, no son simétricas.

De hecho, muchos estudios recientes muestran que los LLMs tienden a reflejar posturas de centro-izquierda, especialmente en temas sociales, ambientales, de derechos humanos o regulación estatal. No es un sesgo evidente a primera vista, porque se presenta como razonabilidad. Pero es una forma de razonabilidad muy específica. Tiene más afinidad con el cosmopolitismo liberal progresista que con otras tradiciones políticas. Lo que se considera un argumento “coherente” o “sensato” muchas veces coincide con lo que un votante socialdemócrata educado podría aceptar.

Esto tiene consecuencias.

Porque si un modelo está sesgado —incluso ligeramente— hacia una sensibilidad política específica, ese sesgo se manifiesta también cuando simula otros actores. Es decir: si se le pide a un modelo que actúe como un conservador católico rumano, pero la lógica interna con la que organiza el discurso sigue teniendo una estructura liberal secularizada, el resultado va a sonar inconsistente. Artificial. Forzado.

El estudio no lo discute en estos términos explícitos, pero lo deja entrever. Las simulaciones de legisladores más alejados del centro progresista tienden a ser menos precisas, menos matizadas, menos consistentes. Como si el modelo no pudiera entrar del todo en esa subjetividad. Como si los marcos mentales con los que fue entrenado no le permitieran habitar ciertas posiciones sin convertirlas en parodia o en contradicción.

Cuando el lenguaje del modelo impone los límites del razonamiento simulado

Una consecuencia crítica del sesgo ideológico en los modelos es su impacto sobre la capacidad de representar con fidelidad identidades políticas que no se ajustan al marco implícito dominante en su entrenamiento. Si el modelo fue expuesto masivamente a fuentes culturales alineadas con valores progresistas —diarios de centroizquierda, instituciones académicas liberales, documentos de organismos internacionales con sesgo normativo, redes sociales anglófonas politizadas— entonces su forma de razonar se afina para producir respuestas aceptables dentro de ese horizonte moral. Lo que queda fuera de ese marco, no desaparece: se deforma.

Este fenómeno puede observarse en cómo el modelo argumenta ciertas decisiones. Cuando se simula a un legislador ecologista o defensor de derechos sociales, el sistema produce razonamientos sofisticados, sensibles, ricos en referencias a dignidad, justicia, sostenibilidad, equidad. Pero cuando debe representar a un eurodiputado que prioriza soberanía nacional, tradición familiar, control migratorio o competitividad económica, los argumentos tienden a empobrecerse. Se tornan vagos, o bien defensivos, como si el modelo pidiera disculpas por sostener una postura no consensual. No porque esos temas no puedan ser articulados políticamente con coherencia, sino porque el modelo no tiene los recursos discursivos entrenados para hacerlo bien.

El problema no es la respuesta. Es la gramática interna con la que esa respuesta se construye.

Este sesgo —no ideológico en el contenido, sino estructural en las formas del sentido— produce una política simulada desigual. Algunas posiciones son articuladas con profundidad; otras, apenas con una pátina de credibilidad. Esto no se corrige afinando el prompt. Es una consecuencia del entrenamiento general. El modelo tiende a representar con más soltura lo que ha visto más veces. Y lo que ha visto más veces, en su corpus de texto, no es una distribución neutra de posiciones políticas.

Sesgos que no son errores: el modelo como reflejo de una hegemonía cultural

Lo que aquí está en juego es más que un problema técnico. Es un problema epistemológico. Si el modelo solo puede razonar con soltura dentro del marco discursivo hegemónico en su corpus, entonces lo que produce como “simulación de agencia política” no es un espejo del espectro ideológico real, sino una versión reducida de ese espectro, afinada por la normatividad implícita de sus fuentes. Aun cuando intente representar voces disidentes, lo hace desde una lengua colonizada por un centro discursivo particular.

Esto no convierte al modelo en un actor político de izquierda. Pero sí en un dispositivo que reproduce sin fricción ciertos lenguajes del poder cultural progresista, mientras tropieza o se simplifica ante visiones del mundo conservadoras, soberanistas, productivistas, religiosas o simplemente escépticas del consenso liberal global. Esa asimetría no se elimina corrigiendo salidas. Es estructural. Y se filtra en cada razonamiento simulado.

Para un observador no advertido, el resultado puede ser convincente. El modelo suena articulado. Defiende su postura. Pero si uno examina con detenimiento qué tipos de valores invoca, qué conceptos aparecen, qué temas son naturalizados y cuáles evitados, se percibe una forma sutil de filtro ideológico. Un filtro no impuesto explícitamente, pero operante en la gramática del razonamiento.

Cuando la simulación produce una falsa pluralidad

Este punto es clave. Porque si se construye una herramienta que pretende representar múltiples voces políticas, pero en el fondo simula mejor unas que otras, entonces la pluralidad que se ofrece es ilusoria. Hay más personajes, sí. Más perfiles. Pero la estructura de verosimilitud interna favorece siempre a los mismos. Se les da ventaja en articulación, en matiz, en precisión conceptual. Y eso distorsiona el campo de juego.

En el contexto del Parlamento Europeo, esto es particularmente relevante. Se trata de una cámara multilingüe, plurinacional, con partidos que representan tradiciones ideológicas fuertemente divergentes. No es lo mismo articular una posición desde el liberalismo escandinavo que desde el conservadurismo polaco. Pero si el modelo no distingue con la misma calidad esos marcos, los iguala en apariencia mientras los jerarquiza en ejecución.

El estudio deja entrever esto en sus resultados. Hay partidos cuyos representantes son simulados con precisión admirable. Otros, con desprolijidades discursivas o argumentos genéricos. A veces el sesgo se nota en el tono. Otras, en los temas evitados. En los silencios. En lo que nunca se dice, aunque debería. No por censura, sino por omisión entrenada. Porque el modelo aprendió más veces a hablar desde ciertos lugares que desde otros.

Y esa desigualdad en la simulación tiene consecuencias metodológicas.

¿Qué representa un modelo que representa desigualmente?

Si se quiere utilizar este tipo de herramientas para el análisis de procesos deliberativos, hay que asumir sus límites estructurales. No basta con ajustar los inputs. No basta con cambiar el formato de los prompts. Hay posiciones ideológicas que el modelo puede habitar con soltura, y otras que solo puede imitar superficialmente. Esto pone en cuestión su capacidad de simular agencia política en sentido pleno.

Y plantea una pregunta inquietante: ¿hasta qué punto esta técnica simula a los legisladores, y hasta qué punto los reemplaza por versiones políticamente aceptables dentro del marco normativo del corpus de entrenamiento?

La simulación como espejo invertido del sistema político

Una herramienta como la desarrollada en el estudio no puede ser juzgada solo por su desempeño técnico. Es necesario interrogar su lugar dentro de un campo de representaciones más amplio. ¿Qué está haciendo un modelo de lenguaje cuando simula la voz de un legislador? Está produciendo una versión textual de una subjetividad pública. Está ocupando un espacio discursivo que, en el marco institucional del Parlamento Europeo, no es neutro: es el producto de múltiples tensiones históricas, de mediaciones simbólicas, de relaciones de poder sedimentadas. El modelo entra en ese espacio y lo reescribe desde los márgenes de su propia gramática. No refleja la política, la reconfigura desde una lógica distinta. No porque pretenda hacerlo, sino porque no puede hacer otra cosa.

En este punto, el uso del modelo se vuelve una forma de diagnóstico. Al observar qué tipos de discurso produce con más soltura, qué marcos ideológicos puede sostener sin contradicción, qué valores aparecen recurrentemente y cuáles quedan desplazados, se puede trazar una cartografía de su estructura interna. Esa cartografía no coincide con el mapa de ideologías reales, sino con una versión textual de la legitimidad discursiva entrenada. Los partidos progresistas tienden a estar sobre-representados en la gramática del modelo no porque se los privilegie explícitamente, sino porque su forma de argumentar ha sido más frecuente en el corpus de entrenamiento.

Esto se vuelve evidente cuando se observa cómo el modelo responde ante temas divisivos. En cuestiones como cambio climático, derechos de minorías, regulación financiera, migración o vigilancia digital, el modelo produce respuestas articuladas y sensibles desde marcos progresistas. Pero cuando se le exige sostener una postura escéptica —por ejemplo, una crítica conservadora a las políticas de género, una defensa del proteccionismo comercial o una preocupación por el impacto cultural de la inmigración masiva— la respuesta se vuelve incómoda, dubitativa, menos rica. No porque esas posiciones sean menos políticas, sino porque son menos frecuentes en el entorno textual donde el modelo aprendió a hablar.

Esto no puede atribuirse a fallos accidentales. Es una consecuencia estructural. El modelo está optimizado para sonar razonable, y lo razonable —en su corpus— tiene un sesgo sistemático. Razón por la cual ciertas posiciones requieren forzar el lenguaje más allá de su equilibrio nativo. El modelo puede reproducir una idea conservadora, pero no con el mismo tono de seguridad interna que logra cuando articula una posición socialdemócrata. La primera le cuesta. La segunda le sale natural. Esa diferencia no se ve en el resultado, sino en el esfuerzo que demanda producirlo.

La inteligibilidad como forma de dominación sutil

En sistemas parlamentarios complejos, las decisiones no se legitiman únicamente por su resultado, sino por su razonamiento. Lo que se debate no es solo qué votar, sino cómo argumentarlo. Y si una herramienta como esta empieza a participar de esos procesos —ya sea como asistencia, como simulador, como diagnóstico o como ayuda narrativa— entonces su sesgo lingüístico se vuelve un factor de poder. Porque no solo representa: preselecciona qué tipo de discurso puede sonar legítimo. Qué tipo de justificación es verosímil. Qué tipo de tensión interna se puede articular sin parecer artificial.

Esto redefine el horizonte de lo pensable dentro de la deliberación simulada. Algunas ideas parecen razonables porque el modelo las articula con recursos más ricos. Otras se perciben más primitivas, más torpes, porque el modelo no sabe darles cuerpo. Y eso crea una falsa jerarquía entre las posiciones: no por su contenido, sino por su forma de aparecer. El modelo no censura. Pero favorece. No excluye. Pero empobrece.

Y en ese empobrecimiento hay una forma de silenciamiento.

¿Qué hacer con un modelo que piensa con palabras prestadas?

No se puede simplemente descartar esta técnica por sus sesgos. Su potencia para el análisis comparado, para la exploración contrafáctica, para la comprensión de estructuras de decisión es real. Pero debe utilizarse con una vigilancia crítica constante. No como una caja negra, sino como un operador textual cuyos límites hay que estudiar tanto como sus salidas. Porque lo que el modelo puede decir está determinado por lo que aprendió a considerar decible. Y eso es político.

Los investigadores que usen esta metodología deben preguntarse no solo si la simulación es precisa, sino a quién representa bien y a quién representa mal. Qué se puede decir con elegancia y qué solo se puede insinuar con torpeza. Qué tipos de conflicto se articulan sin fricción y cuáles se tratan como anomalías que hay que disolver rápido. En ese mapeo de posibilidades, se juega la utilidad epistemológica real del sistema.

Hacia una ética del uso crítico en la simulación parlamentaria

Si el modelo puede votar como un legislador, ¿puede ser usado para redactar discursos reales? ¿Puede ayudar a posicionarse ante temas complejos? ¿Puede sugerir estrategias de persuasión? Estas preguntas no son futuras. Ya están activas. Y sin un marco ético claro, el uso de esta tecnología puede consolidar estructuras de dominación simbólica aún más opacas que las actuales. La política siempre ha sido un espacio de representación desigual. Pero cuando las desigualdades se insertan directamente en las condiciones del lenguaje, dejan de ser visibles. Y ese es el mayor riesgo: una hegemonía silenciosa en el corazón mismo del razonamiento público.

Una herramienta como la del estudio solo es legítima si se conoce su limitación. Y si se reconoce que su capacidad de simular agencia no es un espejo del mundo, sino una construcción lingüística atravesada por todos los sesgos, vacíos, fantasmas y preferencias que arrastra su entrenamiento. No por eso es inútil. Pero es, más que nunca, un objeto político.

Paper: Persona-driven Simulation of Voting Behavior in the European Parliament with Large Language Models

Para estar informado, Ingresá o Creá tu cuenta en MundoIA...

Entrar

Recordá revisar la carpeta de "no deseados", el correo puede llegar allí