Investigadores de la Florida State University (FSU) hallan evidencia de que palabras y giros sobreutilizados por modelos conversacionales como ChatGPT están empezando a «filtrarse» al inglés oral espontáneo: en corpus de habla se detectaron aumentos notables en términos como delve, intricate o underscore, apunta la investigación aceptada para la conferencia AIES 2025.
De la pantalla a la conversación: qué midieron los autores
El equipo interdisciplinario de FSU —Departamentos de Lenguas Modernas y Lingüística, Informática y Matemáticas— analizó 22,1 millones de palabras extraídas de lenguaje hablado no guionado (entre ellas, podcasts conversacionales sobre ciencia y tecnología) para comparar patrones léxicos antes y después del lanzamiento de ChatGPT en 2022. El objetivo fue responder a una pregunta clave: ¿estamos repitiendo lo que nos sugiere la IA o la IA está condicionando cambios en el propio sistema del lenguaje humano?
Como lo planteó el investigador principal, Tom Juzek: “Al analizar las tendencias léxicas antes y después del lanzamiento de ChatGPT, encontramos una convergencia entre las elecciones de palabras humanas y los patrones asociados a los LLM —palabras que son sobreutilizadas por la IA”.
Resultados clave: qué palabras subieron y cuánto
El estudio documenta aumentos significativos en el uso de numerosos términos asociados a modelos conversacionales. Palabras como delve y intricate (usadas en inglés por algunos LLM) mostraron subidas notorias, en especial en ámbitos académicos y educativos. Otras entradas con incrementos importantes incluyen surpass, boast, meticulous, strategically, garner y underscore —términos de tono formal que antes eran poco habituales en el habla espontánea.
Los autores señalan que casi tres cuartos de las palabras objetivo investigadas registraron aumentos en su uso; en varios casos la frecuencia más que se duplicó. Además, el equipo halló que estos saltos afectan específicamente a las “palabras AI” y no a sus sinónimos (por ejemplo, underscore aumentó mientras que su sinónimo accentuate no lo hizo), lo que sugiere un efecto directo de la lengua que producen los modelos.
Métodos y límites
Los investigadores —incluyendo a Bryce Anderson y Riley Galpin— combinaron análisis computacional de grandes corpus con comparaciones temporales. Anderson, primer autor, explicó la motivación:
“Mi interés surgió al ver cómo la IA empuja los límites en industrias clave y comprobar que esa influencia no se limita al uso de la herramienta, sino que puede condicionar aspectos sociales como el lenguaje”.
Los autores reconocen límites importantes: el estudio se centra en registros hablados de ciertos géneros (p. ej. podcasts científicos) y no cubre todos los contextos sociolingüísticos; además, detectar causalidad —si la IA provoca el cambio o lo amplifica— requiere más trabajo longitudinal y experimental.
Implicaciones éticas y sociales
Riley Galpin subraya la dimensión ética: “Con la capacidad de los LLM para influir en el lenguaje humano surgen preguntas sobre cómo los sesgos y la desalineación de los modelos pueden empezar a moldear comportamientos”.
Entre los riesgos figuran la normalización de giros de registro inadecuados en contextos informales, la difusión inadvertida de sesgos léxicos y la pérdida de diversidad lingüística en ciertos dominios. Para comunicadores y educadores, el fenómeno plantea la urgencia de enseñar alfabetización crítica frente a salidas de IA y de diseñar modelos que no impongan estilos rígidos sobre el habla humana.
Qué viene: presentación y siguientes pasos
El trabajo fue aceptado para presentarse en la 8ª Conferencia sobre IA, Ética y Sociedad (AIES) y será publicado en los Proceedings del congreso este octubre. Los autores anuncian continuación de la línea de investigación para distinguir si la IA amplifica patrones lingüísticos ya emergentes o los genera directamente, y piensan ampliar corpus y métodos.
La investigación de FSU sugiere que la adopción masiva de chatbots como ChatGPT está dejando rastros que van más allá de la pantalla: están empezando a permear cómo hablamos. Como advierten los autores, entender si la IA moldeará el lenguaje o solo acelerará tendencias preexistentes es una cuestión crucial para políticas de formación, diseño de modelos y gobernanza del lenguaje en la era de la inteligencia artificial.