¿Puede un chatbot imitar a un estudiante de español real? Una aproximación a la generación de errores deliberados con IA

Autores/as

  • Ángel Huete-García University of Oxford, Oxford, Reino Unido

DOI:

https://doi.org/10.15381/lengsoc.v23i2.28463

Palabras clave:

chatbots, inteligencia artificial, lexicografía, enseñanza de español, escritura

Resumen

Esta investigación analiza los principales retos y avances que ha supuesto el uso de los chatbots de IA generativa para la generación de textos con errores lingüísticos con fines pedagógicos. En concreto, se va a describir la metodología seguida para la reproducción de estos errores en español a través de textos argumentativos. Estos textos presentaron errores inducidos con los chatbot, que simulaban ser un estudiante real, además de añadir otra versión corregida por la misma herramienta. La metodología empleada se ha basado en una serie de prompts empleados para el beneficio del chatbot de OpenAI, ChatGPT, que se aplicaron también a los chatbots de Google, Gemini, y al de Microsoft, Copilot. El conocimiento humano (Huete-García y Tarp, 2024) fue fundamental en la ecuación para obtener el resultado esperado. Entre las principales conclusiones que se pueden obtener de la investigación están que los chatbots pueden proporcionar un apoyo funcional y flexibilizar el proceso de obtención de datos como recurso docente. Pero los conocimientos, la cultura, las habilidades y la intuición lingüística de los docentes de español son cruciales para que funcione. Si bien, los materiales facilitados por la IA se constituyen como un material complementario útil y fácilmente explotable en una clase de español.

Biografía del autor/a

  • Ángel Huete-García, University of Oxford, Oxford, Reino Unido

    Es doctor en Estudios Humanísticos por la Universitat Rovira i Virgili (2022) de Tarragona en España. En la actualidad trabaja como profesor de lengua española y traducción en la Universidad de Oxford (Reino Unido) en el marco del Grado en Lenguas Modernas (Español). También ejerce de tutor de español en Mansfield College para estudiantes del programa internacional procedentes de instituciones de la Ivy League (EE. UU.). Anteriormente se ha dedicado a la enseñanza del español y al asesoramiento lingüístico desde diferentes perspectivas: durante 5 años ha sido profesor de español en una amplia variedad de cursos y niveles en el Centro de Estudios Hispánicos de la universidad de Tarragona, donde también fue profesor de la asignatura de Enseñanza del Léxico en el Máster oficial en Enseñanza de Lenguas: Español como Lengua Extranjera. Asimismo, ha ejercido durante casi 3 años como asesor en lengua española (corrección y traducción) en el Servicio de Lenguas de la misma universidad. Ha compaginado estas tareas con las de examinador oficial y creador de los exámenes DELE para el Instituto Cervantes. Sus principales intereses de investigación son la lexicografía pedagógica, la enseñanza del español con un enfoque léxico y la sociolingüística. Es autor del libro Introducción a la Teoría de las Funciones Lexicográficas (Arco Libros, 2023), que encontrarán en este enlace: https://www.arcomuralla.com/detalle_libro.php?id=1093. Su experiencia internacional en investigación y docencia pasa por estancias de larga duración en la Universidad de Aarhus (Dinamarca) y en la Universidad Politécnica de Shenzhen (China), además de participar en proyectos lexicográficos de alta tecnología lingüística. Desde el año 2019 contribuye a la transferencia de conocimiento como editor asociado de la Revista Internacional de Lenguas Extranjeras (RILE).

Referencias

Alonso-Ramos, M. y García-Salido, M. (2019). Testing the Use of a Collocation Retrieval Tool Without Prior Training by Learners of Spanish. International Journal of Lexicography, 32(4), 480-497. https://doi.org/10.1093/ijl/ecz016

Álvarez Higuita, A. (2009). Caracterización de la escritura de textos narrativos mediada por un programa de reconocimiento de voz y un procesador de textos en niños con trastorno por déficit de atención [Tesis Doctoral, Universidad de Antioquía, Colombia]. https://bibliotecadigital.udea.edu.co/handle/10495/1254

Bailini, S. (2024). Evaluación y feedback en entornos virtuales de aprendizaje [Assessment and Feedback in Virtual Learning Environments]. En J. Muñoz-Basols, M. Fuertes Gutiérrez y L. Cerezo (Eds.), La enseñanza del español mediada por tecnología. De la justicia social a la Inteligencia Artificial (IA) (pp. 209-244). Routledge.

Bang, Y., Cahyawijaya, S., Lee, N., Dai, W., Su, D., Wilie, B., Lovenia, H., Ji, Z., Yu, T., Chung, W. V., Do, Q., Xu, Y. y Fung, P. (2023). A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity. En Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics (Volume 1: Long Papers) (pp. 675–718). Association for Computational Linguistics.

Belda-Medina, J. y Calvo-Ferrer, J. R. (2022). Using Chatbots as AI Conversational Partners in Language Learning. Applied Sciences, 12(17), 8427. https://doi.org/10.3390/app12178427

Calañas Continente, J. A. y Domínguez Vázquez, M. J. (2023). About Sustainable and Socially Responsible Lexicography: State of the Art. Quaderns de Filologia: Estudis Lingüístics, 28, 9-19.

Chaudhry, M. A. y Kazim, E. (2022). Artificial Intelligence in Education (AIEd). A High-Level Academic and Industry Note 2021. AI and Ethics, 2, 157–162. https://doi.org/10.1007/s43681-021-00074-z.

Chomsky, N. (1986). Knowledge of language: its nature, origin, and use. Praeger Publishers.

Dalton, D. W. y Hannafin, M. J. (1987). The effects of word processing on written composition. The Journal of Educational Research, 80(6), 338–342. http://www.jstor.org/stable/27540262

De Schryver, G.-M. (2023). Generative AI and Lexicography. The Current State of the Art Using ChatGPT. International Journal of Lexicography, 36(4), 355-387. https://doi.org/10.1093/ijl/ecad021

Díaz Villa, A. M. (2005). Tipología de errores gramaticales para un corrector automático. Procesamiento del Lenguaje Natural, 35, 409-416. https://rua.ua.es/dspace/bitstream/10045/1341/1/PLN_35_50.pdf

Dokukina, I. y Gumanova, J. (2020). The Rise of Chatbots. New Personal Assistants in Foreign Language Learning. Procedia Computer Science, 169, 542–546. https://doi.org/10.1016/j.procs.2020.02.212.

Dooly M. y Comas Quinn, A. (2024). Accesibilidad a la tecnología y justicia social [Access to Technology and Social Justice]. En J. Muñoz-Basols, M. Fuertes Gutiérrez y L. Cerezo (Eds.), La enseñanza del español mediada por tecnología. De la justicia social a la Inteligencia Artificial (IA) (pp. 48-69). Routledge.

Doughty, C. y Long, M. (2003). The Handbook of Second Language Acquisition. Blackwell Publishing.

Gutiérrez y Restrepo, E., Baldassarre, M. y J. G. Boticario (2019). Accessibility, Biases and Ethics in Chatbots and Intelligent Agents for Education. EDULEARN19 Proceedings, 8824-8833. https://library.iated.org/view/GUTIERREZYRESTREPO2019ACC

Huete-García, Á. y S. Tarp (2024). Training an AI-based Writing Assistant for Spanish Learners: the Usefulness of Chatbots and the Indispensability of Human-assisted Intelligence. Lexikos, 34(1), 21-40. https://doi.org/10.5788/34-1-1862

Escobar Hernández, J. C. (2021). La Inteligencia Artificial y la Enseñanza de lenguas: una aproximación al tema. Decires , 21(25), 29-44. https://doi.org/10.22201/cepe.14059134e.2021.21.25.3

Ramírez Bustamante, F., Rodríguez Selles, Y., y Sánchez León, F. (1994). Tipología de errores gramaticales del español para un sistema automático de corrección de textos. Actas del X Congreso de Lenguajes Naturales y Lenguajes Formales, Sevilla.

Ferreira Cabrera, A. y Elejalde Gómez, J. (2017). Análisis de errores recurrentes en el Corpus de Aprendices de Español como Lengua Extranjera, CAELE. RBLA, Belo Horizonte, 17(3), 509-537. https://doi.org/10.1590/1984-6398201710927

Ferreira Cabrera, A., Elejalde, J. y Vine, A. (2014). Análisis de Errores Asistido por Computador basado en un Corpus de Aprendientes de Español como Lengua Extranjera. Revista signos, 47(86), 385-411. https://dx.doi.org/10.4067/S0718-09342014000300003

Frankenberg-García, A. (2020). Combining User Needs, Lexicographic Data and Digital Writing Environments. Language Teaching, 53(1), 29-43. https://doi.org/10.1017/S0261444818000277

Frankenberg-García, A., Lew, R., Roberts, J. C., Rees, G. P. y Sharma, N. (2019). Developing a Writing Assistant to Help EAP Writers with Collocations in Real Time. ReCALL, 31(1), 23-39. https://doi.org/10.1017/S0958344018000150

Fuentes Morán, M. T., Domínguez Santana, F. y Travieso Rodríguez, C. (2024). La inteligencia artificial como herramienta lexicográfica: hacia una descripción analítica en español [Ponencia]. X Congreso de Lexicografía Hispánica, Universidad de Murcia, España.

Fuertes-Olivera, P. A. (2024). Making Lexicography Sustainable: Using ChatGPT and Reusing Data for Lexicographic Purposes. Lexikos, 34(1), 123-140. https://doi.org/10.5788/34-1-1883

Fuertes-Olivera, P. A. y Tarp, S. (2020). A Window to the Future: Proposal for a Lexicography-assisted Writing Assistant. Lexicographica, 36, 257-286. https://doi.org/10.1515/lex-2020-0014

González-Lloret, M. (2024). Planificación y desarrollo curricular en entornos virtuales [Curriculum Planning and Development in Virtual Environments]. En J. Muñoz-Basols, M. Fuertes Gutiérrez y L. Cerezo (Eds.), La enseñanza del español mediada por tecnología. De la justicia social a la Inteligencia Artificial (IA) (pp. 48-69). Routledge.

Granger, S. y Paquot, M. (2015). Electronic Lexicography Goes Local: Design and Structures of a Needs-driven Online Academic Writing Aid. Lexicographica, 31(1), 118-141. https://doi.org/10.1515/lexi-2015-0007

Katz, V. S., Gonzalez, C. y Clark, K. (2017). Digital Inequality and Developmental Trajectories of Low-Income, Immigrant, and Minority Children. Pediatrics, 140(2): 132–136. https://doi.org/10.1542/peds.2016-1758R

MacArthur, C. A. (2009). Reflections on research on writing and technology for struggling writers. Learning Disabilities Research & Practice, 24(2), 93–103. https://doi.org/10.1111/j.1540-5826.2009.00283

Martínez Martínez, S. (2021). ‘Chatbots’ y sesgos: aliados para el discurso del odio. COMeIN, 114. https://doi.org/10.7238/c.n114.2168

Martín-Marchante, B. (2022). TIC e inteligencia artificial en la revisión del proceso de escritura: su uso en las universidades públicas valencianas. Research in Education and Learning Innovation Archives, 28, 16-31. https://doi.org/10.7203/realia.28.20622

Mendoza Flores, M. (2020). Guía didáctica para la reducción de la disortografía en estudiantes de Derecho. REPSI - Revista Ecuatoriana de Psicología, 3(6), 119-130. https://doi.org/10.33996/repsi.v3i6.38

Muñoz-Basols, J., Fuertes Gutiérrez, M. y Cerezo, L. (Eds.) (2024). La enseñanza del español mediada por tecnología. De la justicia social a la Inteligencia Artificial (IA). Routledge.

Muñoz-Basols, J. y Fuertes Gutiérrez, M. (2024). Oportunidades de la inteligencia artificial (IA) en la enseñanza y el aprendizaje de lenguas. En J. Muñoz- Basols, M. Fuertes Gutiérrez y L. Cerezo (Eds.), La enseñanza del español mediada por tecnología. De la justicia social a la Inteligencia Artificial (IA) (pp. 343-366). Routledge.

Barcroft, J. y Muñoz-Basols, J. (2022). Spanish Vocabulary Learning in Meaning-Oriented Instruction. Routledge.

Pokrivcakova, S. (2019). Preparing teachers for the application of AI-powered technologies in foreign language education. Journal of Language and Cultural Education, 7(3), 135–153. https://doi.org/10.2478/jolace-2019-0025

Rees, G. P. y Lew, R. (2024). The Effectiveness of OpenAI GPT-Generated Definitions Versus Definitions from an English Learners’ Dictionary in a Lexically Orientated Reading Task. International Journal of Lexicography, 37(1), 50–74. https://doi.org/10.1093/ijl/ecad030

Sharples, M. y Pérez, R. P. (2022, 4 de julio). Original Essays Written in Seconds: How ‘Transformers’ will Change Assessment. The Times Higher Education.

Tarp, S., Fisher, K. y Sepstrup, P. (2017). L2 Writing Assistants and Context-Aware Dictionaries: New Challenges to Lexicography. Lexikos, 27, 494-521. http://dx.doi.org/10.5788/27-1-1412

Tarp, S. (2020). Integrated Writing Assistants and their Possible Consequences for Foreign-Language Writing and Learning. En A. Bocanegra-Valle (Ed.), Applied Linguistics and Knowledge Transfer: Employability, Internationalization and Social Challenges (pp. 53-76). Peter Lang. https://doi.org/10.3726/b16992

Tarp S. y Nomdedeu-Rull A. (2024). Who has the last word? Lessons from using ChatGPT to develop an AI-based Spanish writing assistant. Círculo de Lingüística Aplicada a la Comunicación, 97, 309-321. https://doi.org/10.5209/clac.91985

Verlinde, S. (2011). Modelling Interactive Reading, Translation and Writing Assistants. En P. A. Fuertes-Olivera y H. Bergenholtz (Eds.), e-Lexicography: The Internet, Digital Initiatives and Lexicography (pp. 275-286). Continuum.

Wolfe, E. W., Bolton, S., Feltovich, B. y Bangert, A. W. (1996). A study of word processing experience and its effects on student essay writing. Journal of educational computing research, 14(3), 269–283. https://doi.org/10.2190/XTDU-J5L2-WTPP-91W2

Xue, J., Wang, Y-C, Wei, C., Liu, X., Woo, J. y Jay Kuo, C. (2023). Bias and Fairness in Chatbots: An Overview. APSIPA Transactions on Signal and Information Processing, 1, 1-26. https://doi.org/10.48550/arXiv.2309.08836

Descargas

Publicado

2024-12-30

Número

Sección

Dossier sobre inteligencia artificial, lenguaje y discurso digital

Cómo citar

Huete-García, Ángel. (2024). ¿Puede un chatbot imitar a un estudiante de español real? Una aproximación a la generación de errores deliberados con IA. Lengua Y Sociedad, 23(2), 649-669. https://doi.org/10.15381/lengsoc.v23i2.28463