Uso de la transcripción fonética para lograr que avatares de inteligencia artificial pronuncien discurso en lengua quechua: caso Illariy

Autores/as

DOI:

https://doi.org/10.15381/lengsoc.v23i2.28422

Palabras clave:

escritura fonética, quechua, avatar, inteligencia artificial, Illariy

Resumen

La inteligencia artificial (IA) ha generado noticia este año. En su quinta temporada, el noticiario Letras TV Willakun de la Facultad de Letras y Ciencias Humanas de la Universidad Nacional Mayor de San Marcos es conducido por Illariy (vocablo quechua que significa “Amanecer”), un avatar generado por inteligencia artificial, el único en su género que habla una lengua originaria. Este hecho nos lleva a plantearnos: ¿Cómo influye la transcripción fonética en la capacidad de la inteligencia artificial para generar discursos coherentes en lengua quechua? La investigación tiene como objetivo describir el flujo de trabajo concentrado en cómo la transcripción fonética puede lograr que la inteligencia artificial articule un discurso en lengua quechua. La metodología de la investigación tiene un enfoque cualitativo, basado en la observación y el análisis del flujo de trabajo para generar que los avatares pronuncien un discurso en quechua. Entre los resultados podemos observar la existencia de una pronunciación diferenciada entre el español y el quechua, limitaciones en la articulación de algunas consonantes de la lengua quechua y que resultan irreproducible en contextos tecnofonológicos, así como el uso de pausas y comas para la producción de una oralidad quechua en el Software D-ID.

Biografía del autor/a

  • Óscar Huamán-Águila, Universidad Nacional Mayor de San Marcos, Lima, Perú

    Es licenciado en Literatura y magíster en Lingüística por la Universidad Nacional Mayor de San Marcos (UNMSM). Sus áreas de investigación se centran en la literatura de pueblos originarios de América Latina, la lingüística andina y el contacto de la lengua quechua con la lengua arawak de la Amazonía. Se desempeña como docente de pregrado y de idioma quechua en el Centro de Idiomas de la Facultad de Letras y Ciencias Humanas de la UNMSM. Además, trabaja en la traducción de los noticiarios quechuas de Letras TV Willakun de la Facultad de Letras. En 2020, obtuvo una mención de reconocimiento del "Premio Casa de las Américas 2020" en la categoría de estudios sobre Culturas Originarias de América. Ha publicado artículos en revistas especializadas y es miembro colaborador del grupo de investigación "Discursos, representaciones y estudios interculturales (EILA)" de la UNMSM.

  • Carlos Fernández-García, Universidad Nacional Mayor de San Marcos, Lima, Perú

    Es un comunicador experto en tecnologías emergentes como la realidad aumentada e inteligencia artificial aplicadas al periodismo, la comunicación audiovisual, organizacional y el diseño profesional. Es docente investigador RENACYT, doctorando en Educación de la Universidad Nacional Mayor de San Marcos, y magíster en Educación con diplomados en Realidad Aumentada y Realidad Virtual (Universidad Tecnológica Tech, México) y en Acompañamiento y Evaluación de la Tesis Universitaria (Universidad Nacional Mayor de San Marcos, Perú). Además, tiene una especialización en Inmmersive Journalism: Virtual Reality & 360 Video del Knight Center for Journalism in the Americas. Se desempeña como docente asociado del pregrado de Comunicación Social y de la maestría en Comunicaciones en el posgrado de la Facultad de Letras de la UNMSM. Pertenece a MEDIALAB, un grupo de investigación de la UNMSM reconocido en 2022 como el mejor grupo de investigación de la Facultad de Letras y Ciencias Humanas. Actualmente, es jefe encargado de la Oficina de Comunicación e Imagen Institucional de la misma facultad. Entre sus logros más destacados se incluyen la fundación del canal de eventos y conferencias Letras TV, la creación y producción del noticiario universitario en quechua Letras TV Willakun, la realización de la campaña de realidad aumentada para la prevención del COVID en quechua, y la creación de Illariy, la primera presentadora de noticias generada por Inteligencia Artificial en lengua quechua. Es autor del libro "7 Ensayos de la Interpretación de la Realidad Aumentada" (Universidad Privada del Norte, Perú, 2020) y coautor de siete capítulos en libros como “Artificial Intelligence in Higher Education and Scientific Research Future” (Singapur, 2023), entre otros. Ha publicado artículos científicos en revistas como The Electronic Journal of Information Systems in Developing Countries [Scopus] (China, 2020), Actas de Diseño [Dialnet] (Argentina, 2021 y 2022), EVUlution (Colombia, 2019), EducaUMCH [Latindex] (Perú, 2023), y otras.

  • Carlos Gonzales-García, Universidad Nacional Mayor de San Marcos, Lima, Perú

    Es comunicador y especialista en Periodismo y Relaciones Públicas. Es licenciado en Ciencias de la Comunicación y Magíster en Periodismo y Comunicación Multimedia (2016) por la Universidad de San Martín de Porres (1998) y Magíster en Investigación de la Comunicación Social por la Universidad Nacional Mayor de San Marcos (2015). Se ha desempeñado en Relaciones Públicas y Periodismo en gremios empresariales como la Cámara de Comercio de Lima, ONG como Fovida, y en medios periodísticos de Lima y Huancayo. Es autor de artículos en revistas científicas indexadas en WoS y Scopus en Ecuador, Chile, Argentina y España. Actualmente, coordina MediaLab en la Facultad de Letras y Ciencias Humanas de la UNMSM. Ha sido profesor invitado en la Pontificia Universidad Católica del Perú (2009), la Universidad Particular de Chiclayo (2010) y el Instituto de Arquitectura, Diseño y Arte de la Universidad de Ciudad Juárez, México (2018). También ha sido profesor en la Universidad Nacional del Centro del Perú (2002-2013) y en la Universidad de San Martín de Porres (2016-2018). Actualmente, coordina la maestría en Comunicaciones de la Facultad de Letras y Ciencias Humanas de la UNMSM y es miembro del consejo directivo de las revistas 'Tesis' y 'Socialium'. En noviembre de 2015, recibió un reconocimiento como investigador con publicación científica otorgado por el Vicerrectorado de Investigación de la UNMSM.

Referencias

Agudelo, C. (2020). La sociedad de los avatares: Videojuegos, representación y discriminación [Tesis de maestría, Pontificia Universidad Javeriana]. https://doi.org/10.11144/Javeriana.10554.13464

Alba, O. (2014). Manual de fonética Hispánica (V Edición). Editorial Plaza Mayor. https://scholarsarchive.byu.edu/cgi/viewcontent.cgi?article=1008&context=books

Andreani, H. (2018, 6 de diciembre). Para qué un alfabeto quichua (en quichua). Trazos Universitarios. http://revistatrazos.ucse.edu.ar/index.php/2018/12/06/alfabeto-quichua-quichua/

Assael, Y., Shillingford, B., Whiteson, S., y de Freitas, N. (2016). LipNet: End-to-End Sentence-level Lipreading. arXiv. http://arxiv.org/abs/1611.01599

Bagudanch, A. (2013). La transcripción fonética en estudios dialectales: Propuestas en el caso del yeísmo. Revista de Filología Española, 93(1), 165-192.. https://doi.org/10.3989/rfe.2013.06

Barroso, N., Lopez-de Ipina, K. y Calvo, P. M. (2015). An automatic and adaptive phonetic transcriber for the Basque language. En 2015 4th International Work Conference on Bioinspired Intelligence (IWOBI) (pp. 163-168). San Sebastián, España.

Benito, Z. (2023). Aproximación a la nueva revolución tecnológica y creativa: Las inteligencias artificiales generativas [Tesis de licenciatura, Universitat Jaume I]. https://repositori.uji.es/xmlui/handle/10234/203214

Bruno-Seminario, Á., Córdova-Chuquihuanga, A., y Santos-Arriola, J. (2020). Las lenguas originarias del Perú. Un análisis de su estado desde la multiculturalidad. Pro Hominum, 2(3), 92-104.

Bruña, M. (2000). El primer diccionario francés-español con transcripción fonética (Cormon, 1800). En La philologie française à la croisée de l’an 2000: Panorama linguistique et littéraire (Vol. 2, pp. 165-178).

Ccaccachahua, B. (2022). Préstamos léxicos en el campo de las tecnologías modernas del castellano en el quechua chanca del anexo de Puncuhuacca. Lengua y Sociedad, 21(2), 449-473. https://doi.org/10.15381/lengsoc.v21i2.22799

Carbajal, V., García, F., Huamancayo, E., Mori, M., Rodríguez, M. y Verástegui, N. (2018). Lenguas originarias del Perú. Ministerio de Educación. https://centroderecursos.cultura.pe/sites/default/files/rb/pdf/Lenguas%20Originarias%20del%20Peru%20%282018%29_7_MB.pdf

Castro, S. (2008). La escritura fonémica del quechua ayacuchano [Tesis de maestría, Facultad Latinoamericana de Ciencias Sociales]. https://repositoriointerculturalidad.ec/jspui/bitstream/123456789/3367/2/TFLACSO-2008SMC.pdf

Cavero, M. (2012). El quechua Ayacucho-Chanka en proceso de extinción: Un caso (provincia de Huamanga, Ayacucho) [Tesis de maestría, Universidad Nacional Mayor de San Marcos]. https://cybertesis.unmsm.edu.pe/bitstream/handle/20.500.12672/14811/Cavero_am-Resumen.pdf?sequence=1&isAllowed=y

Charles, J., Magee, D., y Hogg, D. (2016). Virtual immortality: Reanimating characters from TV shows. En G. Hua y H. Jégou (Eds.), Computer Vision – ECCV 2016 Workshops (pp. 879–886). Springer International Publishing.

Coloma, G. (2012). Caracterización fonética de las variedades regionales del español y propuesta de transcripción simplificada. Revista de Filología Románica, 28(0), 11-27. https://doi.org/10.5209/rev_RFRM.2011.v28.37217

Escobar, J. (2021). La Inteligencia Artificial y la Enseñanza de lenguas: Una aproximación al tema. Decires, 21(25), 29-44. https://doi.org/10.22201/cepe.14059134e.2021.21.25.3

Fernández de Molina Ortés, E. (2018). La transcripción fonética en Twitter: Tradición y modernidad en la educación. En REDINE (Ed.), Innovative strategies for Higher Education in Spain (pp. 141-150). Adaya Press. https://doi.org/10.58909/ad18757372

Fraga, E. A. (2023, febrero 13). Gil Perry: «Los avatares sintéticos facilitarán experiencias digitales más personales y humanas con los clientes». ConverCom. https://convercom.info/comunidades/disrupcion/gil-perry-los-avatares-sinteticos-facilitaran-experiencias-digitales-mas-personales-humanas-los-clientes/

Garcia, G. y Mere, M.(2020). Las lenguas indígenas u originarias del Perú en el internet. LínguaTec, 5(1), 109-136. https://doi.org/10.35819/linguatec.v5.n1.4112

Ghazizadeh, E. y Zhu, P. (2021). A systematic literature review of natural language processing: Current state, challenges and risks. En K. Arai, S. Kapoor y R. Bhatia (Eds.), Proceedings of the Future Technologies Conference (FTC) 2020, Volume 1. FTC 2020. Advances in Intelligent Systems and Computing (Vol. 1288). Springer, Cham. https://doi.org/10.1007/978-3-030-63128-4_49

Guerrero, A. (2007). ¿Qué es la pronunciación? Revista Electrónica de Didáctica, 9, 1-16.

Ibañez, M. (2023, abril 11). El algoritmo es machista y racista | La inteligencia artificial también discrimina—XL Semanal [ABC]. XLSemanal. https://www.abc.es/xlsemanal/ciencia/inteligencia-artificial-discriminacion-tecnologia-chat-gpt-dalle.html

Llisterri, J. (2023). La descripción fonética y fonológica del español: Los procesos fonológicos. Joaquim Llisterri.cat/. https://joaquimllisterri.cat/phonetics/fon_esp/procesos_fonologicos_espanol_ejercicio.html

Majerhua, S. (2008). La escritura fonémica del quechua ayacuchano [Tesis de maestría, Facultad Latinoamericana de Ciencias Sociales]. https://repositorio.flacsoandes.edu.ec/bitstream/10469/804/3/TFLACSO-2008SMC.pdf

Mariño, S. y Primorac, C.(2016). Propuesta metodológica para desarrollo de modelos de redes neuronales artificiales supervisadas. IJERI: International Journal of Educational Research and Innovation, 6, 231-245. https://repositorio.unne.edu.ar/bitstream/handle/123456789/33803/RIUNNE_FACENA_AR_Mari%c3%b1o-Primorac.pdf?sequence=1&isAllowed=y

Ministerio de Cultura. (s. f.). Lista de lenguas indígenas u originarias | BDPI. Base de Datos de Pueblos Indígenas u Originarios BDPI del Ministerio de Cultura. Recuperado 7 de julio de 2023, de https://bdpi.cultura.gob.pe/lenguas

Morie, J., Chance, E., Haynes, K., y Rajpurohit, D. (2012). Embodied conversational agent avatars in virtual worlds: Making today's immersive environments more responsive to participants. In P. Hingston (Ed.), Believable bots (pp. 99-118). Springer.

Ocaña-Fernández, Y., Valenzuela-Fernández, L. A., y Garro-Aburto, L. L. (2019). Inteligencia artificial y sus implicaciones en la educación superior. Propósitos y Representaciones, 7(2), 536-568. https://doi.org/10.20511/pyr2019.v7n2.274

Orta, M, Santos, R. y Cardozo, C. (2018). Creación colaborativa de recursos educativos abiertos con Voicethread y Genial.Ly para la práctica de la transcripción fonética a partir del dictado en la Universidad. Tercer Congreso de la Asociación Argentina de Humanidades Digitales. La Cultura de los Datos. https://www.aacademica.org/aahd2018/11

Perea, J. (2023). Las primeras transcripciones de la lengua española en Le Maître Phonétique (1888-1901), Loquens, 9(1-2), e092. Loquens, 9, e092.

Pérez Orozco, B. (2018). La inteligencia artificial y sus aplicaciones (M. E. Rentería Rodríguez, Responsable). INCyTU. https://www.foroconsultivo.org.mx/INCyTU/documentos/Completa/INCYTU_18-012.pdf

Pérez, E., Fernández, C. y Gonzalez García, C. (2023). El avatar como recurso tecnológico para promover una educación innovadora e inclusiva. Revista Tecnología, Ciencia y Educación, 7-32. https://doi.org/10.51302/tce.2023.3397

Polyákova, T., y Bonafonte, A. (2008). Transcripción fonética en un entorno plurilingüe. Proceedings of V Jornadas en Tecnología del Habla, 207-210.

RAE. (s. f.). Avatar | Diccionario de la lengua española. Edición del Tricentenario. https://dle.rae.es/avatar

Restrepo, S. (2019). Google Traslate vs. Traducción Humana: Percepciones de ocho traductores en torno al papel de este traductor automático en su labor [Tesis de licenciatura, Pontificia Universidad Javeriana]. https://repository.javeriana.edu.co/bitstream/handle/10554/43243/Trabajo%20de%20Grado%20SANTIAGO%20RESTREPO%20KLINGE.pdf?sequence=3&isAllowed=y

Ríos, A. (2002). Un alfabeto fonético del español para usos informáticos. Estudios de lingüística del español, 16. https://raco.cat/index.php/Elies/article/view/195497

Rivera, M. (2004). ¿Se puede enseñar fonética con un diccionario? ASELE, Actas XV, 733-740. https://idus.us.es/bitstream/handle/11441/42649/15_0731%20Rivera%20Gonz%C3%A1lez.pdf?sequence=1

Romanenko, A. y Mendelev, V. (2016). Speaker-Dependent Bottleneck Features for Egyptian Arabic Speech Recognition. En A. Ronzhin, R. Potapova y G. Németh (Eds.), Speech and Computer. SPECOM 2016. Lecture Notes in Computer Science (vol. 9811). Springer. https://doi.org/10.1007/978-3-319-43958-7_75

Schaufler, M. L. (2021). El mapa de la discriminación. Reflexiones sobre la insistencia del sexismo y el racismo en la construcción de encuestas. Avatares de la Comunicación y la Cultura, 22. https://publicaciones.sociales.uba.ar/index.php/avatares/article/view/7131

Seong, J., Lee, W. y Lee, S. (2021). Multilingual speech synthesis for voice cloning. En 2021 IEEE International Conference on Big Data and Smart Computing (BigComp) (pp. 313-316). IEEE. https://doi.org/10.1109/BigComp51126.2021.00067

Tebbi, H. y Hamadouche, M. (2022). Multi-agent based Arabic speech synthesis. Int J Speech Technol. https://doi.org/10.1007/s10772-022-09975-8

Torero, A. (2007). El quechua y la historia social andina. Fondo Editorial del Pedagógico de San Marcos.

Zhao, G., Sonsaat, S., Silpachai, A., Lucic, I., Chukharev-Hudilainen, E., Levis, J. y Gutierrez-Osuna, R. (2018). L2-ARCTIC: A Non-native English Speech Corpus. Proc. Interspeech, 2783-2787.

Unesco. (2010, febrero 23). SPDA Actualidad Ambiental. https://www.actualidadambiental.pe/unesco-29-lenguas-originarias-peruanas-permanecen-en-peligro-de-extincion/

Valqui, J., Ziemendorff, M., Ziemendorff, S. y Oisel, G. (2023). Consideraciones histórico-lingüísticas acerca del topónimo Kuélap. Indiana, 40(1), 131-154. https://doi.org/10.18441/ind.v40i1.131-154

Descargas

Publicado

2024-12-30

Número

Sección

Dossier sobre inteligencia artificial, lenguaje y discurso digital

Cómo citar

Huamán-Águila, Óscar, Fernández-García, C. E., & Gonzales García, C. R. (2024). Uso de la transcripción fonética para lograr que avatares de inteligencia artificial pronuncien discurso en lengua quechua: caso Illariy. Lengua Y Sociedad, 23(2), 833-851. https://doi.org/10.15381/lengsoc.v23i2.28422