Uso de herramientas de procesamiento de lenguaje natural para el análisis y desarrollo de artículos científicos de ingeniería
DOI:
https://doi.org/10.15381/risi.v17i2.29906Palabras clave:
Artículos científicos, bigramas claves, frases claves, lenguaje natural, resumen de texto, similitud de textoResumen
Es importante contar con herramientas que nos permitan extraer la información útil de textos científicos sin necesidad de leer todo su contenido. Por ejemplo, cuando se requiere determinar los tópicos que tratan en los artículos científicos, establecer la línea de investigación de un autor a través de la revisión de sus publicaciones, o diseñar el resumen de un artículo y sus palabras claves. Entonces, el objetivo de esta investigación es utilizar las técnicas de procesamiento de lenguaje natural para extraer la información útil de artículos científicos de ingeniería. Se toman los veintidós artículos publicados por un autor para utilizarlos como documento base del análisis, el cual se divide en: análisis general al conjunto de los artículos, y análisis particular por artículo publicado. Como resultado del primero se obtuvieron las palabras y bigramas claves, siendo las palabras “datos” ,“energía”, y “modelo”, las más frecuentes, y los bigramas “solar fotovoltaica”, “variables explicativas”, y “energías renovables”, los más importantes. Del análisis particular se obtuvo que los bigramas jerarquizados por cada artículo representan una buena aproximación de sus palabras claves, y además hay una alta similitud entre los resúmenes obtenidos aplicando las técnicas de lenguaje natural a los artículos publicados durante el año 2024 y sus resúmenes, siendo el obtenido con GPT2 el que presentó el mayor nivel de similitud. Con las frases claves obtenidas con SGRank se pudo determinar el tópico de los artículos respectivos.
Descargas
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2024 César Aristóteles Yajure Ramírez

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
LOS AUTORES RETIENEN SUS DERECHOS:
a. Los autores retienen sus derechos de marca y patente, y también sobre cualquier proceso o procedimiento descrito en el artículo.
b. Los autores retienen el derecho de compartir, copiar, distribuir, ejecutar y comunicar públicamente el artículo publicado en la Revista de investigación de Sistemas e Informática (por ejemplo, colocarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en la Revista de investigación de Sistemas e Informática.
c. Los autores retienen el derecho a hacer una posterior publicación de su trabajo, de utilizar el artículo o cualquier parte de aquel (por ejemplo: una compilación de sus trabajos, notas para conferencias, tesis, o para un libro), siempre que indiquen su publicación inicial en la Revista de investigación de Sistemas e Informática (autores del trabajo, revista, volumen, número y fecha).