Revista Industrial Data 22(2): 47-64 (2019)

DOI: http://dx.doi.org/10.15381/idata.v22i2.15810

ISSN: 1560-9146 (Impreso) / ISSN: 1810-9993

Recibido: 30/01/2019

Aceptado: 25/04/2019

EL ANÁLISIS MULTIVARIANTE APLICADO AL ABASTECIMIENTO DE GAS LICUADO DE PETRÓLEO (GLP) EN EL PERÚ

Beatriz Adaniya Higa^{^[1]}

RESUMEN

El artículo presenta un breve análisis de la seguridad de suministro de energía, el cual incide principalmente en las variables relacionadas con el abastecimiento de Gas Licuado de Petróleo (GLP) dentro del mercado peruano. Asimismo, a través del uso de data real, se explica e ilustra la aplicación de una de las técnicas multivariantes más utilizadas, el Análisis de Componentes Principales (ACP), cuyo resultado muestra la existencia de correlación entre las variables analizadas.

Palabras clave: Análisis de Componentes Principales, técnica multivariante, abastecimiento de GLP, variables, seguridad energética.

INTRODUCCIÓN

Este artículo desarrolla un primer análisis de las variables causales involucradas en el abastecimiento de Gas Licuado de Petróleo (GLP), a fin de actuar, prever y contrarrestar cualquier afectación que pueda incidir en el mercado de GLP que impacte la economía de la población. El interés por desarrollar esta investigación es la escasa o nula existencia de estudio alguno en el país que realice un análisis multivariante de los factores para conseguir un abastecimiento permanente de este combustible.

En los primeros meses del 2004 era notorio que la producción de GLP se volvía insuficiente para abastecer la demanda nacional, lo cual hizo necesaria la importación; sin embargo, con el inicio de operaciones de la Planta de Fraccionamiento de Líquidos de Gas Natural de Pluspetrol, el Perú pasó a ser exportador de dicho producto. Actualmente, esta condición está siendo revertida por el acelerado aumento de la demanda de GLP y la lenta ejecución de proyectos de ampliación de capacidad de almacenamiento en plantas de abastecimiento. Ello justifica la elaboración de modelos para pronosticar futuros escenarios en el suministro de GLP; no obstante, factores legales, pendientes de atención por las autoridades del sector, impiden mejoras en la estrategia de abastecimiento de GLP, variables que deberían ser estudiadas dentro de un análisis más profundo.

El término «seguridad energética» es usado en diferentes contextos. Ello evidencia la diferencia de criterios a la hora de enfocarla, lo cual provoca diversas interpretaciones, generando desacuerdos conceptuales. La Agencia Internacional de la Energía (AIE) definió la «seguridad energética» como «un suministro adecuado de energía a un precio razonable» (1985, p. 9). Años después, en 2001, desarrolló nuevas definiciones, concibiéndola como «disponibilidad física de suministros para satisfacer la demanda a un precio dado» (p. 76). Posteriormente, esta misma agencia sostuvo que la «seguridad energética, definida en términos generales, significa suministros de energía adecuados, asequibles y fiables» (AIE, 2007, p. 160) con un enfoque de precios que pudieran ser «competitivos o no demasiado volátiles».

METODOLOGÍA

La metodología para la recolección de datos incluyó la exploración del entorno mediante consultas a expertos, análisis de las transacciones comerciales del mercado peruano de GLP, informes emitidos por instituciones y agencias nacionales e internacionales de energía y la determinación de los constructos. Asimismo, la comprobación se realizó mediante un Análisis por Componentes Principales. Se tomó en consideración la evolución temporal del mercado peruano de GLP, pues en estudios posteriores es posible encontrar distintos modelos estructurales que muestren diversos estados para las variables consideradas, lo cual podría determinar la ampliación del estudio a un Análisis Factorial Confirmatorio y modelos que evalúen el efecto del tiempo en el desarrollo del mercado. Los resultados de estos estudios podrían incidir en la necesidad de cambios en la legislación para lograr un mayor ordenamiento del mercado de GLP y el cumplimiento de las obligaciones de parte de las empresas involucradas.

LA SEGURIDAD ENERGÉTICA Y SU DIFERENCIA CON LA SEGURIDAD DE ABASTECIMIENTO

La denominación «seguridad energética» también es referida a la seguridad de abastecimiento (Kruyt et al., 2009; Löschel et al., 2009). Además, se considera que, en el primer caso, se trata del marco general que incluye a importadores y exportadores; mientras que, en el segundo caso, la seguridad de abastecimiento es considerada como un subtipo dentro de la seguridad energética y, como tal, es tratada por los analistas sopesando el corto y el largo plazo (AIE, 2007; Checchi et al., 2009). En el corto plazo, señala Kruyt et al. (2009), la seguridad energética busca mitigar las potenciales interrupciones de suministro o contar con una estrategia de respuesta rápida ante una potencial escasez de energía. Esta estrategia tendría que considerar el reemplazo de los flujos de suministro, el uso de capacidad no utilizada de los productores (un símil de reserva fría, en generación eléctrica) y de las reservas de emergencia (inventarios mínimos, en el caso peruano) o las medidas coyunturales para regular la demanda. La finalidad es reducir el impacto de un desabastecimiento de energía en sectores críticos (AIE, 2001) y restringir la demanda para afrontar la falta física de energía (AIE, 2007), asunto de difícil aplicación en el país.

Si se analiza cuidadosamente los factores principales de la seguridad de abastecimiento energético, como lo es la disponibilidad física en volúmenes suficientes, sin interrupciones y con precios accesibles, es importante destacar que la seguridad de abastecimiento en el largo plazo pretende garantizar la disponibilidad de energía suficiente para un desarrollo económico sostenible. Para ello, la estrategia busca asegurar una mayor eficiencia energética, disminuir la vulnerabilidad, contar con diversas fuentes mediante el uso de energías renovables, nuevos proveedores, así como el desarrollo de medios de transporte con nuevas tecnologías y el aumento de redes interconectadas de energía existentes.

La Commission of the European Communities (1990a, p.16 en Berrah, Feng, Priddle y Wang, 2007) explica que «la seguridad de suministro significa la capacidad de asegurar que las necesidades energéticas básicas futuras pueden ser cubiertas, tanto por medio de unos recursos domésticos adecuados producidos bajo condiciones aceptables económicamente o conservados como reservas estratégicas, así como recurriendo a fuentes externas accesibles y estables, complementadas con las reservas estratégicas, cuando sea apropiado». Años más tarde, se ha relacionado a la seguridad de abastecimiento de energía considerando que «la estrategia de la Unión Europea a largo plazo para la seguridad de abastecimiento energético debe dirigirse a asegurar, por el bienestar de sus ciudadanos y el correcto funcionamiento de la economía, la disponibilidad física ininterrumpida de productos energéticos en el mercado, a un precio asequible para todos los consumidores (particulares e industriales), a la vez que respete las preocupaciones medioambientales y vele por el desarrollo sostenible» (Commission of the European Communities, 2000a, p. 2).

En cuanto a la disponibilidad de energía, de forma permanente y en la cantidad requerida, es importante considerar las condiciones necesarias para permitir la satisfacción de la demanda que coadyuven al desarrollo de las actividades estratégicas, económicas y ordinarias de los países (acciones de defensa, producción, transporte, consumo doméstico, entre otros). Estas condiciones tienen su origen geológico, técnico, económico y geopolítico, ya que se refieren a la disponibilidad de los recursos, el buen funcionamiento de la infraestructura relacionada y la confiabilidad de las empresas y de cada grupo de interés comprometido con el sistema. Como es de esperar, las inversiones juegan un rol importante dentro de este sistema complejo.

EL ABASTECIMIENTO DE GLP DENTRO DEL CONTEXTO PERUANO

En el contexto peruano, el Reglamento para la Comercialización de Gas Licuado de Petróleo (GLP), aprobado por Decreto Supremo 01-94-EM, regula el aseguramiento de su abastecimiento. En su artículo 8 se establece que toda planta de producción e importador de este combustible está obligada a mantener, como existencia media, un volumen equivalente a quince días del volumen promedio vendido en los últimos seis meses o del volumen promedio importado dentro del mismo periodo, según sea el caso. Sin embargo, un informe del estado situacional de comercialización muestra un análisis estadístico de las ventas a nivel nacional que permite observar la imposibilidad de supervisar el cumplimiento de esta obligación (División Planeamiento y Desarrollo de la Gerencia de Fiscalización de Hidrocarburos Líquidos, 2015). Además, este cargo deberá garantizar el abastecimiento, dado que al calcular el número de días de abastecimiento disponible se encontró una variabilidad de tres a doce días, sin considerar la posibilidad de presentarse oleajes anómalos que impidan a las embarcaciones descargar el producto en los tanques esféricos de las plantas de abastecimiento de dos grandes mayoristas que abastecen la capital y en donde se concentra la mayor demanda nacional. Posteriormente, esta norma sufrió una modificación sin que haya resultado en una solución permanente al problema de suministro. En este contexto, es apropiado para una investigación que desarrolle un análisis multivariante que identifique los factores de mayor impacto en el suministro de GLP. Por último, como resultado de este análisis se deberá plantear acciones y estrategias que coadyuven a lograr un suministro adecuado de este energético satisfaciendo la demanda nacional.

APLICACIÓN DEL ANÁLISIS MULTIVARIANTE. ANÁLISIS DE COMPONENTES PRINCIPALES

El Análisis de Componentes Principales fue desarrollado, inicialmente, por Karl Pearson a principios del siglo XX y, posteriormente, estudiado por Harold Hotelling, hacia 1930 (Ganzo, 2004). Es particularmente útil para sintetizar la información, reduciendo el número de variables con la pérdida de la mínima cantidad posible de información. Los nuevos componentes principales resultantes del análisis, independientes entre sí, constituirán una combinación lineal de las variables originales y se construyen según su importancia en relación a la variabilidad total obtenida de la muestra.

Por un lado, se ha identificado trece variables relacionadas con el abastecimiento de GLP. Una vez identificadas las variables, se ha encontrado dificultad para visualizar las posibles relaciones existentes entre las variables, además de la posibilidad de encontrar correlaciones que puedan presentarse entre ellas, lo que puede traer como consecuencia que algunas se relacionen o que midan lo mismo, pero bajo diferentes enfoques. Para la evaluación de las relaciones que puedan presentarse entre aquellas variables que miden la misma información, se requeriría cambiar el conjunto inicial de variables en un nuevo grupo que no las correlacione entre sí; es decir, en donde no se tenga repetición o información redundante. Ello se logra reduciendo el número de variables, estimando que solo pocos factores podrían explicar buena parte de la variabilidad identificada.

Por otro lado, la selección de las variables se realiza de manera que cada una de ellas recoja la mayor parte de la variabilidad inicial, tomando en cuenta que todas serán complementarias. Del total de variables obtenidas, se elegirán las que recojan una proporción suficiente de variabilidad, las cuales reciben el nombre de componentes principales que, una vez seleccionadas, son representadas como una matriz en la que cada elemento constituye los coeficientes factoriales de las variables; en otras palabras, las correlaciones entre las variables y los componentes principales. La matriz tendrá tantas columnas como componentes principales haya y, tantas filas como variables se tenga. Para cada caso, los componentes principales tienen puntuaciones factoriales que hacen posible su representación gráfica. Las puntuaciones son calculadas a partir de la siguiente fórmula:

X_ij = a_{i1 •}Z_1j +…..+ a_{ik •}Z_kj = Σ a_is
•Z_sk

_{s = 1}

Donde, a representa a los coeficientes y Z, a los valores estandarizados de las variables.

En la etapa de interpretación, la dificultad radica en encontrar que los coeficientes factoriales sean próximos a la unidad; que cualquiera de las variables tenga coeficientes relacionados con una de ellas y que no existan variables con coeficientes similares. Luego, concierne hacer la comprobación mediante un análisis factorial confirmatorio o mediante los modelos de ecuaciones estructurales.

Para determinar los componentes principales, se hace uso del software estadístico SPSS 24, donde el número del nuevo conjunto de variables no directamente observables sea pequeño, con una pérdida mínima de información y la solución que se obtenga pueda ser interpretada. Las etapas de análisis incluyen la extracción de las variables y la estimación de las puntuaciones factoriales. El criterio de rotación utilizado ha sido el Varimax, en rotación ortogonal; sin embargo, quedaría pendiente desarrollar una investigación en la que se pruebe distintas soluciones factoriales con diferentes criterios de rotación y, de acuerdo con los resultados obtenidos, seleccionar el criterio de rotación apropiado, considerando que el resultado debe ser una solución factorial simple y que aporte información.

Este artículo pretende ilustrar la aplicación del Análisis de Componentes Principales para la identificación de factores relevantes que pueden afectar el proceso normal de abastecimiento de GLP en el Perú. Por tanto, el análisis será adecuado si se presenta una alta correlación entre las variables, lo cual es posible cuando existen aspectos comunes. De esta forma, el primer paso será realizar el análisis de la matriz de correlaciones. De acuerdo con ello, los siguientes factores de cambio han sido identificados como aquellos que afectan directamente el abastecimiento de GLP a nivel nacional:

X1 Producción de petróleo.

X2 Producción de Líquidos de Gas Natural (LGN).

X3 Procesamiento de petróleo.

X4 Importación de petróleo.

X5 Reservas de petróleo.

X6 Reservas de LGN.

X7 Procesamiento de LGN.

X8 Capacidad de almacenamiento de GLP.

X9 Cierre de puertos.

X10 Producción de GLP.

X11 Demanda de GLP.

X12 Importación de GLP.

X13 Inventarios de GLP.

Una práctica usual es determinar primero el valor del coeficiente alfa de Cronbach a fin de estimar la fiabilidad de los constructos. Sin embargo, habiendo utilizado información real, no procedente de encuestas o cuestionarios, el resultado ratificará la conclusión de que, en caso de uso de data real, el valor obtenido no descalifica la aplicación de una técnica multivariante (Lloret-Segura et al., 2014). El análisis de fiabilidad ha sido realizado utilizando el software estadístico SPSS 24. Mediante un análisis semejante al de la búsqueda de consistencia entre las respuestas de un cuestionario, se utiliza este coeficiente para determinar la consistencia entre los factores (variables) involucrados.

En una primera corrida, se obtuvo un coeficiente alfa de Cronbach de 0,252; el valor mínimo aceptable para el coeficiente alfa de Cronbach es de 0,7. Un valor menor indica que la consistencia interna muestra una baja correlación entre los factores, esto debido a una débil relación entre ellos, mientras que un valor superior muestra una fuerte relación entre los factores. En corridas sucesivas, tras eliminar X13, X12, X6, X5, X3 y X1, se obtiene un coeficiente alfa de Cronbach de 0,829 (ver tabla 1). Por tanto, a fin de verificar si se ratifica la eliminación de estas variables, se realizó un análisis de componentes principales con siete factores consiguiendo un KMO de 0,652 (ver tabla 2). Por otro lado, las tablas 3 y 4 justifican las varianzas explicadas para los siete componentes.

Tabla 1. Estadísticas de fiabilidad.

Alfa de Cronbach	Alfa de Cronbach basado en elementos estandarizados	N.° de elementos
0,829	0,951	7

Fuente: resultados de corrida en SPSS 24.

Tabla 2. Prueba de KMO y Bartlett.

Medida Kaiser-Meyer-Olkin de adecuación de muestreo		0,652
Prueba de esfericidad de Bartlett	Aproximación chi-cuadrado	189,948
	Grados de libertad	21
	Significación	0,000

Fuente: resultados de corrida en SPSS 24.

Tabla 3. Matriz de correlaciones para siete factores^a.

		X2	X4	X7	X8	X9	X10	X11
Correlación	X2	1,000	0,404	0,941	0,765	0,835	0,999	0,977
	X4	0,404	1,000	0,508	0,747	0,234	0,419	0,349
	X7	0,941	0,508	1,000	0,886	0,731	0,944	0,928
	X8	0,.765	0,747	0,886	1,000	0,614	0,772	0,713
	X9	0,835	0,234	0,731	0,614	1,000	0,828	0,834
	X10	0,999	0,419	0,944	0,772	0,828	1,000	0,979
	X11	0,977	0,349	0,928	0,713	0,834	0,979	1,000
Significación (unilateral)	X2		0,067	0,000	0,000	0,000	0,000	0,000
	X4	0,067		0,027	0,001	0,201	0,060	0,101
	X7	0,000	0,027		0,000	0,001	0,000	0,000
	X8	0,000	0,001	0,000		0,007	0,000	0,001
	X9	0,000	0,201	0,001	0,007		0,000	0,000
	X10	0,000	0,060	0,000	0,000	0,000		0,000
	X11	0,000	0,101	0,000	0,001	0,000	0,000

Fuente: resultados de corrida en SPSS 24.

a. Determinante = 2,43E-008.

La matriz de correlaciones muestra el 100% de los coeficientes de correlación son diferentes de cero por lo que es posible continuar con el análisis. El método de extracción es el de análisis de componentes principales.

Tabla 4. Matriz de correlaciones reproducidas.

		X2	X4	X7	X8	X9	X10	X11
Correlación reproducida	X2	0,978^a	0,399	0,942	0,787	0,873	0,978	0,969
	X4	0,399	0,949^a	0,552	0,798	0,189	0,413	0,338
	X7	0,942	0,552	0,942^a	0,860	0,804	0,944	0,920
	X8	0,787	0,798	0,860	0,923^a	0,601	0,796	0,745
	X9	0,873	0,189	0,804	0,601	0,815^a	0,870	0,877
	X10	0,978	0,413	0,944	0,796	0,870	0,978^a	0,968
	X11	0,969	0,338	0,920	0,745	0,877	0,968	0,965^a
Residuo^b	X2		0,005	-0,001	-0,022	-0,038	0,021	0,007
	X4	0,005		-0,044	-0,052	0,045	0,006	0,011
	X7	-0,001	-0,044		0,027	-0,074	0,000	0,007
	X8	-0,022	-0,052	0,027		0,013	-0,024	-0,032
	X9	-0,038	0,045	-0,074	0,013		-0,042	-0,043
	X10	0,021	0,006	0,000	-0,024	-0,042		0,011
	X11	0,007	0,011	0,007	-0,032	-0,043	0,011

Fuente: resultados de corrida en SPSS 24.

a. Comunalidades reproducidas.

b. Los residuos se han calculado entre las correlaciones observadas y las reproducidas. Se ha encontrado dos (9,0%) residuos no redundantes con valores absolutos mayores que 0,05.

Tabla 5. Varianza total explicada.

Componente	Autovalores iniciales			Sumas de extracción de cargas al cuadrado			Sumas de rotación de cargas al cuadrado
Componente	Total	% de varianza	% acumulado	Total	% de varianza	% acumulado	Total	% de varianza	% acumulado
1	5,527	78,957	78,957	5,527	78,957	78,957	4,565	65,217	65,217
2	1,022	14,606	93,564	1,022	14,606	93,564	1,984	28,347	93,564
3	0,256	3,655	97,218
4	0,155	2,211	99,429
5	0,030	0,432	99,861
6	0,009	0,134	99,995
7	0,00	0,005	100,000

Fuente: resultados de corrida en SPSS 24.

El método de extracción es de análisis de componentes principales.

La tabla 5 muestra que la rotación de los factores consigue que el primer factor explique el 65,217%; mientras que el segundo, el 28,347%. Con esta rotación se ha conseguido una ligera mejora en la distribución de la información explicada por cada uno de los factores. En conjunto, representan el 93,564%, lo que significa que esa diferencia (6,436%) equivale a una pérdida de información menor que en el caso de las sumas de extracción.

Si se dejara de eliminar los factores X3 y X12, considerando nueve componentes, la determinación del coeficiente KMO, al tomarse en cuenta los factores X2, X3, X4, X7, X8, X9, X10, X11 y X12, después de eliminaciones sucesivas de los factores, genera un KMO igual a 0,702, valor que supera la restricción para el KMO. Por lo tanto, ello lleva finalmente a trabajar con nueve factores.

Tabla 6. Matriz de correlaciones para nueve factores.

		X2	X3	X4	X7	X8	X9	X10	X11	X12
Correlación	X2	1,000	-0,392	0,404	0,941	0,765	0,835	0,999	0,977	-0,877
	X3	-0,392	1,000	0,484	-0,316	0,033	-0,413	-0,380	-0,487	0,056
	X4	0,404	0,484	1,000	0,508	0,747	0,234	0,419	0,349	-0,549
	X7	0,941	-0,316	0,508	1,000	0,886	0,731	0,944	0,928	-0,825
	X8	0,765	0,033	0,747	0,886	1,000	0,614	0,772	0,713	-0,799
	X9	0,835	-0,413	0,234	0,731	0,614	1,000	0,828	0,834	-0,682
	X10	0,999	-0,380	0,419	0,944	0,772	0,828	1,000	0,979	-0,881
	X11	0,977	-0,487	0,349	0,928	0,713	0,834	0,979	1,000	-0,792
	X12	-0,877	0,056	-0,549	-0,825	-0,799	-0,682	-0,881	-0,792	1,000
Significación (unilateral)	X2		0,074	0,067	0,000	0,000	0,000	0,000	0,000	0,000
	X3	0,074		0,034	0,126	0,453	0,063	0,081	0,033	0,422
	X4	0,067	0,034		0,027	0,001	0,201	0,060	0,101	0,017
	X7	0,000	0,126	0,027		0,000	0,001	0,000	0,000	0,000
	X8	0,000	0,453	0,001	0,000		0,007	0,000	0,001	0,000
	X9	0,000	0,063	0,201	0,001	0,007		0,000	0,000	0,003
	X10	0,000	0,081	0,060	0,000	0,000	0,000		0,000	0,000
	X11	0,000	0,033	0,101	0,000	0,001	0,000	0,000		0,000
	X12	0,000	0,422	0,017	0,000	0,000	0,003	0,000	0,000

Fuente: resultados de corrida en SPSS 24.

La tabla 6, como en el caso anterior, muestra que el 100% de los coeficientes de correlación son diferentes de cero, lo que implica que es posible continuar con el análisis. El método de extracción ha sido el de análisis de componentes principales.

Tabla 7. Matriz de correlaciones reproducidas.

		X2	X3	X4	X7	X8	X9	X10	X11	X12
Correlación reproducida	X2	0,980^a	-0,412	0,413	0,948	0,799	0,855	0,980	0,968	-0,857
	X3	-0,412	0,903^a	0,553	-0,285	0,083	-0,482	-0,399	-0,489	0,100
	X4	0,413	0,553	0,898^a	0,512	0,754	0,238	0,427	0,326	-0,621
	X7	0,948	-0,285	0,512	0,934^a	0,838	0,808	0,950	0,923	-0,869
	X8	0,799	0,083	0,754	0,838	0,892^a	0,627	0,807	0,742	-0,849
	X9	0,855	-0,482	0,238	0,808	0,627	0,766^a	0,853	0,858	-0,704
	X10	0,980	-0,399	0,427	0,950	0,807	0,853	0,980^a	0,967	-0,862
	X11	0,968	-0,489	0,326	0,923	0,742	0,858	0,967	0,966^a	-0,817
	X12	-0,857	0,100	-0,621	-0,869	-0,849	-0,704	-0,862	-0,817	,843^a
Residuo^b	X2		0,020	-0,009	-0,007	-0,034	-0,020	0,019	0,009	-0,019
	X3	0,020		-0,069	-0,030	-0,049	0,069	0,019	0,002	-0,044
	X4	-0,009	-0,069		-0,004	-0,007	-0,004	-0,008	0,023	0,072
	X7	-0,007	-0,030	-0,004		0,048	-0,077	-0,006	0,004	0,044
	X8	-0,034	-0,049	-0,007	0,048		-0,013	-0,035	-0,030	0,050
	X9	-0,020	0,069	-0,004	-0,077	-0,013		-0,025	-0,024	0,022
	X10	0,019	0,019	-0,008	-0,006	-0,035	-0,025		0,012	-0,019
	X11	0,009	0,002	0,023	0,004	-0,030	-0,024	0,012		0,025
	X12	-0,019	-0,044	0,072	0,044	0,050	0,022	-0,019	0,025

Fuente: resultados de corrida en SPSS 24.

a. Comunalidades reproducidas.

b. Los residuos se han calculado entre las correlaciones observadas y las reproducidas. Se ha observado cuatro (11,0%) residuos no redundantes con valor absoluto mayor que 0,05.

La tabla 7 muestra la comprobación de la bondad del modelo obtenido, el cual se realiza a través de un análisis de los residuos en el que se observa las diferencias entre la matriz de correlaciones inicial y la reproducida por el modelo. De esta forma, en la medida que sean próximos a cero en valor absoluto, será indicativo de un buen ajuste, tal y como se observa en la tabla. La existencia del 11% de residuos no redundantes con valor absoluto mayor que 0,05 implicaría un bajo nivel de bondad del modelo, lo que podría ser considerado como relativamente bueno.

Tabla 8. Varianza total explicada para nueve factores.

Componente	Autovalores iniciales			Sumas de extracción de cargas al cuadrado			Sumas de rotación de cargas al cuadrado
Componente	Total	% de varianza	% acumulado	Total	% de varianza	% acumulado	Total	% de varianza	% acumulado
1	6,402	71,138	71,138	6,402	71,138	71,138	6,321	70,231	70,231
2	1,760	19,554	90,692	1,760	19,554	90,692	1,841	20,461	90,692
3	0,324	3,598	94,290
4	0,255	2,835	97,125
5	0,150	1,662	98,787
6	0,089	0,985	99,772
7	0,012	0,135	99,907
8	0,008	0,090	99,997
9	0,000	0,003	100,000

Fuente: resultado de corrida en SPSS 24.

La tabla 8 muestra que la rotación de los factores consigue que el primero explique el 70,23%; mientras que el segundo, el 20,46%. Con la rotación se ha conseguido una ligera mejora en la distribución de la información explicada por cada uno de los factores. En conjunto, representan el 90,69%, siendo la diferencia (9,31%) una pérdida de información menor que en el caso de las sumas de extracción, pero mayor al caso de siete componentes.

Finalmente, la matriz de componentes rotados, mostrada en la tabla 9, indica que la rotación ha convergido en tres iteraciones, lo cual nos lleva a un modelo con dos componentes principales, donde el primer componente es la variable con máxima varianza con solo dos coeficientes negativos.

Y1 = 0,990X2 – 0,421X3 + 0,413X4 + 0,956X7 + 0,804X8 + 0,864X9 + 0,990X10 + 0,978X11 – 0,864X12

Y2 = 0,006X2 + 0,852X3 + 0,853X4 + 0,138X7 + 0,495X8 – 0,138X9 + 0,022X10 – 0,091X11 – 0,310X12

Se puede observar que X2 (producción de LGN), X10 (producción de GLP), X8 (capacidad de almacenamiento de GLP) y X7 (procesamiento de LGN) son variables altamente correlacionadas, puesto que el procesamiento de líquidos de gas natural dependerá de la producción de gas natural y, a su vez, de la producción de GLP. Asimismo, esta producción estará determinada por su capacidad de almacenamiento.

La tabla 9 muestra la matriz de componente rotado considerando que el método de extracción fue el de análisis de componentes principales. El método de rotación utilizado ha sido el Varimax con normalización Kaiser, en la que la rotación ha convergido en tres iteraciones.

Tabla 9. Matriz de componente rotado^a.

	Componente
	1	2
X2	0,990	0,006
X10	0,990	0,022
X11	0,978	-0,091
X7	0,956	0,138
X9	0,864	-0,138
X12	-0,864	-0,310
X8	0,804	0,495
X4	0,413	0,853
X3	-0,421	0,852

Fuente: resultados de corrida en SPSS 24.

a. La rotación ha convergido en tres iteraciones.

CONCLUSIONES

1. El Análisis de Componentes Principales (ACP) ha analizado la estructura de las interrelaciones entre once variables relacionadas con el abastecimiento de GLP, en el que se ha utilizado datos reales para cada una, encontrándose un ajuste satisfactorio a los supuestos de un modelo del ACP clásico. Si se analiza la matriz de correlaciones para verificar que exista una correlación entre las variables, se encuentra que el 100% de los coeficientes de correlación son diferentes de cero, lo que implica que es posible continuar con el análisis y obtener un mejor ajuste.

2. La medida de adecuación muestral de Kaiser-Meyer-Olkin (KMO) indica que la muestra de datos utilizada es adecuada.

3. La prueba de esfericidad de Bartlett indica un valor de significancia de 0,000. Por ello, no se trata de una matriz identidad, y se concluye con que existe correlación entre las variables.

4. La tabla de varianza total explicada muestra que existe solo 9,31% de pérdida de información cuando se consideran nueve factores; y, 6,44%, cuando se consideran siete factores.

5. Se ha comprobado la bondad del modelo, dado que las diferencias entre las matrices de correlación inicial y la reproducida por el modelo son próximos a cero en valor absoluto, lo cual es indicativo de un buen ajuste.

6. Con las variables relacionadas se podría realizar un Análisis Factorial Confirmatorio (AFC) y posterior modelamiento de ecuaciones estructurales (Exploratory Structural Equation Modeling, ESEM), lo que permitiría comprobar que el modelo estructural que se proponga se ajusta adecuadamente a los datos.

7. Con estos resultados se comprueba que las variables producción de GLP (X10) y cierre de puertos (X9) tienen un aporte significativo en el modelo. Asimismo, el abastecimiento de GLP a nivel nacional depende de la producción (X2) y procesamiento de LGN (X7), por lo cual, cualquier problema relacionado a estas actividades puede afectarlo.

8. Las variables producción de petróleo (X1), reservas de petróleo (X5), reservas de LGN (X6) e inventarios de GLP (X13) han mostrado tener un menor nivel de influencia en el abastecimiento de GLP a nivel nacional.

9. El resto de las variables —producción de LGN (X2), procesamiento de petróleo (X3), importación de petróleo (X4), procesamiento de LGN (X7), capacidad de almacenamiento de GLP (X8), cierre de puertos (X9), producción de GLP (X10), demanda de GLP (X11) e importación de GLP (X12)— han mostrado tener un alto grado de correlación con el abastecimiento de GLP a nivel nacional; por tanto, cualquier perturbación que afecte a una de estas variables causará un impacto en este abastecimiento.

10. El modelo de dos componentes refleja el comportamiento real de las variables, de acuerdo a la data histórica utilizada.

11. Los componentes Y1 e Y2 relacionan el abastecimiento de GLP de acuerdo a su origen, por lo cual Y1 se designa GLP_Gas
Natural e Y2 corresponde a GLP_Petróleo; por tanto:

GLP_{Gas Natural} = 0,990 Producción de LGN – 0,421 Procesamiento de petróleo + 0,413 Importación de petróleo + 0,956 Procesamiento de LGN + 0,804 Capacidad de almacenamiento de GLP + 0,864 Cierre de puertos + 0,990 Producción de GLP + 0,978 Demanda de GLP – 0,864 Importación de GLP.

GLP_Petróleo = 0,006 Producción de LGN + 0,852 Procesamiento de petróleo + 0,853 Importación de petróleo + 0,138 Procesamiento de LGN + 0,495 Capacidad de almacenamiento de GLP – 0,138 Cierre de puertos + 0,022 Producción de GLP – 0,091 Demanda de GLP – 0,310 Importación de GLP.

REFERENCIAS BIBLIOGRÁFICAS

[1] Berrah, N.; Feng, F.; Priddle, R. & Wang, L. (2007). Sustainable energy in China: The closing window of opportunity, p. 273. Washington, DC, International Bank for Reconstruction and Development, The World Bank. ISBN-13: 978-0-812-6754-4.

[2] Checchi, A.; Behrens, A. y Egenhofer, C. (2009). Long-term energy security risks for Europe: a sector-specific approach. Working Document, 52(309). Recuperado de http://aei.pitt.edu/10759/1/1785.pdf.

[3] Commission of the European Communities (2000a). Green paper: towards a European strategy for the security of energy supply. Office for Official Publications of the European Communities, 90. Recuperado de https://op.europa.eu/en/publication-detail/-/publication/0ef8d03f-7c54-41b6-ab89-6b93e61fd37c/language-en.

[4] Cuadras, C. (2018). Nuevos métodos de análisis multivariante. Barcelona, España: CMC Editions.

[5] Ganzo, A. (2004). Análisis de componentes principales. Introducción al análisis multivariante. Recuperado de http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-DPTO/MATERIALES/Mat_50140155_AnalisisMultivariante.pdf.

[6] IEA (1985). Energy technology policy. París, Francia: OECD Publishing.

[7] IEA (2001). Towards a sustainable energy future. París, Francia: OECD. Recuperado de https://www.oecd-ilibrary.org/energy/towards-a-sustainable-energy-future_9789264193581-en.

[8] IEA (2007). Energy security and climate policy-assessing interactions. París, Francia: OECD. Recuperado de https://www.oecd-ilibrary.org/energy/energy-security-and-climate-policy-assessing-interactions_9789264109940-en.

[9] Informe situacional de la comercialización del Gas Licuado de Petróleo (GLP) en el Perú (2015). Lima, Perú: Gerencia de Fiscalización de Hidrocarburos Líquidos de Osinergmin.

[10] Kruyt, B.; Vuuren, D. P. van; Vries, H. J. M. de y Groenenberg, H. (2009). Indicators for energy security. Energy Policy, 37(6), 2166-2181. Recuperado de https://www.sciencedirect.com/science/article/pii/S0301421509000883?via%3Dihub.

[11] Lloret, S.; Ferreres, A.; Hernández, A. y Tomás, I. (2014). Exploratory item factor analysis: a practical guide revised and up-dated. Annals of Psychology, 30(3), 1151-1169. Recuperado de https://revistas.um.es/analesps/article/view/analesps.30.3.199361/217271.

[12] Löschel, A.; Johnston, J.; Delucchi, M.; Demayo, T.; Gautier, D.; Greene, D.; Ogden, J.; Rayner, S. y Worrell, E. (2009). Stocks, flows, and prospects of energy. En T. E. Graedel y E. van der Voet (Eds.), Linkages of sustainability. Oxford, Reino Unido: MIT Press Scholarship.

Revista Industrial Data 22(2): 47-64 (2019)

DOI: http://dx.doi.org/10.15381/idata.v22i2.15810

ISSN: 1560-9146 (Impreso) / ISSN: 1810-9993 (Electrónico)

Recibido: 30/01/2019

Aceptado: 25/04/2019

MULTIVARIATE ANALYSIS APPLIED TO THE SUPPLY OF LIQUEFIED PETROLEUM GAS (LPG) IN PERU

Beatriz Adaniya Higa^{^[2]}

ABSTRACT

This article provides a brief analysis on energy supply security, focusing mainly on the variables related to the supply of liquefied petroleum gas (LPG) within the Peruvian market. Furthermore, via the use of real data, principal component analysis (PCA), one of the most common multivariate techniques, is explained and illustrated, whose result indicates that a correlation exists between the analyzed variables.

Keywords: principal component analysis, multivariate statistical technique, LPG supply, variables, energy security.

INTRODUCTION

This article features an initial analysis of the causal variables involved in the supply of liquefied petroleum gas (LPG), in order to act upon, forecast, and counteract any issue that may affect the LPG market and have an impact on the national economy. The interest to conduct this research arose from the fact that no or limited multivariate analysis studies of the factors to secure a permanent supply of said fuel had been conducted in the country.

In the early months of 2004, it became evident that national LPG production was insufficient to satisfy national demand, necessitating importation. However, after the Pluspetrol Natural Gas Liquids (NGLs) Fractionation Plant began operating, Peru became an exporter of said product. This condition is currently being reversed by the rapid increase in LPG demand and the slow execution of projects to expand storage capacity within supply plants. This justifies the development of models to forecast future scenarios regarding LPG supply; however, legal factors, awaiting the attention of sector authorities, prevent improvements in the LPG supply strategy, variables that should be subject to a more in-depth analysis.

The term “energy security” is used in various contexts. This evidences the difference in approach that causes multiple interpretations and conceptual disagreements. The International Energy Agency (IEA) defined “energy security” as “an adequate supply of energy at a reasonable price” (1985, p. 9). Years later, in 2001, it redefined it as the “physical availability of supplies to satisfy demand at a given price” (p. 76). Later, the same agency stated that “energy security, defined in general terms, means adequate and reliable supplies of energy at affordable prices” (IEA, 2007, p. 160), with a focus on prices that would be “competitive and not too volatile”.

METHODOLOGY

The methodology for data collection included exploring the field through expert opinions, analysis of commercial transactions in the Peruvian LPG market, reports issued by national and international energy agencies and institutions, and the formulation of the constructs. Principal component analysis was used for verification. The evolution of the Peruvian LPG market over time was taken into account, as it is possible to find several structural models in previous research that show various states for the variables considered in this analysis, which could determine an expansion of the study to a confirmatory factor analysis (CFA) and models that evaluate the effect of time on fuel market development. The findings of these studies might stress the need for changes in legislation in order to achieve greater order in the LPG market and to ensure companies comply with regulations.

ENERGY SECURITY AND ITS DIFFERENCE FROM SUPPLY SECURITY

The term “energy security” is also used to refer to security of supply (Kruyt et al., 2009; Löschel et al., 2009). The first is seen as the general framework that includes importers and exporters; whereas the second is considered a subtype of energy security, and as such it is examined by analysts in the short and long term (IEA, 2007; Checchi et al., 2009). As stated by Kruyt et al. (2009), in the short term, energy security aims to mitigate potential supply interruptions or to have a rapid response strategy to confront potential energy scarcity. This strategy would have to consider the replacement of supply flow, the use of spare capacity of producers (a simile for cold standby in power generation) and emergency reserves (minimum inventories in the case of Peru) or immediately relevant measures to regulate demand. The purpose is to reduce the impact a shortage of energy supply would have on key sectors (IEA, 2001) and to restrain demand to address the physical lack of energy (IEA, 2007), a difficult task in the country.

If the main factors associated with security of energy supply—such as physical availability in sufficient volumes, without interruptions and at affordable prices—are carefully analyzed, it is possible to note that long-term security of supply intends to ensure sufficient energy availability for sustainable economic development. To that end, the strategy aims to ensure greater energy efficiency, reduce vulnerability, rely on diverse energy sources via the use of renewable energy and new suppliers, as well as the development of new transportation technologies and the expansion of existing interconnected energy networks.

The Commission of the European Communities explains that “security of supply means the ability to ensure that future essential energy needs can be met, both by means of adequate domestic resources worked under economically acceptable conditions or maintained as strategic reserves, and by calling upon accessible and stable external sources supplemented where appropriate, by strategic stocks” (European Commission, 1990a, p.16, as cited in Berrah, Feng, Priddle & Wang, 2007). Years later, it was related to security of energy supply considering that “the European Union’s long-term strategy for energy supply security must be geared to ensuring, for the well-being of its citizens and the proper functioning of the economy, the uninterrupted physical availability of energy products on the market, at a price which is affordable for all consumers (private and industrial), while respecting environmental concerns and looking towards sustainable development” (Commission of the European Communities, 2001a, p. 2).

As for the permanent and sufficient availability of energy, it is important to consider conditions needed to satisfy demand while contributing to the development of the strategic economic and ordinary activities of each country (defense, production, transportation, and domestic consumption actions, among others). These conditions originate from geological, technical, economic and geopolitical aspects, as they refer to the availability of resources, proper operation of infrastructure and reliability of each company and each interest group committed to the system. As expected, investments play a major role within this complex system.

LPG SUPPLY IN THE PERUVIAN CONTEXT

In Peru, the Reglamento para la Comercialización de Gas Licuado de Petróleo [Regulation for Commercialization of Liquefied Petroleum Gas] passed by Supreme Decree No. 01-94-EM, regulates LPG supply security. Section 8 of the same decree states that every LPG production plant and importer is compelled to maintain, as average supply, a volume equivalent to fifteen days of the average volume sold in the last six months or the average volume imported during the same period, as appropriate. Unfortunately, a report on the situation of commercialization shows a statistical analysis of sales nationwide that reveals that it is impossible to monitor compliance with that obligation (División Planeamiento y Desarrollo de la Gerencia de Fiscalización de Hidrocarburos Líquidos, 2015). The fulfillment of said obligation would guarantee fuel supply. According to the report, the available supply ranged from three to twelve days, without considering the possibility of abnormal waves that prevent ships from unloading the product in the spherical tanks of the supply plants of two major wholesalers that supply the capital, where the national demand is concentrated. This regulation was later amended, nonetheless, it did not signify a permanent solution to the supply problem. In this case, a research study involving a multivariate analysis that identifies the factors with greater impact on the supply of LPG is necessary. Finally, actions and strategies that contribute to secure an adequate LPG supply to meet domestic demand will be proposed as a result of this analysis.

MULTIVARIATE ANALYSIS APPLICATION. PRINCIPAL COMPONENT ANALYSIS

The Principal Component Analysis was initially developed by Karl Pearson at the beginning of the 20^th century, and later studied by Harold Hotelling around 1930 (Ganzo, 2004). It is particularly useful to synthetize information, reducing the number of variables while ensuring the smallest loss of information possible. The new principal components resulting from the analysis, independent from each other, will constitute a linear combination of the original variables and are created according to their importance in relation to the total variance obtained from the sample.

Firstly, thirteen variables related to LPG supply were identified. After identification, possible existing relationships between variables, in addition to the potential correlations that may arise between them, were difficult to visualize. This might result in the correlation of some variables or in some having the same weight, but under different approaches. In order to evaluate the correlation that may arise between variables that measure the same data, it would be necessary to replace the initial group of variables with one where the variables are not correlated, thus, a group with no repetitions or redundant information. This is achieved by reducing the number of variables, estimating that only few factors may explain a significant part of the identified variability.

Secondly, the variables are selected in such a manner that each of them includes the largest amount possible of the initial variability, considering that all of them will be complementary. Of the total variables obtained, those that include a sufficient proportion of variability will be chosen. These are the principal components. These components will be represented as a matrix, where each element will constitute the variables’ factorial coefficients; in other words, the correlations between the variables and the principal components. The matrix will have as many columns as principal components chosen and as many rows as there are variables. In each case, the principal components have factor points that allow them to be represented graphically. Factors points are calculated using the following formula:

X_ij = a_{i1 •}Z_1j +…+ a_{ik •}Z_kj = Σ a_{is •}Z_sk

_{s = 1}

Where a represents the coefficients and Z, the standardized values of the variables.

For the interpretation stage, factor coefficients must be close to one, a variable must have high coefficients with one factor, and there must not be variables with similar coefficients. Thereafter, verification by means of a confirmatory factor analysis or structural equations models is necessary.

Statistical software SPSS 24 is used to determine the principal components, where a small new set of not directly observable variables is obtained with minimum information loss, and the resulting solution can be interpreted. The analysis stages include the extraction of variables and estimation of factor points. The Varimax criterion for orthogonal rotation was used for factor rotation. However, a research study that analyzes various factor solutions through several rotation criteria in order to select the appropriate rotation criterion, bearing in mind that the result must be a simple factor solution that provides information, is yet to be conducted.

This article attempts to illustrate the application of the Principal Component Analysis to identify relevant factors that may affect the usual LPG supply process in Peru. Therefore, the analysis will be deemed adequate if a high correlation between variables is found, which is possible when there are common aspects. Thus, the first step is to analyze the correlations matrix. The following factors have been identified as those that directly affect LPG supply at national level:

X1 Petroleum production.

X2 Natural Gas Liquids (NGL) production.

X3 Petroleum processing.

X4 Petroleum importation.

X5 Petroleum reserves.

X6 NGL reserves.

X7 NGL processing.

X8 LPG storage capacity.

X9 Ports closure.

X10 LPG production.

X11 LPG demand.

X12 LPG importation.

X13 LPG inventories.

A common practice is to first determine the Cronbach’s alpha coefficient value in order to estimate the reliability of constructs. However, having used real data, and not data collected via surveys and questionnaires, the outcome will confirm the conclusion that the value obtained does not invalidate the application of a multivariate technique when real data is used (Lloret-Segura et al., 2014). The reliability analysis was performed using statistical software SPSS 24. Through an analysis similar to the search for consistency among the responses to a questionnaire, the resulting coefficient is used to determine consistency among the involved factors (variables).

On the first run, Cronbach’s alpha coefficient was 0.252. The minimum acceptable value for Cronbach’s alpha coefficient is 0.7. Lower values indicate that internal consistency reflect low correlation between factors, due to a weak relationship between them; whereas, higher values reflect strong relationship between factors. After removing variables X13, X12, X6, X5, X3 and X1, a Cronbach’s alpha coefficient of 0.829 was obtained on subsequent runs (see Table 1). Consequently, a principal component analysis with seven factors was conducted in order to confirm the elimination of said variables. It showed a KMO value of 0.652(see Table 2). Additionally, Tables 3 and 4 justify the explained variances for seven factors (variables).

Table 1. Reliability statistics.

Cronbach’s alpha	Cronbach’s alpha based on standardized items	No. of items
0.829	0.951	7

Source: Results of analysis ran on SPSS 24.

Table 2. KMO and Bartlett’s test.

Kaiser-Meyer-Olkin measure of sampling adequacy		0.652
Bartlett’s test of sphericity	Approx. Chi-square	189.948
	Degrees of freedom	21
	Significance	0.000

Source: Results of analysis ran on SPSS 24.

Table 3. Correlation matrix for seven factors^a.

		X2	X4	X7	X8	X9	X10	X11
Correlation	X2	1.000	0.404	0.941	0.765	0.835	0.999	0.977
	X4	0.404	1.000	0.508	0.747	0.234	0.419	0.349
	X7	0.941	0.508	1.000	0.886	0.731	0.944	0.928
	X8	0.765	0.747	0.886	1.000	0.614	0.772	0.713
	X9	0.835	0.234	0.731	0.614	1.000	0.828	0.834
	X10	0.999	0.419	0.944	0.772	0.828	1.000	0.979
	X11	0.977	0.349	0.928	0.713	0.834	0.979	1.000
Significance (one-tailed)	X2		0.067	0.000	0.000	0.000	0.000	0.000
	X4	0.067		0.027	0.001	0.201	0.060	0.101
	X7	0.000	0.027		0.000	0.001	0.000	0.000
	X8	0.000	0.001	0.000		0.007	0.000	0.001
	X9	0.000	0.201	0.001	0.007		0.000	0.000
	X10	0.000	0.060	0.000	0.000	0.000		0.000
	X11	0.000	0.101	0.000	0.001	0.000	0.000

Source: Results of analysis ran on SPSS 24.

b. Determinant = 2.43E-008.

The correlation matrix shows that 100% of the correlation coefficients are different from zero, therefore it is possible to continue the analysis. The extraction method used was the principal component analysis.

Table 4. Reproduced correlations matrix.

		X2	X4	X7	X8	X9	X10	X11
Reproduced correlation	X2	0.978^a	0.399	0.942	0.787	0.873	0.978	0.969
	X4	0.399	0.949^a	0.552	0.798	0.189	0.413	0.338
	X7	0.942	0.552	0.942^a	0.860	0.804	0.944	0.920
	X8	0.787	0.798	0.860	0.923^a	0.601	0.796	0.745
	X9	0.873	0.189	0.804	0.601	0.815^a	0.870	0.877
	X10	0.978	0.413	0.944	0.796	0.870	0.978^a	0.968
	X11	0.969	0.338	0.920	0.745	0.877	0.968	0.965^a
Residual^b	X2		0.005	-0.001	-0.022	-0.038	0.021	0.007
	X4	0.005		-0.044	-0.052	0.045	0.006	0.011
	X7	-0.001	-0.044		0.027	-0.074	0.000	0.007
	X8	-0.022	-0.052	0.027		0.013	-0.024	-0.032
	X9	-0.038	0.045	-0.074	0.013		-0.042	-0.043
	X10	0.021	0.006	0.000	-0.024	-0.042		0.011
	X11	0.007	0.011	0.007	-0.032	-0.043	0.011

Source: Results of analysis ran on SPSS 24.

a. Reproduced communalities.

b. Residuals are computed between observed and reproduced correlations. There are two (9.0%) nonredundant residuals with absolute values greater than 0.05.

Table 5. Total variance explained.

Component	Initial eigenvalues			Extraction sums of squared loadings			Rotation sums of squared loadings
Component	Total	% of variance	% cumulative	Total	% of variance	% cumulative	Total	% of variance	% cumulative
1	5.527	78.957	78.957	5.527	78.957	78.957	4.565	65.217	65.217
2	1.022	14.606	93.564	1.022	14.606	93.564	1.984	28.347	93.564
3	0.256	3.655	97.218
4	0.155	2.211	99.429
5	0.030	0.432	99.861
6	0.009	0.134	99.995
7	0.00	0.005	100.000

Source: Results of analysis ran on SPSS 24.

Extraction method: Principal component analysis.

It can be observed in Table 5 that the first factor explains 65.217% of the variance, whereas the second explains 28.347%. A slight improvement in the distribution of the information explained by each factor was obtained applying factor rotation. Together, they represent 93.564% of the variance, which signifies that the difference (6.436%) corresponds to a smaller information loss compared to the extraction sums case.

If factors X3 and X12 were not eliminated, examining nine factors, the determination of the KMO coefficient, considering factors X2, X3, X4, X7, X8, X9, X10, X11 and X12 upon successive elimination of factors, would be equal to 0.702, a value that exceeds the minimum acceptable KMO values. Consequently, nine factors are considered in the analysis.

Table 6. Correlation matrix for nine factors.

		X2	X3	X4	X7	X8	X9	X10	X11	X12
Correlation	X2	1.000	-0.392	0.404	0.941	0.765	0.835	0.999	0.977	-0.877
	X3	-0.392	1.000	0.484	-0.316	0.033	-0.413	-0.380	-0.487	0.056
	X4	0.404	0.484	1.000	0.508	0.747	0.234	0.419	0.349	-0.549
	X7	0.941	-0.316	0.508	1.000	0.886	0.731	0.944	0.928	-0.825
	X8	0.765	0.033	0.747	0.886	1.000	0.614	0.772	0.713	-0.799
	X9	0.835	-0.413	0.234	0.731	0.614	1.000	0.828	0.834	-0.682
	X10	0.999	-0.380	0.419	0.944	0.772	0.828	1.000	0.979	-0.881
	X11	0.977	-0.487	0.349	0.928	0.713	0.834	0.979	1.000	-0.792
	X12	-0.877	0.056	-0.549	-0.825	-0.799	-0.682	-0.881	-0.792	1.000
Significance (one-tailed)	X2		0.074	0.067	0.000	0.000	0.000	0.000	0.000	0.000
	X3	0.074		0.034	0.126	0.453	0.063	0.081	0.033	0.422
	X4	0.067	0.034		0.027	0.001	0.201	0.060	0.101	0.017
	X7	0.000	0.126	0.027		0.000	0.001	0.000	0.000	0.000
	X8	0.000	0.453	0.001	0.000		0.007	0.000	0.001	0.000
	X9	0.000	0.063	0.201	0.001	0.007		0.000	0.000	0.003
	X10	0.000	0.081	0.060	0.000	0.000	0.000		0.000	0.000
	X11	0.000	0.033	0.101	0.000	0.001	0.000	0.000		0.000
	X12	0.000	0.422	0.017	0.000	0.000	0.003	0.000	0.000

Source: Results of analysis ran on SPSS 24.

Table 6, as before, shows that 100% of the correlation coefficients are different from zero, therefore it is possible to continue the analysis. The extraction method used was the principal component analysis.

Table 7. Reproduced correlations matrix.

		X2	X3	X4	X7	X8	X9	X10	X11	X12
Reproduced correlations	X2	0.980^a	-0.412	0.413	0.948	0.799	0.855	0.980	0.968	-0.857
	X3	-0.412	0.903^a	0.553	-0.285	0.083	-0.482	-0.399	-0.489	0.100
	X4	0.413	0.553	0.898^a	0.512	0.754	0.238	0.427	0.326	-0.621
	X7	0.948	-0.285	0.512	0.934^a	0.838	0.808	0.950	0.923	-0.869
	X8	0.799	0.083	0.754	0.838	0.892^a	0.627	0.807	0.742	-0.849
	X9	0.855	-0.482	0.238	0.808	0.627	0.766^a	0.853	0.858	-0.704
	X10	0.980	-0.399	0.427	0.950	0.807	0.853	0.980^a	0.967	-0.862
	X11	0.968	-0.489	0.326	0.923	0.742	0.858	0.967	0.966^a	-0.817
	X12	-0.857	0.100	-0.621	-0.869	-0.849	-0.704	-0.862	-0.817	0.843^a
Residual^b	X2		0.020	-0.009	-0.007	-0.034	-0.020	0.019	0.009	-0.019
	X3	0.020		-0.069	-0.030	-0.049	0.069	0.019	0.002	-0.044
	X4	-0.009	-0.069		-0.004	-0.007	-0.004	-0.008	0.023	0.072
	X7	-0.007	-0.030	-0.004		0.048	-0.077	-0.006	0.004	0.044
	X8	-0.034	-0.049	-0.007	0.048		-0.013	-0.035	-0.030	0.050
	X9	-0.020	0.069	-0.004	-0.077	-0.013		-0.025	-0.024	0.022
	X10	0.019	0.019	-0.008	-0.006	-0.035	-0.025		0.012	-0.019
	X11	0.009	0.002	0.023	0.004	-0.030	-0.024	0.012		0.025
	X12	-0.019	-0.044	0.072	0.044	0.050	0.022	-0.019	0.025

Source: Results of analysis ran on SPSS 24.

a. Reproduced communalities.

b. Residuals are computed between observed and reproduced correlations. There are four (11.0%) nonredundant residuals with absolute values greater than 0.05.

Table 7 shows the verification of the goodness of fit of the obtained model, which is performed through an analysis of the residuals, where the differences between the matrix of initial correlations and the matrix reproduced by the model are observed. Thus, absolute value close to zero indicates a good fit, as observed in the table. The existence of 11% of nonredundant residuals with absolute value greater than 0.05 indicates a low goodness of fit, which may be considered relatively good.

Table 8. Total variance explained for nine factors.

Component	Initial eigenvalues			Extraction sums of squared loadings			Rotation sums of squared loadings
Component	Total	% of variance	% cumulative	Total	% of variance	% cumulative	Total	% of variance	% cumulative
1	6.402	71.138	71.138	6.402	71.138	71.138	6.321	70.231	70.231
2	1.760	19.554	90.692	1.760	19.554	90.692	1.841	20.461	90.692
3	0.324	3.598	94.290
4	0.255	2.835	97.125
5	0.150	1.662	98.787
6	0.089	0.985	99.772
7	0.012	0.135	99.907
8	0.008	0.090	99.997
9	0.000	0.003	100.000

Source: Results of analysis ran on SPSS 24.

Table 8 shows that the first factor explains 70.23% of the variance, whereas the second explains 20.46%. A slight improvement in the distribution of the information explained by each factor was obtained applying factor rotation. Together, they represent 90.69% of the variance, which signifies that the difference (9.31%) corresponds to a smaller information loss compared to the extraction sums case, but greater than that considering seven components.

Lastly, the rotated component matrix exhibited in Table 9 indicates that rotation converged in three iterations, which results in a model with two principal components, where the first component is the variable with the highest variance and only two negative coefficients.

Y1 = 0.990X2 – 0.421X3 + 0.413X4 + 0.956X7 + 0.804X8 + 0.864X9 + 0.990X10 + 0.978X11 – 0.864X12

Y2 = 0.006X2 + 0.852X3 + 0.853X4 + 0.138X7 + 0.495X8 – 0.138X9 + 0.022X10 – 0.091X11 – 0.310X12

It is observed that X2 (NGL production), X10 (LPG production), X8 (LPG storage capacity) and X7 (NGL processing) are highly correlated variables, because natural gas liquids processing depends both on natural gas production and LPG production. Furthermore, the latter is determined by LPG storage capacity.

Table 9 shows the rotated component matrix using the principal component analysis as extraction method. The rotation method used was Varimax with Kaiser normalization. Rotation converged in three iterations.

Table 9. Rotated component matrix^a.

	Component
	1	2
X2	0.990	0.006
X10	0.990	0.022
X11	0.978	-0.091
X7	0.956	0.138
X9	0.864	-0.138
X12	-0.864	-0.310
X8	0.804	0.495
X4	0.413	0.853
X3	-0.421	0.852

Source: Results of analysis ran on SPSS 24.

a. Rotation converged in three iterations.

CONCLUSIONS

1. The principal component analysis (PCA) analyzed the structure of the interrelationships between eleven variables related to LPG supply. Real data was provided for each variable, and a satisfactory fit to the assumptions of the classic PCA model was found. When the correlation matrix is analyzed to verify that correlation exists between variables, it is found that 100% of the correlation coefficients are different from zero; therefore, it is possible to continue the analysis and obtain a better fit.

2. The Kaiser-Meyer-Olkin (KMO) measure of sampling adequacy indicates that the data sample used is adequate.

3. Bartlett’s test of sphericity indicates a significance value of 0.000, therefore, it is not an identity matrix. It is concluded that there is correlation between the variables.

4. The total explained variance table shows that there is only 9.31% of information loss when nine factors are considered, and 6.44% when seven factors are considered.

5. The goodness of fit of the model has been demonstrated, as the differences between the matrix of initial correlation and the matrix reproduced by the model are close to zero in absolute value, which is indicative of a good fit.

6. It may be possible to conduct a confirmatory factor analysis (CFA) and a subsequent exploratory structural equation modeling (ESEM) using the correlated variables, which would make it possible to verify that the proposed structural model fits the data appropriately.

7. These results demonstrate that variables LPG production (X10) and ports closure (X9) significantly contribute to the model. Additionally, nationwide LPG supply depends on NGL production (X2) and NGL processing (X7); thus, any issue related to these activities may affect it.

8. Variables petroleum production (X1), petroleum reserves (X5), NGL reserves (X6) and LPG inventories (X13) showed less influence on the LPG supply nationwide.

9. The remaining variables—NGL production (X2), petroleum processing (X3), petroleum importation (X4), NGL processing (X7), LPG storage capacity (X8), ports closure (X9), LPG production (X10), LPG demand (X11) and LPG importation (X12)—have a high degree of correlation with nationwide LPG supply; consequently, any disturbance that affects one of these variables will have an impact on supply.

10. The two component model reflects the real behavior of the variables, based on the historical data used.

11. Components Y1 and Y2 represent LPG supply according to origin, whereby Y1 corresponds to LPG _{Natural Gas}and Y2 corresponds to LPG_Petroleum; therefore:

LPG_{Natural Gas} = 0.990 NGL production – 0.421 petroleum processing + 0.413 petroleum importation + 0.956 NGL processing + 0.804 LPG storage capacity + 0.864 Ports closure + 0.990 LPG production + 0.978 LPG demand – 0.864 Importation of LPG.

LPG_Petroleum = 0.006 NGL production + 0.852 petroleum processing + 0.853 petroleum importation + 0.138 NGL processing + 0.495 LPG storage capacity – 0.138 ports closure + 0.022 LPG production – 0.091 LPG demand – 0.310 LPG importation.

REFERENCES

[2] Checchi, A.; Behrens, A. & Egenhofer, C. (2009). Long-term energy security risks for Europe: a sector-specific approach. Working Document, 52(309). Retrieved from http://aei.pitt.edu/10759/1/1785.pdf.

[3] Commission of the European Communities (2001a). Green paper: towards a European strategy for the security of energy supply. Office for Official Publications of the European Communities, 90. Retrieved from https://op.europa.eu/en/publication-detail/-/publication/0ef8d03f-7c54-41b6-ab89-6b93e61fd37c/language-en.

[4] Cuadras, C. (2018). Nuevos métodos de análisis multivariante. Barcelona, Spain: CMC Editions.

[5] Ganzo, A. (2004). Análisis de componentes principales. Introducción al análisis multivariante. Retrieved from http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-DPTO/MATERIALES/Mat_50140155_AnalisisMultivariante.pdf.

[6] IEA (1985). Energy technology policy. Paris, France: OECD Publishing.

[7] IEA (2001). Towards a sustainable energy future. Paris, France: OECD. Retrieved from https://www.oecd-ilibrary.org/energy/towards-a-sustainable-energy-future_9789264193581-en.

[8] IEA (2007). Energy security and climate policy-assessing interactions. Paris, France: OECD. Retrieved from https://www.oecd-ilibrary.org/energy/energy-security-and-climate-policy-assessing-interactions_9789264109940-en.

[9] Informe situacional de la comercialización del Gas Licuado de Petróleo (GLP) en el Perú (2015). Lima, Peru: Gerencia de Fiscalización de Hidrocarburos Líquidos de Osinergmin.

[10] Kruyt, B.; Vuuren, D. P. van; Vries, H. J. M. de & Groenenberg, H. (2009). Indicators for energy security. Energy Policy, 37(6), 2166-2181. Retrieved from https://www.sciencedirect.com/science/article/pii/S0301421509000883?via%3Dihub.

[11] Lloret, S.; Ferreres, A.; Hernández, A. & Tomás, I. (2014). Exploratory item factor analysis: a practical guide revised and up-dated. Annals of Psychology, 30(3), 1151-1169. Retrieved from https://revistas.um.es/analesps/article/view/analesps.30.3.199361/217271.

[12] Löschel, A.; Johnston, J.; Delucchi, M.; Demayo, T.; Gautier, D.; Greene, D.; Ogden, J.; Rayner, S. & Worrell, E. (2009). Stocks, flows, and prospects of energy. In T. E. Graedel & E. van der Voet (Eds.), Linkages of sustainability. Oxford, Reino Unido: MIT Press Scholarship.

^{^[1]}Ingeniera petroquímica por la Universidad Nacional de Ingeniería. MBA y MSc. en Ingeniería de Petróleo y Gas Natural por la misma institución. Es profesora principal de la Escuela Profesional de Ingeniería Petroquímica de la Facultad de Ingeniería de Petróleo, Gas Natural y Petroquímica de la UNI. Asimismo, es jefa de producción y procesamiento de gas natural de la División de Supervisión de Gas Natural de Osinergmin. Lima, Perú

E-mail: badaniya@fip.uni.edu.pe

^{^[2]}Petrochemical Engineer from the Universidad Nacional de Ingeniería (UNI). MBA and MSc in Petroleum and Natural Gas Engineering from the same university. Professor at the Department of Petrochemical Engineering of the School of Petroleum, Natural Gas and Petrochemistry of the UNI. She is also manager of natural gas production and processing for the División de Supervisión de Gas Natural at Osinergmin. Lima, Perú

E-mail: badaniya@fip.uni.edu.pe