Analizando variables input

¿Cómo son los datos que uso en el modelo?

Icons Freepik from Flaticon

Análisis descriptivo de variables input

Poder monitorizar y visualizar las variables de entrada del modelo, permite controlar las distribuciones respectivas al largo del tiempo y detectar si se ha producido algún cambio brusco. Este hecho es importante ya que un cambio estructural (permanente, brusco) en la variables input puede afectar directamente a la calidad de la previsión.

Como en los modelos suelen coexistir variables continuas y categóricas, en esta sección se presentan algunas formas de visualizar las principales características de:

  • Variables categóricas o cualitativas.
  • Variables númericas o continuas.
  • Variables categóricas vs númericas.


Ánálisis de variables categóricas o cualitativas

Las variables categóricas o variables cualitativas, son aquellas que expresan una característica, categoria, atributo o modalidad que no puede ser medidas con números; Por ejemplo, el sexo de una persona es una variable cualitativa y “varón” o “mujer” son sus únicas modalidades. En consecuencia, para una variable cualitativa, cada dato no es más que la información de que un determinado elemento de la muestra presenta una determinada modalidad.

En este apartado se representan algunos gráficos que permiten visualizar la distribución de las variables categóricas a lo largo del tiempo, y formarse una idea lo más exacta posible acerca de sus características.

  • Análisis univariante:
    Para poder controlar la distribución (o frecuencia) de cada una de las categorías de cada variable, se suelen usar los diagramas de barras. Con el análisis univariado se puede visualizar la evolución de la distribución de cada categoría de la variable.


Figure 1: Ejemplo de Análisis Univariante

Figure 1: Ejemplo de Análisis Univariante

En estos dos ejemplos, se representa la frecuencia absoluta de cada categoría de las variables Segmento y Morosidad obtenida en cada versión del modelo. Con este gráfico podemos ver la evolución de la frecuencia absoluta de cada versión del modelo por categoría de la variable analizada.

Avatar
Romy Rodriguez-Ravines
GOING BEYOND DATA

Understand, Model, Predict = Learn and extract value from data for people and organizations.

Related