Análisis de Variable Cualitativa

data <- read.csv(file = "D://marketing.csv")# abrimos la ventana de busqueda de archivo y seleccionamos la 
head(data)
##     Edad    Genero  Vivienda  Ecivil Ubicacion Salario Hijos Historial
## 1 Adulta  Femenino    Propia Soltero     Lejos   47500     0      Alto
## 2  Media Masculino Alquilada Soltero     Cerca   63600     0      Alto
## 3  Joven  Femenino Alquilada Soltero     Cerca   13500     0      Bajo
## 4  Media Masculino    Propia  Casado     Cerca   85600     1      Alto
## 5  Media  Femenino    Propia Soltero     Cerca   68400     0      Alto
## 6  Joven Masculino    Propia  Casado     Cerca   30400     0      Bajo
##   Catalogos Monto
## 1         6   755
## 2         6  1318
## 3        18   296
## 4        18  2436
## 5        12  1304
## 6         6   495
ni <- table(data$Edad) #tabla de frecuencia absoluta de Edad
ni
## 
## Adulta  Joven  Media 
##    205    287    508
fi <- prop.table(table(data$Edad)) #tabla de frecuencia relativa
fi
## 
## Adulta  Joven  Media 
##  0.205  0.287  0.508
pi <- prop.table(table(data$Edad))*100 #tabla de porcentajes
pi
## 
## Adulta  Joven  Media 
##   20.5   28.7   50.8
edad.table <- t(rbind(ni, fi, pi))#juntando las tablas de las frecuencias de edad, (t) transp
edad.table
##         ni    fi   pi
## Adulta 205 0.205 20.5
## Joven  287 0.287 28.7
## Media  508 0.508 50.8

Mostrando en un gráfico de barras

barplot(pi, main = "Distribución de las edades",
        xlab = "Grupo Etario",
        ylab = "Porcentaje de Clientes")

Mostrando dos gráficos a la vez

par(mfrow = c(1,2)) #En una fila y dos columnas
barplot(ni,
        main = "Distribución de las edades",
        xlab = "Grupo Etario",
        ylab = "Número de clientes")


barplot(pi,
        main = "Distribución de las edades",
        xlab = "Grupo Etario",
        ylab = "Proporción de los clientes")

Tabla de contingencia

tabla.contingencia <- table(data$Edad,data$Historial)
tabla.contingencia
##         
##          Alto Bajo Medio
##   Adulta   81   38    50
##   Joven     7  123    35
##   Media   167   69   127

graficos con dos variables cualitativos

plot(data$Edad, data$Historial)

tabla y análisis test

chisq.test(plot(data$Edad, data$Historial))

## 
##  Pearson's Chi-squared test
## 
## data:  plot(data$Edad, data$Historial)
## X-squared = 182.56, df = 4, p-value < 2.2e-16

Histograma

par(mfrow = c(1,3))
hist(data$Monto[data$Edad == "Joven"], ylim = c(0,170), main = "Joven")
hist(data$Monto[data$Edad == "Media"], ylim = c(0,170), main = "Media")
hist(data$Monto[data$Edad == "Adulta"], ylim = c(0,170), main = "Adulta")

Cajas y bigotes

boxplot(data$Monto ~ data$Edad)