Analisis Cuantitativo

data <- read.csv(file = "D://marketing.csv")
head(data)
##     Edad    Genero  Vivienda  Ecivil Ubicacion Salario Hijos Historial
## 1 Adulta  Femenino    Propia Soltero     Lejos   47500     0      Alto
## 2  Media Masculino Alquilada Soltero     Cerca   63600     0      Alto
## 3  Joven  Femenino Alquilada Soltero     Cerca   13500     0      Bajo
## 4  Media Masculino    Propia  Casado     Cerca   85600     1      Alto
## 5  Media  Femenino    Propia Soltero     Cerca   68400     0      Alto
## 6  Joven Masculino    Propia  Casado     Cerca   30400     0      Bajo
##   Catalogos Monto
## 1         6   755
## 2         6  1318
## 3        18   296
## 4        18  2436
## 5        12  1304
## 6         6   495

Cuadro de distribuciĆ³n

Factorx<-factor(cut(data$Monto, 
                    breaks=nclass.Sturges(data$Monto),
                    right=T))   #por la regla de sturges
xout<-as.data.frame(table(Factorx))
colnames(xout)<-c("Monto","ni")
xout<-transform(xout,
                  fi=prop.table(ni),
                  pi=prop.table(ni)*100,
                  Ni=cumsum(ni),
                  Fi=cumsum(prop.table(ni)),
                  Pi=cumsum(prop.table(ni))*100)
xout
##                  Monto  ni    fi   pi   Ni    Fi    Pi
## 1           (31.8,600] 322 0.322 32.2  322 0.322  32.2
## 2       (600,1.16e+03] 255 0.255 25.5  577 0.577  57.7
## 3  (1.16e+03,1.72e+03] 186 0.186 18.6  763 0.763  76.3
## 4  (1.72e+03,2.28e+03] 101 0.101 10.1  864 0.864  86.4
## 5  (2.28e+03,2.85e+03]  74 0.074  7.4  938 0.938  93.8
## 6  (2.85e+03,3.41e+03]  34 0.034  3.4  972 0.972  97.2
## 7  (3.41e+03,3.97e+03]  14 0.014  1.4  986 0.986  98.6
## 8  (3.97e+03,4.53e+03]   4 0.004  0.4  990 0.990  99.0
## 9  (4.53e+03,5.09e+03]   3 0.003  0.3  993 0.993  99.3
## 10 (5.09e+03,5.66e+03]   4 0.004  0.4  997 0.997  99.7
## 11 (5.66e+03,6.22e+03]   3 0.003  0.3 1000 1.000 100.0

Histograma

hist(data$Monto, ylim = c(0,300))

hist(data$Monto,prob=T)
lines(density(data$Monto))

plot(density(data$Monto))

Descriptivos

summary(data)
##      Edad           Genero         Vivienda       Ecivil    Ubicacion  
##  Adulta:205   Femenino :506   Alquilada:484   Casado :502   Cerca:710  
##  Joven :287   Masculino:494   Propia   :516   Soltero:498   Lejos:290  
##  Media :508                                                            
##                                                                        
##                                                                        
##                                                                        
##     Salario           Hijos       Historial     Catalogos    
##  Min.   : 10100   Min.   :0.000   Alto :255   Min.   : 6.00  
##  1st Qu.: 29975   1st Qu.:0.000   Bajo :230   1st Qu.: 6.00  
##  Median : 53700   Median :1.000   Medio:212   Median :12.00  
##  Mean   : 56104   Mean   :0.934   NA's :303   Mean   :14.68  
##  3rd Qu.: 77025   3rd Qu.:2.000               3rd Qu.:18.00  
##  Max.   :168800   Max.   :3.000               Max.   :24.00  
##      Monto       
##  Min.   :  38.0  
##  1st Qu.: 488.2  
##  Median : 962.0  
##  Mean   :1216.8  
##  3rd Qu.:1688.5  
##  Max.   :6217.0

funcion para calcular el cv

cv<-function(x)
{
  sd(x)/mean(x)
}
cv(data$Monto)
## [1] 0.7898523
#funcion para calcular el rango
rango<-function(x)
{
  diff(range(x))
}
rango(data$Monto)
## [1] 6179

Media

me<-mean(data$Monto)
me
## [1] 1216.77

Mediana

med<-median(data$Monto)
med
## [1] 962

Quartil 1

q1<-quantile(x=data$Monto,
             probs = 0.25,
             type=6)
q1
##    25% 
## 486.75

Quartil 3

q3<-quantile(x=data$Monto,
             probs = 0.75,
             type=6)
q3
##    75% 
## 1689.5

De las funciones creadas

r=rango(data$Monto)
s=sd(data$Monto)
CV<-cv(data$Monto)

Generar resumen

resumen <- as.matrix(rbind(me,
                           med,
                           q1,
                           q3,
                           r,
                           s, CV))
colnames(resumen) <- c("Valor")
resumen
##            Valor
## me  1216.7700000
## med  962.0000000
## q1   486.7500000
## q3  1689.5000000
## r   6179.0000000
## s    961.0686125
## CV     0.7898523

correlacion

plot(data$Salario,data$Monto)

cor(data$Salario,data$Monto) 
## [1] 0.6995957
c<-cor.test(data$Salario,data$Monto,
         alternative = c("two.sided"),
         method=c("pearson"), ##two sided, dos colas
         conf.level = 0.95)
c
## 
##  Pearson's product-moment correlation
## 
## data:  data$Salario and data$Monto
## t = 30.93, df = 998, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.6665092 0.7299316
## sample estimates:
##       cor 
## 0.6995957
names(c)
## [1] "statistic"   "parameter"   "p.value"     "estimate"    "null.value" 
## [6] "alternative" "method"      "data.name"   "conf.int"