Clase 3: Distribuciones de probabilidad en R-project

Distribuciones de probabilidad en R


En las entradas anteriores (Clase 1, Clase 2) comentamos que el análisis estadístico consta de tres partes: el análisis descriptivo, el probabilistico y el inferencial. Hemos abordado el primero en la Clase 2 y ahora nos centraremos en el análisis probabilístico.

Probabilidad y variables aleatorias.


La probabilidad refleja las expectativas de que un resultado (o suceso) determinado ocurra.
Para estudiar el comoprtamiento de estas probabilidades, se trabaja con variables aleatorias que  representan los posibles resultados de un experimento aún no realizado. Una variable aleatoria (v.a.) es una función que asocia a cada resultado de de un experimento (espacio muestral) un número real.

Tipos de variables aleatorias.

Podemos clasificar las v.a. en discretas y continuas según tomen valores discretos (números enteros) o continuos (números reales), respectivamente.

Función de probabilidad y función de distribución.

Las v.a. quedan caracterizadas por su función masa de probabilidad (caso discreto) o función de densidad de probabilidad (caso continuo), además de por su función de distribución, esperanza y varianza.
La función de densidad nos dice cómo se distribuyen las probabilidades de un suceso o evento, por tanto, la distribución de probabilidad de una v.a. es una función que asigna a cada valor posible de dicha v.a. una probabilidad. La función de distribución se puede entender como una función de probabilidad acumulada, es decir,  asocia a cada valor de la variable aleatoria la probabilidad acumulada hasta ese valor.



Con estos conceptos en mente, veamos ahora cómo aplicarlos en R.
Saludos!

 

###########################################################################
# An?lisis de datos con R #
# 2012 #
# Msc. Rosana Ferrero #
# http://statisticalecology.blogspot.com/ #
###########################################################################
# 3. Distribuciones de probabilidad #
###########################################################################
 
### Funciones para distribuciones de probabilidad
 
# Densidad de probabilidad (d): probabilidades puntuales P(X=x)
# Probabilidades (p): probabilidades acumuladas P(X<=x) y P(X>x) si lower.tail=F
# Quantiles (q): cuantiles (cola inferior) o cola superior si lower.tail=F. Recordar que los cuantiles pueden ser: cuartiles, deciles, percentiles
# N?meros aleatorios (r): Generaci?n de muestras aleatorias
 
### Distribuciones disponibles:
# binom Binomial
# cauchy Cauchy
# chisq Chi Cuadrado
# beta Beta
# exp Exponencial
# gamma Gamma
# geom Geom?trica
# hyper Hipergeom?trica
# lnorm Log-normal
# logis Log?stica
# nbinom Binomial negativa
# nchisq Chi cuadrado no central
# norm Normal
# pois Poisson
# signrank Distribucion del test de Wilcoxon de rangos con signo
# t Student
# unif Uniforme
# weibull Weibull
# wilcox Distribuci?n de la suma de rangos de Wilcoxon
 
### Ejemplo con la distribuci?n normal:
rnorm(1) # Generaci?n de un dato de la normal estandar
#[1] -0.4120618
rnorm(5) # Generaci?n de 5 datos de la normal estandar
#[1] -0.3220499 -0.5556478 -0.1899898 -0.3450181 -2.5807986
rnorm(5,mean=1,sd=3) # Generaci?n de un dato de una normal no estandar
#[1] -0.4035896 -0.8089832 3.2513373 4.9641722 -1.8603231
 
dnorm(0) # Evaluaci?n de la funci?n de densidad normal en el punto 0
#[1] 0.3989423
dnorm(1)
#[1] 0.2419707
# dnorm(3)
[1] 0.004431848
 
pnorm(0) # Probabilidad acumulada bajo la normal en el punto 0
#[1] 0.5
pnorm(3)
# [1] 0.9986501
 
qnorm(0.5) # El cuantil 50% de la normal es el 0
#[1] 0
qnorm(0.9986501) # El cuantil 99.86501% de la normal es el 3
#[1] 3.000000
 
x=seq(-4,4,length=200) # Dibujo del gr?fico de la distribuci?n normal
plot(x,dnorm(x),type="l")
 
 
#Generaci?n de 100 datos de una normal estandar, y un sumario de los mismos:
x = rnorm(100)
summary(x)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
#-2.18000 -0.71000 -0.01041 0.05584 0.73730 2.76500
 
#Generaci?n de dos muestras correladas, y c?lculo de la correlaci?n:
x = seq(1:10)
y = 2*x+rnorm(10)
cor(x,y)
#[1] 0.9817436
 
#Creaci?n de permutaciones:
sample(10)
#[1] 5 6 1 4 9 2 8 10 7 3
sample(10)
#[1] 9 1 3 10 7 2 5 4 8 6
 
#Muestreo sin repetici?n:
sample(1:10,5)
#[1] 7 8 2 4 6
 
#Muestreo con repetici?n: ej. Simulaci?n de 5 tiradas de un dado equilibrado.
sample(1:10,5,rep=T)
#[1] 6 10 6 1 6
 
#C?lculo de algunos percentiles de un conjunto de datos:
x = rnorm(200)
quantile(x,probs=c(0.1,0.4,0.9))
# 10% 40% 90%
#-1.3194786 -0.3663511 1.0824184

Comentarios