MATEMÁTICAS II MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN:
Medidas de tendencia central
Al describir grupos de observaciones, con frecuencia es
conveniente resumir la información con un solo número. Este número que, para
tal fin, suele situarse hacia el centro de la distribución de datos se denomina
medida o parámetro de tendencia central o de centralización. Cuando se hace
referencia únicamente a la posición de estos parámetros dentro de la
distribución, independientemente de que ésta esté más o menos centrada, se
habla de estas medidas como medidas de posición.[1] En este caso se incluyen
también los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
Media
Media ponderada
Media geométrica
Media armónica
Mediana
Moda
Se debe tener en cuenta que existen variables cualitativas y
variables cuantitativas, por lo que las medidas de posición o medidas de
tendencia se usan de acuerdo al tipo de variable que se está observando, en
este caso se observan variables cuantitativas.
LA MEDIA ARITMÉTICA
La media aritmética es el valor obtenido por la suma de
todos sus valores dividida entre el número de sumandos.
Por ejemplo, las notas de 5 alumnos en una prueba:
Propiedades
Las principales propiedades de la media aritmética son:[3]
Su cálculo es muy sencillo y en él intervienen todos los
datos.
Su valor es único para una serie de datos dada.
Se usa con frecuencia para comparar poblaciones, aunque es
más apropiado acompañarla de una medida de dispersión.
Se interpreta como "punto de equilibrio" o
"centro de masas" del conjunto de datos, ya que tiene la propiedad de
equilibrar las desviaciones de los datos respecto de su propio valor:
\frac{\sum_{i=1}^n
(x_i-\overline{x})}{n} = \frac{\sum_{i=1}^n x_i}{n} - \frac{\sum_{i=1}^n
\overline{x}}{n} = \overline{x} - \overline{x} = 0
Minimiza las desviaciones cuadráticas de los datos respecto
de cualquier valor prefijado, esto es, el valor de \frac{\sum_{i=1}^n (x_i-k)^2}{n}es mínimo
cuando k = \overline{x}. Este resultado se conoce como Teorema de König. Esta
propiedad permite interpretar uno de los parámetros de dispersión más
importantes: la varianza.
Se ve afectada por transformaciones afines (cambios de
origen y escala), esto es, si
x_i' = ax_i+bentonces \overline{x'} = a \overline{x} + b,
donde \overline{x'}es la media aritmética de los x_i', para i = 1, ..., n y a y
b números reales.
Es poco sensible a fluctuaciones muestrales, por lo que es
un parámetro muy útil en inferencia estadística.
Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que
aconsejan su uso en situaciones muy diversas, tiene también algunos
inconvenientes, como son:
Para datos agrupados en intervalos (variables continuas) su
valor oscila en función de la cantidad y amplitud de los intervalos que se
consideren.
Media aritmética ponderada
A veces puede ser útil otorgar pesos o valores a los datos
dependiendo de su relevancia para determinado estudio. En esos casos se puede
utilizar una media ponderada.
MODA
La moda es el dato más repetido de la encuesta, el valor de
la variable con mayor frecuencia absoluta.[5] En cierto sentido la definición
matemática corresponde con la locución "estar de moda", esto es, ser
lo que más se lleva.
Su cálculo es extremadamente sencillo, pues sólo
necesita un recuento. En variables continuas, expresadas en intervalos, existe
el denominado intervalo modal o, en su defecto, si es necesario obtener un
valor concreto de la variable, se recurre a la interpolación
Media
muestral
Esencialmente, la media muestral es el mismo parámetro que
el anterior, aunque el adjetivo "muestral" se aplica a aquellas
situaciones en las que la media aritmética se calcula para un subconjunto de la
población objeto de estudio.
La media muestral es un parámetro de extrema importancia en
la inferencia estadística, siendo de gran utilidad para la estimación de la
media poblacional, entre otros usos.
Medidas de dispersión
Las medidas de dispersión, también llamadas medidas de
variabilidad, muestran la variabilidad de una distribución, indicando por medio
de un número, si las diferentes puntuaciones de una variable están muy alejadas
de la media. Cuánto mayor sea ese valor, mayor será la variabilidad, cuanto
menor sea, más homogénea será a la media. Así se sabe si todos los casos son
parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene
respecto de su media, se calcula la media de las desviaciones de las
puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones
es siempre cero, así que se adoptan dos clases de estrategias para salvar este
problema. Una es tomando las desviaciones en valor absoluto (desviación media)
y otra es tomando las desviaciones al cuadrado (varianza).
RANGO ESTADÍSTICO
El rango o recorrido interarticular es la diferencia entre
el valor máximo y el valor mínimo en un grupo de números aleatorios. Se le
suele simbolizar con R'.
Requisitos del rango
Ordenamos los números según su tamaño.
Restamos el valor mínimo del valor máximo
Rango = {(Max - Min)}
MEDIO RANGO O RANGO MEDIO
El medio rango o rango medio de un conjunto de valores
numéricos es la media del mayor y menor valor, o la tercera parte del camino
entre el dato de menor valor y el dato de mayor valor. En consecuencia, el
medio rango es:
medioRango = \frac{\ (Max + Min)}{2}
VARIANZA
La varianza es una medida estadística que mide la dispersión
de los valores respecto a un valor central (media), es decir, es el cuadrado de
las desviaciones:
No hay comentarios:
Publicar un comentario