Mediana (estadística)

En el ámbito de la estadística, la mediana (del latín mediānus 'del medio'[1]) representa el valor de la variable de posición central en un conjunto de datos ordenados. Se le denota mediana.

Visualización geométrica de la moda, la mediana y de la media de una función arbitraria de densidad de probabilidad.

Si la serie tiene un número par de puntuaciones, la mediana es la media entre las dos puntuaciones centrales.

Ejemplo.

7, 8, 9, 10, 11, 12

Me = 9,5 = (9+10)/2

Conceptos generales

En teoría de la probabilidad, se define la mediana de una variable aleatoria como un número tal que la variable tiene igual probabilidad de tomar valores menores o mayores que él. Finalmente, en inferencia estadística se estudia la mediana poblacional y la mediana muestral.

La mediana se utiliza normalmente para dar un valor "típico" que caracteriza un conjunto de datos. En comparación con la media, la propiedad esencial de la mediana es que no se ve afectada si hay un grupo de datos mucho más pequeño o mucho más grandes que las otras, mientras que la media sí que puede quedar distorsionada. Un ejemplo de esta situación se da al analizar el tiempo que los estudiantes universitarios tardan en acabar una carrera, el hecho que haya algunos estudiantes que estén muchos años para acabar la carrera (porque se ponen a trabajar y retardan los estudios, u otros motivos) hace que la media no refleje bien los datos; al contrario, la mediana no es sensible a estos valores extremos, y proporciona un mejor valor representativo de la duración de los estudios.

Métodos de cálculo

Existen dos métodos para el cálculo de la mediana:

  1. Considerando los datos en forma individual, sin agruparlos.
  2. Utilizando los datos agrupados en intervalos de clase.

Datos no agrupados

Sean los datos de una muestra ordenada en orden creciente y designando la mediana como , distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posición una vez que los datos han sido ordenados (en orden creciente o decreciente), porque este es el valor central. Es decir: .

Por ejemplo, si tenemos 5 datos, que ordenados son: , , , , => El valor central es el tercero: . Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo (, ) y otros dos por encima de él (, ).

b) Si n es par, la mediana es la media aritmética de los dos valores centrales. Cuando es par, los dos datos que están en el centro de la muestra ocupan las posiciones y . Es decir: .

Por ejemplo, si tenemos 6 datos, que ordenados son: , , , , , . Hay dos valores que están por debajo del y otros dos que quedan por encima del siguiente dato . Por tanto, la mediana de este grupo de datos es la media aritmética de estos dos datos: .

Datos agrupados

Al tratar con datos agrupados en intervalos, si coincide con el valor de una frecuencia acumulada, el valor de la mediana coincidirá con la abscisa correspondiente. Si no coincide con el valor de ninguna abscisa, se calcula a través de semejanza de triángulos en el histograma o polígono de frecuencias acumuladas, utilizando la siguiente equivalencia:

Donde y son las frecuencias absolutas acumuladas tales que , y son los extremos, interior y exterior, del intervalo donde se alcanza la mediana y es la abscisa a calcular, la mediana. Se observa que es la amplitud de los intervalos seleccionados para el diagrama.

Ejemplos para datos agrupados

Ejemplo 1: cantidad (N) impar de datos

Las calificaciones en la asignatura de Matemáticas de alumnos de una clase viene dada por la siguiente tabla:

Calificaciones123456789
Número de alumnos224589342
Frecuencia absoluta

acumulada

2 4 8 13 21 30 33 37 39

Primero se hallan las frecuencias absolutas acumuladas . Así, aplicando la fórmula asociada a la mediana para n impar, se obtiene .

Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En este ejemplo, (frecuencia absoluta acumulada para ) con lo que puntos, la mitad de la clase ha obtenido un o menos, y la otra mitad un o más.

Ejemplo 2: cantidad (N) par de datos

Las calificaciones en la asignatura de Matemáticas de alumnos de una clase viene dada por la siguiente tabla (debajo):

Calificaciones123456789
Número de alumnos224569442
Frecuencia absoluta

acumulada

2 4 8 13 19 28 32 36 38

Primero se hallan las frecuencias absolutas acumuladas . Así, aplicando la fórmula asociada a la mediana para par, se obtiene la siguiente fórmula: (Donde alumnos divididos entre dos).

Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar. En el ejemplo el lugar decimonoveno lo ocupa el y el vigésimo el con lo que puntos, la mitad de la clase ha obtenido un o menos y la otra mitad un o más.

Método de cálculo general

xifiNi
[x11-x12]f1N1
...
...
..N(i-2)
[x(i-1)1-x(i-1)2]f(i-1)f(i-1)+N(i-2)=
[xi1-xi2]fi+Ni-1=Ni
[x(i+1)1-x(i+1)2]f(i+1)f(i+1)+Ni=N(i+1)
...
...
..
[xM1-xM2]fMfM+N(M-1)=NM

Consideramos:

- x11 valor mínimo< Entonces:

donde:

= es el límite inferior de la clase de la mediana.
= es la posición de la mediana.
= es la frecuencia acumulada de la clase premediana.
= es la frecuencia absoluta de la clase de la mediana.
= = Amplitud del intervalo de la clase de la mediana.

Véase también

Enlaces externos

Referencias

  1. Real Academia Española. «median». Diccionario de la lengua española (23.ª edición).

Bibliografía adicional

  • Weisstein, Eric W., «Statistical Median» a MathWorld (en ingles).
  • Sheskin, David (27 de agosto de 2003). Handbook of parametric and nonparametric statistical procedures (en inglés) (3rd edición). Boca Raton: Chapman & Hall/CRC. pp. 7-. ISBN 978-1-4200-3626-8.
  • Bissell, Derek (1994). Statistical methods for SPC and TQM (en inglés) (1st edición). London: Chapman & Hall. pp. 26-. ISBN 978-0-412-39440-9.
  • Lobez Urquia, J., Casa Aruta, E.. Estadística intermedia. Segunda edición. Barcelona: Vicens-Vives, 1975, p. 43.
  • Moore, David S. (1995). Estadística aplicada básica. Barcelona: Antonio Bosch. ISBN 8485855809.
  • Loeve, Michel. Teoría de la probabilidad. Madrid: Tecnos. p. 238. ISBN 8430906630.
  • Serfling, Robert J. (2009). Approximation theorems of mathematical statistics (en inglés). New York: Wiley. pp. 74-77. ISBN 1282307479.
  • DeGroot, Morris H. (1931, 1988). Probabilidad y estadística (2a. edición). Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca. ISBN 0201644053.
Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.