Artículos de Tecnología > Data Science

¿Media o mediana? Entienda cada una

Yuri Matheus

¿Media o mediana? Entienda cada una

Estaba haciendo un análisis de las calificaciones de los alumnos de una clase. Necesito ver cómo el abordaje de enseñanza influye en las calificaciones de ellos. Así que veamos las notas antes y después de aplicar algunos cambios. Para hacer este análisis, analizaremos las notas de una clase con 21 alumnos.

6.0, 7.1, 5.5, 3.0, 10.0, 100.0, 6.5, 8.2, 2.9, 3.5, 9.9, 
9.1, 8.2, 7.6, 9.9, 10.0, 6.7, 4.9, 10.0, 6.8, 6.0

¿Qué tan bien estuvo la clase? Es decir, ¿cuál es la nota media o el promdio del curso? Podemos sacar una media aritmética simple. Es decir, sume todas las calificaciones y divida por la cantidad de estudiantes. De esta forma tendremos:

(6.0 + 7.1 + 5.5 + … + 6.0) / 21

El resultado de este cálculo es aproximadamente 11.51. La gran mayoría de las notas de nuestra muestra son de 0 a 10, por lo tanto, ¿por qué nuestro promedio es 11?

Entendiendo el promedio

El promedio o la media está influenciado por todos los valores de la muestra. Es decir, si tenemos valores muy diferentes, impacta el valor del promedio.

Por ejemplo, en nuestra muestra de notas, tenemos una nota con el valor 100,0. Es por ello que el promedio tiene un valor extraño. Estos valores atípicos de una meustra, tanto superiores como inferiores, se conocen como outliers.

Hay muchas formas de tratar outliers. Uno de ellos es eliminar el outlier. En muestras con una gran cantidad de datos esto no representa mayores problemas. Ya por otro lado en una muestra con pocos datos, como la nuestra, eliminar un outlier puede causar mucho impacto. Entonces, ¿cómo podemos solucionar este problema?

Una forma es comprobar que ese dato de la muestra está correcto. Otra forma es reemplazar este valor con el valor que se repite más en la muestra, o bien con el valor de la mediana. Pero, ¿qué es la mediana?

Conociendo la mediana

La mediana es el valor que se encuentra en el medio de la muestra. Es decir, divide la muestra en dos partes. ¿Cómo podemos calcular la mediana? Una forma de calcular la mediana es ordenando todos nuestros datos:

2.9, 3.0, 3.5, 4.9, 5.5, 6.0, 6.0, 6.5, 6.7, 6.8,
7.1, 7.6, 8.2, 8.2, 9.1, 9.9, 9.9, 10.0, 10.0, 10.0, 100.0

Ahora que hemos ordenado los datos, necesitamos saber qué datos están en el medio de nuestra muestra. Es decir, en nuestro caso tenemos 21 elementos de la muestra. Como es un número impar, simplemente agregue 1 a este valor y divídelo por 2.

Así tenemos la fórmula (numero_de_elementos + 1)/2. Haciendo los cálculos, veremos que el valor del resultado es 11. Por lo tanto, nuestro elemento mediano está en la posición numérica 11.

PosiciónElemento
12.9
23.0
..
..
..
117.1

Nuestra nota mediana es 7.1. Esto significa que la mitad de nuestros datos están por debajo 7.1 y la mitad de los datos están arriba de este valor.

Ahora que tenemos la mediana, podemos reemplazar el outlier con su valor. Cuando reemplazemos y calculamos el nuevo promedio, vemos que su valor ha cambiado a 7.09. Y, calculando de nuevo la mediana, esta permanece en 7.1, cuidado este comportamiento no es una regla, la medianda puede verse alterada también.

La mediana es el elemento del medio. Divide nuestros datos en dos partes. En nuestro caso, nuestra muestra contiene un conjunto de datos con un valor impar. Pero, ¿y si tuviéramos un valor par? ¿Cómo se calcula la mediana en este caso?

Muestra con valores pares

Para una muestra con un número par de valores, tenemos que realizar un paso similar, sin embargo, en lugar de tomar el valor central, tomamos los dos valores que están en el centro. Con estos dos valores podemos calcular su promedio. Este promedio de los valores centrales es la mediana de la muestra.

Por ejemplo, imaginemos que tenemos la siguiente muestra; 1, 2, 5, 7, 9, 11. Necesitamos los dos valores centrales. Para eso, podemos usar la fórmula numero_elemento / 2 y (numero_de_elementos / 2) + 1.

Es decir, tenemos seis elementos. Entonces las fórmulas son 6/2 y (6/2) + 1. Con eso tenemos como resultado 3 y 4. Por lo tanto, nuestros elementos centrales son el tercero (5) y cuarto (7) elemento.

Realizando el cálculo medio entre ellos, obtendremos el valor 6. Es decir, en esta muestra nuestra mediana vale 6.

Para saber más

Además del promedio o media aritmética que realizamos, existen otros estadístos. Como por ejemplo, media geométrica y armónica.

Básicamente, la media geométrica medirá la proporción media de un elemento en relación al otro. La media armónica mide la razón entre los elementos. Como ya vimos, el promedio suele ser muy influenciado por outliers, por ello es aconsejable usar la mediana para hacer comparaciones entre muestras.

Además de la media y la mediana, también tenemos la moda. La moda es el valor más repetido de la muestra. Podemos tener distribuciones con un valor modal (unimodal), dos valores (bimodal) y con muchos valores (polimodal). También existe la media ponderada.

La media, la mediana y la moda son medidas estadísticas que se utilizan ampliamente cuando hacemos análisis de datos. Aquí en Alura tenemos cursos de data science. Ahí verá muchas medidas estadísticas y aprenderás a utilizarlas para analizar datos y extraer valor de ellos.

Puedes leer también:

Artículos de Tecnología > Data Science

En Alura encontrarás variados cursos sobre Data Science. ¡Comienza ahora!

Precios en:
USD
  • USD
  • BOB
  • CLP
  • COP
  • USD
  • PEN
  • MXN
  • UYU

Semestral

  • 273 cursos

    Cursos de Programación, Front End, Data Science, Innovación y Gestión.

  • Videos y actividades 100% en Español
  • Certificado de participación
  • Estudia las 24 horas, los 7 días de la semana
  • Foro y comunidad exclusiva para resolver tus dudas
  • Luri, la inteligencia artificial de Alura

    Luri es nuestra inteligencia artificial que resuelve dudas, da ejemplos prácticos y ayuda a profundizar aún más durante las clases. Puedes conversar con Luri hasta 100 mensajes por semana

  • Acceso a todo el contenido de la plataforma por 6 meses
US$ 65.90
un solo pago de US$ 65.90
¡QUIERO EMPEZAR A ESTUDIAR!

Paga en moneda local en los siguientes países

Anual

  • 273 cursos

    Cursos de Programación, Front End, Data Science, Innovación y Gestión.

  • Videos y actividades 100% en Español
  • Certificado de participación
  • Estudia las 24 horas, los 7 días de la semana
  • Foro y comunidad exclusiva para resolver tus dudas
  • Luri, la inteligencia artificial de Alura

    Luri es nuestra inteligencia artificial que resuelve dudas, da ejemplos prácticos y ayuda a profundizar aún más durante las clases. Puedes conversar con Luri hasta 100 mensajes por semana

  • Acceso a todo el contenido de la plataforma por 12 meses
US$ 99.90
un solo pago de US$ 99.90
¡QUIERO EMPEZAR A ESTUDIAR!

Paga en moneda local en los siguientes países

Acceso a todos
los cursos

Estudia las 24 horas,
dónde y cuándo quieras

Nuevos cursos
cada semana