Botón para abrir el Menú Botón para cerrar el Menú
Logo da empresa Alura
Iniciar Sesión Nuestros Planes
Formaciones Conoce a Luri
  • Programación _
  • Front End _
  • Data Science _
  • DevOps _
  • Innovación y Gestión _
Artículos de Tecnología > Data Science

¿Media o mediana? Entienda cada una

Alura
Yuri Matheus
Yuri Matheus
04/12/2020

Compartir

Mira este artículo:
  1. Entendiendo el promedio
  2. Conociendo la mediana
  3. Muestra con valores pares
  4. Para saber más

¿Media o mediana? Entienda cada una

Estaba haciendo un análisis de las calificaciones de los alumnos de una clase. Necesito ver cómo el abordaje de enseñanza influye en las calificaciones de ellos. Así que veamos las notas antes y después de aplicar algunos cambios. Para hacer este análisis, analizaremos las notas de una clase con 21 alumnos.

6.0, 7.1, 5.5, 3.0, 10.0, 100.0, 6.5, 8.2, 2.9, 3.5, 9.9, 
9.1, 8.2, 7.6, 9.9, 10.0, 6.7, 4.9, 10.0, 6.8, 6.0

¿Qué tan bien estuvo la clase? Es decir, ¿cuál es la nota media o el promdio del curso? Podemos sacar una media aritmética simple. Es decir, sume todas las calificaciones y divida por la cantidad de estudiantes. De esta forma tendremos:

(6.0 + 7.1 + 5.5 + … + 6.0) / 21

El resultado de este cálculo es aproximadamente 11.51. La gran mayoría de las notas de nuestra muestra son de 0 a 10, por lo tanto, ¿por qué nuestro promedio es 11?

Entendiendo el promedio

El promedio o la media está influenciado por todos los valores de la muestra. Es decir, si tenemos valores muy diferentes, impacta el valor del promedio.

Por ejemplo, en nuestra muestra de notas, tenemos una nota con el valor 100,0. Es por ello que el promedio tiene un valor extraño. Estos valores atípicos de una meustra, tanto superiores como inferiores, se conocen como outliers.

Hay muchas formas de tratar outliers. Uno de ellos es eliminar el outlier. En muestras con una gran cantidad de datos esto no representa mayores problemas. Ya por otro lado en una muestra con pocos datos, como la nuestra, eliminar un outlier puede causar mucho impacto. Entonces, ¿cómo podemos solucionar este problema?

Una forma es comprobar que ese dato de la muestra está correcto. Otra forma es reemplazar este valor con el valor que se repite más en la muestra, o bien con el valor de la mediana. Pero, ¿qué es la mediana?

Conociendo la mediana

La mediana es el valor que se encuentra en el medio de la muestra. Es decir, divide la muestra en dos partes. ¿Cómo podemos calcular la mediana? Una forma de calcular la mediana es ordenando todos nuestros datos:

2.9, 3.0, 3.5, 4.9, 5.5, 6.0, 6.0, 6.5, 6.7, 6.8,
7.1, 7.6, 8.2, 8.2, 9.1, 9.9, 9.9, 10.0, 10.0, 10.0, 100.0

Ahora que hemos ordenado los datos, necesitamos saber qué datos están en el medio de nuestra muestra. Es decir, en nuestro caso tenemos 21 elementos de la muestra. Como es un número impar, simplemente agregue 1 a este valor y divídelo por 2.

Así tenemos la fórmula (numero_de_elementos + 1)/2. Haciendo los cálculos, veremos que el valor del resultado es 11. Por lo tanto, nuestro elemento mediano está en la posición numérica 11.

PosiciónElemento
12.9
23.0
..
..
..
117.1

Nuestra nota mediana es 7.1. Esto significa que la mitad de nuestros datos están por debajo 7.1 y la mitad de los datos están arriba de este valor.

Ahora que tenemos la mediana, podemos reemplazar el outlier con su valor. Cuando reemplazemos y calculamos el nuevo promedio, vemos que su valor ha cambiado a 7.09. Y, calculando de nuevo la mediana, esta permanece en 7.1, cuidado este comportamiento no es una regla, la medianda puede verse alterada también.

La mediana es el elemento del medio. Divide nuestros datos en dos partes. En nuestro caso, nuestra muestra contiene un conjunto de datos con un valor impar. Pero, ¿y si tuviéramos un valor par? ¿Cómo se calcula la mediana en este caso?

Muestra con valores pares

Para una muestra con un número par de valores, tenemos que realizar un paso similar, sin embargo, en lugar de tomar el valor central, tomamos los dos valores que están en el centro. Con estos dos valores podemos calcular su promedio. Este promedio de los valores centrales es la mediana de la muestra.

Por ejemplo, imaginemos que tenemos la siguiente muestra; 1, 2, 5, 7, 9, 11. Necesitamos los dos valores centrales. Para eso, podemos usar la fórmula numero_elemento / 2 y (numero_de_elementos / 2) + 1.

Es decir, tenemos seis elementos. Entonces las fórmulas son 6/2 y (6/2) + 1. Con eso tenemos como resultado 3 y 4. Por lo tanto, nuestros elementos centrales son el tercero (5) y cuarto (7) elemento.

Realizando el cálculo medio entre ellos, obtendremos el valor 6. Es decir, en esta muestra nuestra mediana vale 6.

Para saber más

Además del promedio o media aritmética que realizamos, existen otros estadístos. Como por ejemplo, media geométrica y armónica.

Básicamente, la media geométrica medirá la proporción media de un elemento en relación al otro. La media armónica mide la razón entre los elementos. Como ya vimos, el promedio suele ser muy influenciado por outliers, por ello es aconsejable usar la mediana para hacer comparaciones entre muestras.

Además de la media y la mediana, también tenemos la moda. La moda es el valor más repetido de la muestra. Podemos tener distribuciones con un valor modal (unimodal), dos valores (bimodal) y con muchos valores (polimodal). También existe la media ponderada.

La media, la mediana y la moda son medidas estadísticas que se utilizan ampliamente cuando hacemos análisis de datos. Aquí en Alura tenemos cursos de data science. Ahí verá muchas medidas estadísticas y aprenderás a utilizarlas para analizar datos y extraer valor de ellos.

Yuri Matheus
Yuri Matheus

Yuri é desenvolvedor e instrutor. É estudante de Sistemas de Informação na FIAP e formado como Técnico em Informática no Senac SP. O seu foco é nas plataformas Java e Python e em outras áreas como Arquitetura de Software e Machine Learning. Yuri também atua como editor de conteúdo no blog da Alura, onde escreve, principalmente, sobre Redes, Docker, Linux, Java e Python.

Artículo Anterior
Análisis de datos: analizando mi distribución con tres alternativas de visualización
Siguiente Artículo
Buscando tweets con Python

Ver otros artículos sobre Data Science

Navegación

  • Planes
  • Instructores
  • Blog
  • Política de privacidad
  • Términos de uso
  • Sobre nosotros
  • Preguntas frecuentes

¡CONTÁCTANOS!

  • ¡Quiero entrar en contacto!

Blog

  • Programación
  • Data Science
  • Front End
  • Innovación y Gestión
  • DevOps

AOVS Sistemas de Informática S.A CNPJ 05.555.382/0001-33

SÍGUENOS EN NUESTRAS REDES SOCIALES

YouTube Facebook Instagram Linkedin Whatsapp Spotify

NOVEDADES Y LANZAMIENTOS

Aliados

  • Programa de aceleração Scale-Up Endeavor
  • En Alura somos unas de las Scale-Ups seleccionadas por Endeavor, programa de aceleración de las empresas que más crecen en el país.
  • Growth Academy 2021 do Google For Startups
  • Fuimos unas de las 7 startups seleccionadas por Google For Startups en participar del programa Growth Academy en 2021
Alura

Powered by

Caelum

AOVS Sistemas de Informática S.A CNPJ 05.555.382/0001-33

SÍGUENOS EN NUESTRAS REDES SOCIALES

YouTube Facebook Instagram Linkedin Whatsapp Spotify

Cursos

Cursos de Programación
Lógica de Programación | Java
Cursos de Front End
HTML y CSS | JavaScript | React
Cursos de Data Science
Data Science | Machine Learning | Excel | Base de Datos | Data Visualization | Estadística
Cursos de DevOps
Docker | Linux
Cursos de Innovación y Gestión
Transformación Ágil | Marketing Analytics

Alura

  • Educação em Tecnologia

    • logo fiap FIAP
    • logo casa do codigo Casa do Código
    • logo pm3 PM3 - Cursos de Produto
  • Mais Alura

    • logo alura start START BY Alura
    • logo alura lingua Alura Língua
    • logo alura para empresas Alura Para Empresas
    • logo alura latam Alura LATAM
  • Comunidade

    • logo tech guide Tech Guide
    • logo 7 days of code 7 days of code
    • logo Hipsters ponto Jobs Hipsters ponto Jobs
  • Podcasts

    • logo Hipster Network Hipster Network
    • logo Hipsters ponto Tech Hipsters ponto Tech
    • logo Dev sem fronteiras Dev sem Fronteiras
    • logo Like a Boss Like a Boss
    • logo IA Sob Controle IA Sob Controle
    • logo Mesa de Produto Mesa de Produto
    • logo Decode Decode
    • logo FIAPCast FIAPCast