Média e Mediana: Escolha da Medida Resumo em Dados Assimétricos

UFMA/HU-UFMA - Hospital Universitário da UFMA (MA) — Prova 2015

Enunciado

No início de 2014, numa classe de sexto ano de medicina, os alunos tinham uma média de 23,6 anos de idade. Em agosto do mesmo ano, atendendo a uma resolução governamental, a classe recebeu 12 alunos com mais de 50 anos de idade. Nessas circunstâncias, a média:

Alternativas

  1. A) Deixa de ser indicada como medida resumo e a medida recomendada é a classe modal.
  2. B) Deixa de ser indicada como medida resumo e a medida recomendada é a mediana. 
  3. C) Deverá, necessariamente, ser recalculada, mas o desvio padrão não deverá sofrer alterações.
  4. D) De idade da classe não foi afetada, pois houve o acréscimo de 10% no número de alunos. 
  5. E) De idade obtida no início de 2014 pode continuar sendo utilizada para resumir a informação de forma precisa, desde que o desvio padrão seja recalculado.

Pérola Clínica

Dados com outliers ou distribuição assimétrica → mediana é melhor medida resumo que a média.

Resumo-Chave

A média aritmética é sensível a valores extremos (outliers). Quando uma distribuição de dados é assimétrica ou contém valores discrepantes, como a adição de alunos significativamente mais velhos, a mediana torna-se uma medida de tendência central mais representativa e robusta, pois não é tão afetada por esses valores.

Contexto Educacional

A estatística descritiva é uma ferramenta fundamental para resumir e apresentar dados, sendo essencial para a compreensão de estudos científicos e para a prática clínica baseada em evidências. As medidas de tendência central, como a média e a mediana, são amplamente utilizadas para descrever o centro de um conjunto de dados. A escolha da medida mais apropriada depende da natureza dos dados e de sua distribuição. A média aritmética é calculada somando todos os valores e dividindo pelo número total de observações. Ela é a medida mais conhecida, mas é altamente sensível a valores extremos, conhecidos como outliers. A mediana, por outro lado, é o valor que divide um conjunto de dados ordenado em duas metades iguais, ou seja, 50% dos valores estão abaixo dela e 50% estão acima. Quando um conjunto de dados contém outliers ou apresenta uma distribuição assimétrica (enviesada), a média pode ser distorcida e não representar adequadamente a tendência central. Nesses casos, a mediana é uma medida mais robusta e representativa, pois não é influenciada pelos valores extremos. A questão ilustra perfeitamente essa situação: a adição de alunos com mais de 50 anos a uma classe com média de 23,6 anos criaria uma distribuição bimodal ou altamente assimétrica, tornando a mediana a escolha mais adequada para resumir a idade da classe de forma precisa.

Perguntas Frequentes

Qual a diferença fundamental entre média e mediana?

A média é a soma de todos os valores dividida pelo número de valores, sendo sensível a extremos. A mediana é o valor central de um conjunto de dados ordenado, dividindo-o em duas metades iguais, e é menos afetada por valores atípicos (outliers).

Por que a mediana é mais indicada em distribuições assimétricas ou com outliers?

Em distribuições assimétricas ou com a presença de outliers, a média pode ser puxada em direção aos valores extremos, tornando-se menos representativa do 'centro' dos dados. A mediana, por ser uma medida de posição, reflete melhor o valor típico da maioria dos dados nessas situações.

Quando a média ainda é a medida resumo preferencial?

A média é a medida resumo preferencial quando os dados seguem uma distribuição aproximadamente simétrica e sem a presença de outliers significativos, como na distribuição normal. Nesses casos, a média é eficiente e fornece informações valiosas sobre a tendência central.

Responda esta e mais de 150 mil questões comentadas no MedEvo — a plataforma de residência médica com IA.

Responder questão no MedEvo