MedEvo Ciclo Básico — Prova 2025
Um grupo de pesquisadores da saúde coletiva investiga a relação entre o consumo diário de fibras (em gramas) e os níveis de colesterol LDL (mg/dL) em uma coorte de 500 adultos. Após a análise de regressão linear simples, os autores reportam um coeficiente de determinação (R²) de 0,78 e um p-valor < 0,001, sugerindo uma forte associação. Contudo, ao realizar o diagnóstico do modelo, a análise do gráfico de resíduos (a diferença entre o valor observado e o previsto pelo modelo) revela que a variância dos erros não é constante, aumentando significativamente à medida que o consumo de fibras aumenta, apresentando um formato de funil. Diante desse achado estatístico, qual a conclusão mais adequada sobre a aplicabilidade do modelo para a prática clínica?
Nunca confie apenas no R² ou no p-valor de uma regressão. Sempre solicite ou analise o gráfico de resíduos; se houver um padrão (curva ou funil), o modelo linear simples não deve ser usado para predição clínica.
A regressão linear simples é uma ferramenta fundamental para modelar relações entre variáveis contínuas, como consumo de fibras e níveis de LDL. No entanto, sua validade depende de pressupostos rígidos, sendo a homocedasticidade um dos principais. Quando a variância dos resíduos aumenta ou diminui sistematicamente (formato de funil), as estimativas dos coeficientes podem até permanecer não viesadas, mas a inferência estatística é severamente prejudicada. Na prática clínica, isso implica que a capacidade preditiva do modelo não é uniforme. No caso da coorte de 500 adultos, o modelo pode ser preciso para baixos consumos de fibras, mas extremamente incerto para consumos elevados. O reconhecimento visual através do gráfico de resíduos é o padrão-ouro inicial para o diagnóstico de falhas no modelo, orientando o pesquisador a buscar ajustes metodológicos para garantir a segurança das evidências apresentadas.
Geralmente ocorre quando a variável dependente tem uma dispersão natural maior em valores mais altos da variável independente ou quando o modelo omitiu variáveis importantes.
Pode-se tentar transformar as variáveis (ex: usar o logaritmo) ou utilizar modelos de regressão robustos que não exijam variância constante.
É a 'sobra' ou erro: a diferença entre o valor real observado no paciente e o valor que a linha da regressão previu para ele.
Responda esta e mais de 150 mil questões comentadas no MedEvo — a plataforma de residência médica com IA.
Responder questão no MedEvo