EPIDEMILOGIA

EPIDEMILOGIA

(Parte 6 de 11)

Para se compreender este cálculo, imaginemos uma situação onde você é convidado(a) para dar um plantão, numa clínica onde os médicos ganham, em média, R$ 25.0,0 (por mês). Se quiséssemos formar uma idéia de quanto os salários variam ao redor da média, poderíamos : a)subtrais cada salário da média, obtendo para cada um, uma diferença ou variação. b) somar cada uma das diferenças observadas. c)dividir a soma obtida pelo número de observações (formando assim uma “diferença média”). Se realizássemos tal tarefa, com os contracheques da clínica, poderíamos obter a tabela IV. Repare que a média não é, obviamente um bom estimador dos salários, visto que o dono da clínica (que por sinal lhe convidou), recebe um salário que se encontra no extremo posto da distribuição A subtração de cada um dos valores da média e sua posterior soma, totalizou zero, o que nos faz voltar ao nosso problema original. Esta é uma das propriedades da média, ou seja, a soma das diferenças será sempre igual a zero. Uma solução para este impasse, reside em elevar ao quadrado a diferença entre cada número e a média (pois um número elevado ao quadrado é sempre positivo - veja tabela IV e identifique este passo na fórmula 2). Como elevei ao quadrado a diferença que nos interessava, devemos agora extrair a raiz quadrada para voltar à escala original de valores. Bem, nossa intenção sempre foi a de estimar a variação “média” de meus dados, ao redor da média da distribuição. Assim sendo, a soma das variações (elevadas ao quadrado) deverá

Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia

AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 30 ser dividida pelo número de observações. Repare que na fórmula 2, não levamos em conta o número total de observações e sim o total menos um. A razão para esta surpresa, numa lógica que se desenvolvia de forma tão “simples”, reside num conceito chamado de graus de liberdade (que será visto adiante). Neste momento, podemos ficar com o seguinte raciocínio: se numa amostra, tenho as medidas realizadas, bem como a média das mesmas, utilizando a média mais as (n - 1) observações realizadas, poderemos descobrir o valor que está faltando.

Digamos que retiremos uma amostra de 3 pessoas de onde dosamos a hemoglobina, obtendo-se os valores 12, 1 e 13. Se calcularmos a média resultante teremos : µ = 12 1 133

++ = 12. Com o valor da média (12) e qualquer combinação de duas das observações realizadas, poderei descobrir o valor da terceira

(cuja existência, para fins de cálculo, passa a ser redundante). Exemplo: 12 113

++ y = 12 ⇒ 12 x 3 = 23

+y ⇒y = 36 - 23 ⇒y = 13. O cálculo de todas as estatísticas disponíveis em testes de hipótese passam necessariamente pelo uso deste conceito. Qualquer que seja o teste estatístico utilizado, este estará calculando um valor qualquer, que deverá ser contraposto a uma tabela que leva em consideração o teste utilizado, bem como o tipo de distribuição estatística aos quais os dados pertencem. Este valor é localizado em uma tabela (fornecida em qualquer livro de estatística ou embutida nos “pacotes de estatística” do computador), onde uma das entradas necessárias para se encontrar o valor p é exatamente o número de graus de liberdade. Outro ponto importante reside na questão do tamanho amostral. Repare que numa amostra de 10 pessoas, fará diferença dividir alguma coisa por 9 e não 10. Em amostras maiores entretanto, tanto faz dividir um valor por 399 ou 400. Esta é uma das razões, se quisermos assumir que o mundo é simples, pelas quais grandes amostras acabam se aproximando da curva de Gauss (ver adiante), facilitando em muito a tarefa de se testar hipóteses.

SIMULAÇÃO DOS SALÁRIOS DE 5 MÉDICOS TRABALHANDO NUMA CLÍNICA PRIVADA SALÁRIO MÉDIA SALÁRIO - MÉDIA

1 40,0 40 - 2500 = - 2460 2 40,0 40 - 2500 = - 2460 3 450,0 450 - 2500 = - 24550 4 50,0 50 - 2500 = - 2450 5 123250,0 123250 - 2500 = 98250

TOTAL 1250,0 25.0,0 0

Medidas interpercentis, são de certo modo, conhecidas pelos clínicos, particularmente os pediatras.

Se dividirmos uma distribuição em 100 partes iguais, cada pedaço será um percentil. A mediana, por exemplo, é na verdade o percentil 50 (metade dos valores estão abaixo, enquanto que a outra acima da mediana). Analogamente, poderemos calcular o percentil 25 (25 % dos valores estarão abaixo dele), 75 (75 % dos valores estarão abaixo deste) etc. Uma das medidas interpercentis utilizadas é a diferença (ou amplitude) entre os percentis 25 e 75. Tal estatística nos fornece uma idéia da distribuição ao redor da mediana. SIMULAÇÃO DOS SALÁRIOS DE 5 MÉDICOS TRABALHANDO NUMA CLÍNICA PRIVADA

MÉDICO SALÁRIO - MÉDIA (SALÁRIO - MÉDIA)2 DESVIO PADRÃO

1 400 - 25000 = - 24600 605160000 2 400 - 25000 = - 24600 605160000 3 450 - 25000 = - 24550 602702500 4 500 - 25000 = - 24500 600250000 5 123250 - 25000 = 98250 9653062500

TOTAL 0 12066335000 54923,43

Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia

AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 31

Se uma distribuição for extremamente dispersa (gráfico I), isto é, se não existem valores extremos (para baixo ou para cima) isoladamente, e sim a ocupação de quase toda a escala de valores possíveis para aquela variável, esta amplitude interpercentil deverá ser grande. Por outro lado, quando os valores extremos forem fatos isolados, esta amplitude deverá ser pequena. Finalmente temos a amplitude que é calculada pela subtração do maior pelo menor valor encontrado. Esta última é claramente a mais instável das medidas de variação. Ela pode ser calculada (ou fornecida) para se ter uma rápida idéia da variabilidade dos dados.

Resumo O desvio padrão é de longe a mais utilizada das medidas de variabilidade. Ela sofre entretanto, se a distribuição tiver valores extremos (já que a média é incorporada em seu cálculo). Medidas de simetria

Distribuições podem ser “desviadas” para a direita, esquerda, ou ainda serem centradas ao redor da média. O gráfico IV (representação da tabela I) e V são exemplos de distribuições desviadas positiva e negativamente, enquanto o gráfico I representa uma distribuição razoavelmente centrada. Em tese, esta medida (skewness) deve se situar entre - 0,2 e + 0,2. Se levarmos em conta o seu cálculo (fórmula 3), vemos que os gráficos IV e V possuem suas médias diferindo da mediana em mais de 1 desvio padrão (DP).

(fórmula 3)

BASÓFILOS NA 1ª VISITA

LEUCÓCITOS NA 1ª VISITA

Statistic Statistic Statistic Statistic Statistic Statistic Std. Error

Valid MissingN

Mean Median Std. Deviation Skewness

Std. Dev = ,5

Mean = ,3 N = 374,0

BASÓFILOS NA 1ª VISITA en c y

Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia

AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 32

Principais estudos epidemiológicos

Estudos Seccionais

tanto os fatores de exposição quanto os que se denominam de “risco” são medidos simultaneamente

Os estudos seccionais estimam, para um dado momento (ou intervalo) no tempo, a proporção de pessoas contendo um determinado atributo (doença) e a proporção de pessoas contendo um ou mais fatores que se pretende correlacionar com a presença ou ausência do atributo (doença) em questão. Em resumo,

Exemplo I:

Digamos que um pesquisador queira estudar quais os principais fatores a serem associados com a hipertensão arterial. Sendo esta doença encontrada com relativa facilidade na população geral (prevalência alta) não seria complicado retirar uma amostra de uma população qualquer, examinando cada uma das pessoas no que se refere à pressão arterial, hábitos de consumo, stress, casos da doença na família etc.

Exemplo I:

Durante o período eleitoral, observamos a realização de predições sobre quem ganhará a eleição para diversos cargos do executivo e/ou legislativo. Semelhante ao exemplo anterior, um grupo de trabalho estabelece uma amostra da população geral, perguntando em quem o entrevistado votaria. Esta pergunta geralmente é acompanhada de um questionário estabelecendo o nível sócio-cultural do entrevistado.

Exemplo I:

A cada 10 anos, realiza-se um censo no Brasil (bem como em diversos países do mundo). Este censo consiste em uma série de perguntas sobre idade, sexo, renda etc. dos entrevistados. Acompanhando este, uma amostra dos entrevistados é traçada, onde perguntas adicionais são feitas (saúde, nutrição etc.).

Exemplo IV:

Uma amostra de trabalhadores de uma indústria é traçada para se estudar a presença ou ausência de doenças. Um médico (ou equipe) examina os trabalhadores solicitando ou não uma série de exames complementares, bem como setor da indústria de onde o trabalhador é oriundo.

Exemplo V:

Num hospital geral deseja-se estimar a proporção de infecções hospitalares (IH) a cada mês do ano.

Como o número de leitos é grande (cerca de 600), e a equipe da Comissão de Controle de Infeções Hospitalares (CCIH), relativamente reduzida, retiram-se amostras mensais destes pacientes, registrando dados acerca das IH, bem como setor do hospital, exposição a riscos de infeção, condição física do doente etc.

Alguns fatores são comuns a todos esses estudos. Em primeiro lugar, observamos que a variável tempo não está incluída em qualquer um deles, isto é, não estamos interessados em saber qual o tempo de exposição dos trabalhadores da fábrica aos fatores de risco em questão, ou por quanto tempo o consumo de sal existia antes da pressão arterial se elevar. Na verdade, sequer sabemos se o consumo de sal estava alto “causando” a hipertensão, ou se a hipertensão fez com que o doente aumentasse seu apetite por sal. Deste pequeno exemplo, podemos portanto entender quase todas as vantagens e desvantagens dos estudos seccionais (transversais), que nos ocuparemos a seguir. Em resumo, devemos nos ocupar da população em estudo (amostra, erros e vícios na seleção desta), instrumento utilizado na avaliação, aplicações deste método e conclusões possíveis de serem, obtidas. Os 2 primeiros itens descritos acima (amostra e avaliação) fazem parte de qualquer um dos estudos a serem discutidos neste texto.

Amostra

Digamos que você queira determinar quantos funcionários de uma fábrica apresentam hipertensão arterial. Ao final de seu estudo, digamos que você obtenha (examinando todos os funcionários) algo como 120 hipertensos numa população total de 1000 trabalhadores (que representa o universo, ou seja, todos os funcionários somam 1000 para a referida fábrica). Alguns dos examinados representam pessoas que sequer sabiam ser hipertensas (casos novos - vamos fingir, em nome da simplicidade, que estes funcionários não

Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia

(Parte 6 de 11)

Comentários