Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Estatística: Instrumento Útil para Descrição e Análise de Dados, Notas de estudo de Odontologia

Esta documentação apresenta a importância da estatística para pesquisadores e clínicos, descrevendo suas finalidades, como simplificar a descrição de dados, estimar dados populacionais e obter inferências a partir de amostras. O texto aborda conceitos básicos, como amostras, análise estatística descritiva, escalas de medida e análise gráfica. Um exemplo é fornecido para ilustrar a aplicabilidade da estatística em avaliação de professores.

Tipologia: Notas de estudo

2011

Compartilhado em 22/01/2011

Jorginho86
Jorginho86 🇧🇷

4.7

(93)

409 documentos

1 / 10

Documentos relacionados


Pré-visualização parcial do texto

Baixe Estatística: Instrumento Útil para Descrição e Análise de Dados e outras Notas de estudo em PDF para Odontologia, somente na Docsity! 13 ELEMENTOS BÁSICOS ~ DA ESTATISTICA APLICADA Edmir Matson Introdução A estatística é um instrumento muito útil, tanto para o pesquisador como para o clínico, pois tem como finalidade propiciar a descri- ção de dados da forma mais simples, estimar os dados da população ou, mesmo, obter infe- rências a partir de dados amostrais. A estatística é dividida em dois tópicos bastante definidos: a estatística descritiva e a inferência estatística. A estatística descritiva, como o próprio nome indica, apresenta a amostra de forma simples, permitindo ao pesquisador ou ao clí- nico tomar conhecimento dos dados. Este contato propicia uma visão ampla do proble- ma, permitindo uma observação dado a dado ou, mesmo, a análise de um dado em relação aos demais. A inferência estatística procura conside- rar generalizações a partir de um conjunto incompleto de informações. É tida, por mui- os, como a parte mais importante da estatís- tica. Entretanto, para se conseguir um perfei- '0 entendimento dos fenômenos, é sempre necessária a participação tanto da estatística de critiva como da inferência estatística. Quando nos defrontamos com um conjunto de dados, inicialmente aplicamos a análise estatística descritiva através de tabelas ou outro método descritivo. Após este procedi- mento, vamos aplicar métodos para se con- seguirem inferências que nos propiciem ob- ter conclusões. A parte da estatística denominada inferên- cia apresenta dois tópicos bastante importan- tes: a estimação de parâmetros e os testes de hipóteses. Cada uma destas partes serão apre- > sentadas adiante. > Estatística Descritiva Como vimos anteriormente, a estatística descritiva tem como finalidade mostrar os dados, ordenando-os e sumariando-os sem a preocupação de obterem-se quaisquer infe- rências. Assim, os dados são tabelados confor- me parâmetros pré-estabelecidos e perfeita- mente definidos. A forma de apresentação pode ser com tabelas, quadros ou mesmo dia- gramas gráficos. Para que possamos entender um fenôme- no, será necessário, em princípio, analisar descritivamente, todos os fatos relacionados com o mesmo. Na prática, isto nem sempre é possível, daí criarmos situações que nos per- mitarn analisar, com determinada margem de erro, o fenômeno pesquisado. Conseqüen- temente, torna-se importante fixar algumas definições. . Denominamos "população", ao conjunto total de' fenômenos que ocorrem ou são pas- síveis de ocorrer, e que possuem determina- da característica. Um exemplo de "popula- ção", seriam todos os indivíduos brasileiros, do sexo masculino, e que apresentassem oclusão normal. Analisando este exemplo, vemos que se trata de todos os indivíduos que apresentam como característica definida, serem brasileiros, do sexo masculino e com oclusão normal. Nesta população encon- tram-se negros, brancos, pardos, amarelos etc., sem haver preocupação com a idade nem com a procedência. Apesar de terem sido definidas algumas características, o nú- mero de indivíduos nesta população é muito grande, de sorte que seria praticamente im- possível estudá-los na sua totalidade. Para contornar-se esta dificuldade, consi- dera-se um conjunto parcial destes fenôme- nos. Este conjunto denomina-se "amostra". Se a população fosse constituída de todos os in- divíduos brasileiros, do sexo masculino, e com oclusão normal, para que pudéssemos estudá-los deveríamos tomar uma amostra de tamanho definido, com um número passível de ser conseguido e analisado. Por exemplo: seriam separados apenas 250 indivíduos com estas características, que seriam estudados, o que permitiria que se fizessem inferências para toda a população. Torna-se evidente que este mecanismo ocasionará um erro que deve- rá ser previsto e aceito. Dentro das diferentes modalidades de amostras possíveis, temos um tipo importante denominado "amostra casual". Neste caso, seus componentes tiveram a mesma oportuni- dade de serem escolhidos, ou seja, o pesquisa- dor separou os indivíduos dentro da popula- ção, de forma aleatória. Níveis de Mensuração No nosso dia a dia, estamos acostumados, frequentemente, a medir os objetos ou ações, através de números. A altura de uma pessoa é mostrada por meio de uma medida, normal- mente, na escala métrica. Um conjunto de al- turas de determinadas pessoas poderá ser manipulado conseguindo-se determinados dados importantes para avaliação de uma po- pulação. Esta manipulação torna-se bastante fácil quando utilizamos números, como no caso presente. Entretanto, nem sempre podemos medir objetos ou ações, usando-se números. A com- paração que permita identificar o melhor pro- fessor que ministra aulas de graduação, so- mente pode ser medida através de relações como: a aula do professor X é melhor que a aula do professor Y.Imaginando esta situação para uma escola, que é um conjunto de pro- fessores, teremos uma dificuldade bastante grande na manipulação dos dados para se conseguir uma avaliação da atuação dos pro- fessores da referida escola. Quando estamos frente a uma amostra ou conjunto de dados, a fase inicial de sua análi- se é classificá-lo de acordo com determinado critério, que está intimamente relacionado com o tipo de mensuração ou nível de medi- da desses dados. Os níveis de medida ou es- cala, podem ser: escala nominal, escala ordi- nal, escala de intervalos e escala razão. Escala Nominal A escala nominal ocorre quando os dados podem ser distribuídos por categorias estan- ques. Números ou outros símbolos são utili- zados para classificá-los. Exemplos de escala nominal ocorrem com dados sobre sexo, reli- gião, raça etc. Assim, os indivíduos que no caso presente são os dados, somente podem ser classificados como do sexo masculino ou do sexo feminino, da raça branca, da raça ne- gra, da raça amarela etc. Neste caso, estamos utilizando símbolos para determinar os da- dos. No caso de uma equipe de futebol, os números das camisas dos jogadores estão co- locados em uma escala nominal. O ponta di- reita, apesar de possuir o número sete, não é melhor jogador que o lateral esquerdo que , possui o número três. Por outro lado, pode- mos dizer que entre todos os jogadores de número sete (ponta direita), de todas as equi- pes que participaram de determinado campe- onato, apenas um marcou determinado nú- mero de gols. Escala Ordinal Na escala ordinal, os dados de uma cate- goria não são apenas diferentes dos dados de outra categoria, mas, também, guardam en- tre si uma determinada relação. Na hierar- Medidas de Tendência Central Os pesquisadores, e mesmo os leigos, pro- curam encontrar um número que represente o meio ou típico de um conjunto de dados. Esta procura leva as pessoas a determinadas medi- das denominadas de tendência central. Na prática, as mais utilizadas são: a moda, a me- diana e a média aritmética. oda Examinando um conjunto de dados, aqueles que ocorrem com maior freqüência exprimem a medida de tendência central denominada "moda". O termo moda é mui- to utilizado pelo leigo, quando diz ser de- terminada cor de vestimenta, a mais utiliza- da, ou a cor da moda. Se o resultado de uma pesquisa mostrar números como: 2, 4, 2,7,4,4,6, 1, 4 e 6, dizemos que 4 é a moda, pois, aparece cm maior freqüência. Pode- mos encontrar conjuntos de dados que apresentem duas ou mais modas. Um con- junto de dados com: 2~4, 2, 7, 4, 4, 2, 1, 4 e 2 terá duas modas, o número 4 e o número 2, pois, são as que se apresentam com maior freqüência. No caso anterior, temos uma distribuição unimo dal, e neste caso, uma distribuição bimodal. A moda apresenta o nível de mensuração nominal, ordinal ou intervalar. ediana Para definir-se a mediana é necessário co- locar os dados em ordem de tamanho, creS- cente ou decrescente, e verificar qual é o que se encontra no centro. Em oútras palavras, a mediana é a medida de tendência central onde os dados são distribuídos em parcelas iguais. Num conjunto de dados como: 40, 35, 37,42,34, 38 e 43, inicialmente, colocamos em crescente, isto é, 34, 35, 37, 38, 40, 42 e 43, e, em seguida, escolhemos o número. central que, no caso, é 38. Quando o número de da- dos for ímpar, teremos apenas uma mediana; entretanto, no caso de um número par, tere- mos duas medianas. A mediana apresenta o nível de mensura- ção ordinal ou intervalar. Média Aritmética Quando estamos frente a um conjunto de dados, freqüentemente, lançamos mão da "média", para termos um parâmetro de medi- da. Esta prática é muito comum entre os pes- quisadores e mesmo entre as pessoas em ge- ral. Na verdade, estamos encontrando um número que defina uma posição central dos dados. Se uma pessoa fuma 10 cigarros na se- gunda-feira, 8 cigarros na terça-feira, 12 cigar- ros na quarta-feira e 10 cigarros na quinta- feira, podemos verificar que o ponto médio de cigarros fumados nestes 4 dias foram 10 cigarros. Neste caso, a média está mostrando um ponto médio bastante característico. Como vimos anteriormente, a medida de tendência central denominada média é muito utilizada, tendo características próprias que definem com alguma exatidão, a amostra. Po- rém, ela apresenta alguma dificuldade de in- terpretação, pois, a presença de um dado dis- crepante poderá influenciá-Ia de forma signi- ficativa. A média aritmética apresenta, no mínimo, a escala intervalar de mensuração. Medidas de Variabilidade O maior problema da utilização de medi- das de tendência central reside em ter-se de encontrar um ponto médio, com um único número. Freqüentemente, este número utili- zado de forma única não representa bem o conjunto de dados. Vamos voltar ao nosso exemplo do fumante. Uma pessoa fuma 10 ci- garros na segunda-feira, 8 cigarros na terça- feira, 12 cigarros na quarta-feira e 10 cigarros na quinta-feira. Podemos verificar que o pon- to médio de cigarros fumados nestes 4 dias, foram 10 cigarros. Neste caso, a média está mostrando um ponto médio bastante caracte- rístico. Se, entretanto, um outro indivíduo fu- mar 5 cigarros na segunda-feira, 6 cigarros na terça-feira, 5 cigarros na quarta-feira, e na quinta-feira, 20 cigarros, pois, - participou de uma reunião bastante tensa -, o ponto médio de cigarros fumados é de 9, o que não demonstra a mesma exatidão do caso anteri- or. Vemos, com absoluta nitidez, que no se- gundo caso temos uma maior dispersão dos valores em torno da média. Esta dispersão ou variabilidade deverá ser medida para que possamos ter maiores informações sobre o conjunto de dados. Veremos, em seguida, al- gumas destas medidas de dispersão, como a "amplitude total", o "desvio médio" e o "des- vio padrão". Amplitude Total Se tomarmos, no exemplo dos fumantes, os valores extremos de ambas as amostras, percebemos que no primeiro caso os valores são 8 e 10 cigarros, e estão bastante próximos do valor da média, mostrando que o conjunto de dados estão, também, muito próximos da média. No caso seguinte, os valores extremos são 5 e 20 cigarros, bem distantes do valor da média. Podemos perceber nitidamente, que o valor extremo maior está muito longe do va- lor da média, possibilitando analisar com maior credibilidade os dados obtidos. A am- plitude total é a diferença entre o maior e o menor valor do conjunto de dados. Compa- rando dois conjuntos de dados, podemos di- zer que o de maior variabilidade é aquele que apresenta maior amplitude total. Desvio Médio A amplitude total, empregando os dois números extremos, mostra o quanto estão se- parados da média, portanto, mede a variabili- dade apenas com dois elementos. Se desejar- mos medir a variabilidade com todos os ele- mentos, podemos lançar mão do desvio médio. O desvio médio é a soma de todas as discrepâncias ao redor da média, dividida pelo número de elementos. Se somarmos as discrepâncias levando em consideração o si- nal, a tendência é elas se anularem. Assim, empregamos apenas os valores absolutos des- sas discrepâncias. Desvio Padrão Uma outra forma de se medir a variabili- dade de uma amostra é através do desvio pa- drão. Neste caso, ao invés de se tomar a soma dos valores absolutos das discrepâncias ao re- dor da média, efetuamos a soma dos quadra- dos das discrepâncias ao redor da média, e também dividimos pelo número de elemen- tos.Desta forma, podemos eliminar os núme- ros negativos com maior facilidade. Como elevamos ao quadrado todas as discrepâncias, para eliminar os sinais negativos, devemos, agora, extrair a raiz quadrada deste número final, para termos o desvio padrão. Curva Normal Se pudéssemos medir a altura de todos os indivíduos de uma nação hipotética, iríamos encontrar que a maioria deles estaria ao redor de 1,70m. Talvez, entre 1,60m e 1,80m. Pare- ce-nos óbvio que encontraríamos indivíduos com 1,05 m, bem como encontraríamos com 2,10m; entretanto, seriam em número bastan- te reduzido. A partir destes dados, vamos construir um gráfico onde colocamos a altura dos indivíduos no eixo horizontal, e o número de ocorrências ou freqüência, no eixo vertical, conforme a figura 13.3. O gráfico obtido na análise da freqüência das alturas dos indivíduos tem a forma de um sino, e é denominado de "curva normal". A curva normal tem algumas característi- cas importantes, sendo uma delas, a simetria. O ponto mais alto da curva encontra-se no centro e, coincidentemente, mostra a freqüên- cia média das ocorrências. O lado direito e o lado esquerdo são perfeitamente idênticos, mostrando que as freqüências acima e abaixo da freqüência média, são iguais. Uma grande maioria dos fenômenos obe- dece a uma curva normal. Entretanto, existem sempre excessões. Um exemplo típico de fe- nômeno que não obedece a uma curva nor- mal é a distribuição de renda, no mundo. Sa- bemos que existe um grande número de pes- soas com uma renda muito baixa, e um pe- queno número, com renda muito alta. Se colo- carmos esta ocorrência em um gráfico, vere- mos que o ponto mais alto da curva estará deslocado para a região das pessoas com ren- da mais baixa, alterando a forma da curva, conforme vemos na figura 13.4. Voltandoà curva normal, podemos entender que, sob a curva e a linha horizontal encontra- mos todos os dados coletados,ou seja,encontra- mos 100%dos dados coletados.Vamos agora, 1,20 1,40 1,801,60 2,00 Fig. 13.4 - Distribuição das freqüências encontra- para as alturas de indivíduos de uma nação Iripotética. preocupar em limitar determinadas áreas a curva normal. Tomamosuma reta que pas- sa pelo centro da curva normal, coincidentecom freqüência média, e uma outra que passa pelo correspondente a um desvio padrão, aci- da média. Pode-se provar,matematicamente, a área desta limitação corresponde a 34,13% área total. Se a reta da direita passar pelo nú- mero correspondente a 2 desvios padrão, tere- uma área correspondente a 47,72%dos indi- estudados. Para 3 desvios padrão, tere- uma área de 49,87%.Estesfatos são constan- para qualquer população que obedeça a uma curva normal, pois, estão relacionados com a ca- racteristicade simetria da curva normal. Baseados no exposto acima, podemos tam- entender que a área sob a curva normal, -1 desvio padrão e +1 desvio padrão, corresponde a 68,26%da área total; que entre -_ e =«: corresponde a 95,44% da área total e entre -3 e +3 corresponde í1 99,74%. . ~ da Estatística Freqüentemente estamos preocupados com ocorre numa determinada população. En- emos por população, o conjunto total de - , uos. Assim, se quisermos estudar a posi- da cúspide mésio-vestibular do primeiro superior, em relação ao primeiro molar milE'rií))"" nos indivíduos brasileiros, devemos es- todos os brasileiros. Este estudo se toma pclticamente impossível, pois, devemos estudar 20 15 10 5 o $400 $1400 $2200 Fig. 13.5 - Distribuição das freqüências encontra- das para a distribuição de renda, no mundo. todos os brasileiros, desde aquele que mora no campo como o que mora na cidade. Para contornarmos as dificuldades ineren- tes a um tipo de estudo como este, lançamos mão de amostras. Amostra é um conjunto de indivíduos retirados de uma população. Este processo de amostragem já faz parte do dia a dia das pessoas, pois, sempre estamos reali- zando amostragem. A partir dos dados obti- dos de uma amostra, podemos tirar conclu- sões, com determinada quantidade de. erro, do que ocorre na população. Este erro pode ser esperado e perfeitamente controlado. Ao conseguir-se uma amostra ou processo de amostragem, o pesquisador procura um grupo de indivíduos que represente perfeita- mente bem, a população, e que exiba um nú- mero também bastante representativo. Outro parâmetro importante é escolher os indivíduos de forma casual, permitindo a todos a mesma oportunidade de pertencer à amostra; assim, temos uma amostra denominada "casual". Intervalo de Confiança Por melhor que tenha sido escolhida a amostra, sempre devemos esperar determina- das diferenças entre os parâmetros da amos- tra e os parârnetros da população. Por exem- plo, a média da amostra nunca será exata- mente igual à média da população, o mesmo acontecendo com o desvio padrão da amostra e o desvio padrão da população. Estas dife-
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved