Estatistica Aplicada I

Estatistica Aplicada I

(Parte 1 de 5)

Estatística AplicadaEstatística Aplicada I

Universidade Federal do Pará Instituto de Tecnologia

Campus de Tucuruí –CTUC Curso de Engenharia Mecânica

Prof. Dr. Jorge Teófilo de Barros Lopes Capítulo ICapítulo I

Universidade Federal do Pará Instituto de Tecnologia

Estatística DescritivaEstatística Descritiva Campus de Tucuruí –CTUC

Curso de Engenharia MecânicaIntroduçãoConceitos e definiçõesClassificação dos dadosCaracterização e apresentação dos dadosEstatísticas amostraisOutras apresentações gráficas de dadosRegressão linear

I - Estatística Descritiva

I - Estatística DescritivaIntroduçãoConceitos e definiçõesClassificação dos dadosCaracterização e apresentação dos dadosEstatísticas amostraisOutras apresentações gráficas de dadosRegressão linear

1.1 Introdução

ESTATÍSTICA: É a disciplina que objetiva estudar os métodos científicos para a coleta, organização, resumo, apresentação e análise de dados, bem como obter conclusões válidas e tomar decisões razoáveis baseadas em tais análises.

Técnicas Estatísticas: São as várias técnicas por meio das quais é possível estudar conjuntos de dados e, a partir de uma amostra (se necessária), tirar conclusões válidas para conjuntos maiores (população).

1.1 Introdução

De uma maneira geral, as técnicas estatísticas são utilizadas em três etapas principais do trabalho de pesquisa:

1. A coleta de dados, incluindo o planejamento do trabalho e da pesquisa;

2. A apresentação dos dados coletados; e

3. A análise dos dados coletados, com a formulação de conclusões e generalizações.

1.1 Introdução

- Essa primeira etapa corresponde ao estabelecimento do método de coleta de dados (questionário ou teste ou ensaio de material) e elaboração dos questionamentos; determinação das variáveis que serão estudadas, de acordo com o interesse do pesquisador; e o cálculo do tamanho da amostra, de acordo com a natureza da pesquisa, do tempo e do orçamento disponíveis.

Coleta de dados 1.1 Introdução

- A segunda etapa requer técnicas específicas para a transformação dos dados numéricos em tabelas ou gráficos (é a partir da organização dos dados coletados que se poderá elaborar a interpretação).

Apresentação dos dados coletados

Análise dos dados coletados

- Essa etapa é simultânea à anterior, pois durante a própria organização dos dados já é possível ir percebendo a tendência geral da pesquisa.

1.1 Introdução

• No sentido de melhor esclarecer o significado da análise e interpretação dos dados, deve-se estabelecer uma distinção entre

Estatística Descritiva e Inferência Estatística.

1.1 Introdução

• Como o próprio nome sugere, constitui-se num conjunto de técnicas que objetivam descrever, analisar e interpretar os dados numéricos de uma população ou amostra.

Estatística Descritiva: Objetiva sintetizar e representar de uma forma compreensível a informação contida num conjunto de dados.

• Materializa-se na construção de tabelas e/ou gráficos ou no cálculo de medidas que representem convenientemente a informação contida nos dados.

• Adquire importância quando o volume de dados for significativo.

1.1 Introdução

•Objetivo mais ambicioso que o da estatística descritiva.

Inferência Estatística: Baseada na análise de um conjunto limitado de dados (uma amostra), objetiva caracterizar o todo a partir do qual tais dados foram obtidos (a população).

•Os métodos e técnicas utilizados são mais sofisticados.

1.1 Introdução

Figura 1.1-Diferença entre Estatística Descritiva e Inferência Estatística (Silva e Carvalho, 2006).

1.1 Introdução

Figura 1.2-Diferença entre Estatística Descritiva e Inferência

Estatística (Silva e Carvalho, 2006). I - Estatística DescritivaIntroduçãoConceitos e definiçõesClassificação dos dadosCaracterização e apresentação dos dadosEstatísticas amostraisOutras apresentações gráficas de dadosRegressão linear

1.2 Conceitos e Definições

População: É o conjunto de todos os elementos que contêm uma certa característica que se deseja estudar.

• Como é comum a todos os elementos, esta característica varia em quantidade ou qualidade.

•Uma população pode ter dimensão finita ou infinita.

Amostra: É um subconjunto de dados que pertencem à população. As amostras aleatórias são escolhidas por meio de processos (técnicas de amostragem) que garantem que o subconjunto obtido é representativo da população.

1.2 Conceitos e Definições

Principais motivos para o estudo da amostra: 1. População infinita;

2. Custo em termos de tempo ou de dinheiro que um estudo em toda a população implicaria;

3. Obtenção de informação por meio de testes destrutivos, no âmbito industrial;

4. Impossibilidade de acesso a todos os elementos da população.

1.2 Conceitos e Definições

Fases do método de análise estatística:

• No âmbito da Estatística, o método de abordagem dos problemas pode ser dividido em cinco fases:

1. Estabelecimento do objetivo da análise a efetuar (questões a serem resolvidas) e definição das populações correspondentes;

2. Concepção de um procedimento adequado para a seleção de uma ou mais amostras (escolha das técnicas de amostragem a utilizar).

3. Coleta de dados. 4. Análise dos dados (Estatística Descritiva).

5. Estabelecimento de inferências a respeito da população (Inferência Estatística)

1.2 Conceitos e Definições

Fases do método de análise estatística: Identificação do problema → Objetivo da análise

Planejamento da experiência → Técnicas de Amostragem Coleta de dados

Análise exploratória dos dados → Estatística Descritiva Análise e interpretação dos resultados → Inferência Estatística

I - Estatística DescritivaIntroduçãoConceitos e definiçõesClassificação dos dadosCaracterização e apresentação dos dadosEstatísticas amostraisOutras apresentações gráficas de dadosRegressão linear

1.3 Classificação dos Dados Iniciando o estudo:

• Isso é necessário, pois podem ocorrer registros que não se encaixam no padrão geral observado e, dessa forma, a sua veracidade deve ser averiguada, pois podem tratarse de erros de observação, bem como do próprio registro ou provenientes de alterações do fenômeno em estudo.

• Não existe uma estratégia única para iniciar o estudo descritivo, embora uma primeira recomendação seja começar por uma exploração visual dos dados levantados.

1.3 Classificação dos Dados Iniciando o estudo:

• Embora estas análises já se encontrem disponíveis em vários softwares e calculadoras programáveis, para uma melhor interpretação das mesmas é conveniente conhecer as técnicas utilizadas.

• Para se ter uma idéia mais concreta sobre os dados levantados, deve-se recorrer às tabelas e/ou gráficos que podem representar, de maneira sintética, as informações sobre o comportamento de variáveis numéricas levantadas.

1.3 Classificação dos Dados

Iniciando o estudo:

• Portanto, para se proceder um estudo descritivo, é importante:

- Ordenação dos dados – fase onde se começa a ter uma idéia a respeito de algumas medidas de posição (média, mediana, quartis etc.);

- Estatísticas amostrais – a partir de algumas medidas promove-se um resumo dos dados levantados, relativamente à posição, dispersão e forma;

- Agrupamento dos dados e representação gráfica – revela a forma possível para a população em estudo e permite escolher a classe de modelos que deve ser explorada nas análises mais sofisticadas.

1.3 Classificação dos Dados

Dados brutos: Como primeiro resultado de uma pesquisa, obtêm- se dados brutos, ou seja, um conjunto de números ainda sem organização alguma.

Rol: Os dados brutos são então ordenados de forma crescente ou decrescente, com a indicação da freqüência de cada um, dando origem ao chamado rol.

Tabulação dos dados: Depois de elaborar o rol é preciso determinar quantas faixas terá a tabela de freqüência. A fórmula de Sturges é utilizada para estabelecer o número aproximado de classes onde: n = número de elementos da amostra (tamanho da amostra) k = número de classes que a tabela de classes deverá contar.

1.3 Classificação dos Dados

• Observações: - k deverá ser no mínimo 3 e no máximo 20;

- Como a variável k é um número inteiro, ela deverá ser aproximada para o maior inteiro (por exemplo, se k ≈ 6,4, usa-se k = 7).

Freqüência de classes: O passo seguinte é subdividir os dados pelas classes ou categorias e determinar o número de indivíduos pertencentes a cada uma, resultando nas freqüências de classes.

Apresentação final dos dados (tabela completa): Com base em todos os cálculos feitos anteriormente, pode-se fazer uma nova tabela com todas as freqüências, as quais serão estudadas a posteriori.

Gráficos: A partir da tabela de freqüências, faz-se o desenho gráfico, um recurso de visualização dos dados constantes na tabela.

1.3 Classificação dos Dados

Os dados que constituem uma amostra podem ser de quatro tipos, assim distribuídos:

• Qualitativos - Nominal

-Ordinal

• Quantitativos - Intervalar

-Absoluto

1.3 Classificação dos Dados a) Dados nominais: Quando cada um deles for identificado pela atribuição de um nome que designa uma classe.

a) Exaustivas -qualquer dado pertence a uma das classes; b) Mutuamente exclusivas -cada dado pertence somente a uma classe; c) Não ordenáveis - não existe nenhum critério relevante que permita estabelecer preferência por qualquer classe em relação às restantes.

Neste caso, as classes devem ser:

- Exemplo: Classificação das pessoas pela cor do cabelo (preto, castanho, louro etc.).

1.3 Classificação dos Dados

- Exemplo: Classificação de conceitos de avaliação na disciplina em insuficiente, regular, bom e excelente.

b) Dados ordinais: São semelhantes aos dados nominais; contudo, nessa escala existe a possibilidade de se estabelecer uma ordenação dos dados nas classes, segundo algum critério relevante.

1.3 Classificação dos Dados

-Observação: Neste caso, pode-se atribuir um significado à diferença entre esses números, mas não à razão entre eles.

Por exemplo, o registro de temperaturas em ºC, em determinadas horas de dias sucessivos. Se em três dias consecutivos a temperatura atingir 5ºC, 10°C e 20ºC, não faz sentido dizer que o terceiro dia esteve duas vezes mais quente que o segundo, pois se a temperatura fosse expressa em outra escala, a razão entre os valores registrados naqueles dias seria diferente.

c) Dados intervalares: No caso da escala intervalar, os dados são diferenciados e ordenados por números expressos em uma ordem cuja origem é arbitrária.

1.3 Classificação dos Dados d) Dados absolutos: Contrariamente ao que sucede com a escala intervalar, a escala absoluta tem origem fixa (nesta escala, o valor zero tem significado).

• Escala intervalar: temperatura de 0ºC não significa que não haja temperatura.

• Escala absoluta: peso de 0 kg significa que não existe peso.

• Em conseqüência ao fato da origem ser fixa, a razão entre os dados expressos numa escala absoluta passa a ter significado; uma pessoa com 60 kg tem o dobro do peso de uma com 30 kg.

-Exemplo: Pesos de pessoas expressos em kg. - Observações:

1.3 Classificação dos Dados

- Observação: Quando se trabalha com dados quantitativos, é necessário que se faça a distinção entre os dados discretos e os contínuos.

Os dados denominam-se discretos quando são valores de uma variável aleatória discreta, que é a aquela que assume valores em pontos da reta real (por exemplo, número de páginas em um livro: 1, 2, 3, 4, 5...).

Os dados são contínuos quando são valores de uma variável aleatória contínua, que é aquela que pode assumir qualquer valor em certo intervalo da reta real (por exemplo, o peso de funcionários de uma fábrica: 60,5 kg; 60,52 kg; ...)

1.3 Classificação dos Dados

Arredondamento de dados: O arredondamento de um dado estatístico deve obedecer as seguintes regras.

0,0a 0,4999... são simplesmente eliminadas, arredondadas para

1. Arredondamento por falta: Quando o primeiro dígito, aquele situado mais à esquerda entre os que irão ser eliminados, for igual ou menor que quatro, não deverá ser alterado o dígito remanescente (ou seja, frações de baixo).

Exemplos: 3, 49 ≈ 3;2,43 ≈ 2,4; 1,734999 ≈ 1,73

Número a arredondarArredondamento paraNúmero arredondado 12,489 Inteiros 12 12,733 Décimos 12,7 12,92 Centésimos 12,9

1.3 Classificação dos Dados

frações maiores de 0,500até 0,9... são eliminadas, mas o algarismo a

2. Arredondamento por excesso: Quando o primeiro dígito após aquele que será arredondado for maior ou igual a cinco seguido por dígitos maiores que zero, o digito remanescente será acrescido de uma unidade (ou seja, ser arredondado aumenta 1 unidade, arredondadas para cima).

Exemplos: 3,688≈ 3,69; 5,6501≈ 5,7

Número a arredondarArredondamento paraNúmero arredondado 15,504 Inteiros 16 15,561 Décimos 15,6 15,578 Centésimos 15,58

1.3 Classificação dos Dados

3. Arredondamento de dígitos seguidos do cinco: Quando o dígito situado mais à esquerda dos que serão eliminados for um cinco ou um cinco seguido somente de zeros, o último dígito remanescente, se for par, não se alterará, e se for impar será aumentado de uma unidade (ou seja, se a fração a ser eliminada é exatamente 0,50000..., então o algarismo a ser arredondado, só aumentará de 1 unidade caso torne-se um algarismo par).

Exemplos: 3,5≈ 4; 6,5≈ 6; 5,6500≈ 5,6; 5,700≈ 5,8; 9,475≈ 9,48; 3,325≈ 3,32

Número a arredondarArredondamento paraNúmero arredondado 215,500 Inteiro 216 216,500 Inteiro 216 216,750 Décimos 216,8 216,705 Centésimos 216,70

1.3 Classificação dos Dados

1. Nunca se deve fazer arredondamentos sucessivos.

2. Se for necessário um novo arredondamento, recomenda-se o retorno aos dados originais.

- Observações:

1.3 Classificação dos Dados Algarismos significativos

Números Notação científica Algarismos significativos

3,2 x 10 1,5 x 10 8,3400 x 10 3,205 x 10 3,2 x 10 3,200 x 10

Os algarismos significativos de um número são os dígitos diferentes de zero, contados a partir da esquerda até o último dígito diferente de zero à direita, caso não haja vírgula decimal, ou até o último dígito (zero ou não) caso haja uma vírgula decimal. Exemplos:

1.3 Classificação dos Dados

Algarismos significativos:

•Todos os dígitos diferentes de zero são significativos. Exemplos: 7,3; 32 e 210 possuem 2 algarismos significativos.

•Os zeros entre dígitos diferentes de zero são significativos Exemplos: 303 e 1,03 possuem 3 algarismos significativos.

•Se existir uma vírgula decimal, todos os zeros à direita da vírgula decimal são significativos Exemplos: 1,0 e 3,30 possuem 4 algarismos significativos.

1.3 Classificação dos Dados

Algarismos significativos:

• Valores medidos ou calculados: o número de algarismos significativos de uma grandeza medida ou um valor calculado é uma indicação da incerteza, ou seja, quanto mais algarismos significativos, menor a incerteza no valor.

Exemplo: O valor de uma grandeza medida com 3 algarismos significativos, indica que o valor do 3º algarismo tem uma incerteza menor ± 0,5ºC. Caso seja apresentada uma temperatura como 32ºC (2 significativos), está indicado que a temperatura está entre 31,5 e 32,5ºC. Caso ela seja apresentada como 32,5ºC (3 significativos), está indicado que a temperatura está entre 32,45 e 32,55ºC.

1.3 Classificação dos Dados

Algarismos significativos:

• Números inteiros que são resultados experimentais, seguem as regras anteriores. Exemplo: a pressão em uma caldeira é 6 atm, possui 1 algarismo significativo.

Exemplo: 5 dias = 5,0dias.

• Números inteiros que descrevem o número de objetos discretos possuem precisão mínima.

• Números inteiros que são parte de uma expressão física possuem precisão infinita. Exemplo: o 2 na equação do perímetro do círculo 2piR, possui uma precisão infinita uma vez que por definição o diâmetro é 2 vezes o raio.

(Parte 1 de 5)

Comentários