388 eng 09008 aula 02

388 eng 09008 aula 02

(Parte 1 de 2)

ENGENHARIA DA QUALIDADE A ENG 09008

AULA 2 REVISÃO DE ESTATÍSTICA

Introdução

Em um ambiente industrial, os dados devem formar a base para as decisões e ações.

Uma vez que os dados brutos tenham sido coletados, eles devem ser tabulados e convertidos em “informação” através do uso de métodos estatísticos.

2 Engenharia da Qualidade A Ano 2010/01

Coleta de dados

População: corresponde ao sistema ou ao todo que se quer descrever. É um conjunto de elementos com características comuns.

Censo: inspeciona todos os elementos de uma população.

Parâmetros: valor desconhecido associado a uma característica (média = µ, variância = 2)

Amostra: é uma parte representativa da população.

Estimador: função que estima o valor de um

(média =, variância = s2) x

Parâmetro baseando-se nas observações x s

Amostra (x1, x2,, xn)

Estimação

População

Inferência 3 Engenharia da Qualidade A Ano 2010/01

Estratificação de dados

Trabalha-se com dados classificados em agrupamentos (camadas ou estratos)

Tempo: os resultados são diferentes de manhã, à tarde ou a noite? Local: os resultados são diferentes nas linhas de produção?

Tipo: os resultados obtidos são diferentes entre os fornecedores?

Indivíduo: é possível comparar os operadores?

4 Engenharia da Qualidade A Ano 2010/01

Tipos de dados

Atributo

Atributos (características qualitativas) podem ser transformados em valores discretos

Dicotômico: aceitável ou não aceitável Conforme = 0, Não-conforme = 1

Classes: tipo de solvente, de fornecedor, operador

Operador1 = 1, Operador2 = 2, Operador3 = 3

Variáveis

Variáveis (características quantitativas) são dados contínuos: infinitos valores possíveis entre dois extremos Tempo (1h:35min),

Pressão (1.013,105 KPa) ,

Dimensão (16,54 m),

Temperatura (23,5°C)

5 Engenharia da Qualidade A Ano 2010/01

Análise de dados

1)Medidas de tendência central

2)Medidas de variabilidade

3)Histograma

4)Boxplot

5)Distribuição de probabilidade Normal 6)Gráfico de normalidade

6 Engenharia da Qualidade A Ano 2010/01

1) Medidas de tendência central

A tendência central é uma medida do centro de um conjunto de dados segundo uma regra estabelecida a priori (média aritmética, geométrica, harmônica, ponderada, etc.)

• Média aritmética • Mediana

• Moda

7 Engenharia da Qualidade A Ano 2010/01

1) Medidas de tendência central Média aritmética

Anotamos a temperatura de uma pessoa de 1 em 1 hora, durante 8 horas. Qual a média da temperatura?

O tamanho da amostra é n = 7 i xn

A média amostral é bom um estimador da média populacional . Quanto maior n melhor a estimativa.

8 Engenharia da Qualidade A Ano 2010/01

1) Medidas de tendência central Mediana

Grupo de dados ordenados separado ao meio Qual a mediana da temperatura?

Valores observados: 37, 37, 38, 39, 37, 39, 39ºC.

Valores ordenados: 37, 37, 37, 38, 39, 39, 39ºC

n = 7 é ímpar – mediana valor central parn ímparn x x x

9 Engenharia da Qualidade A Ano 2010/01

1) Medidas de tendência central

Moda: observação que ocorre com mais freqüência

Qual a moda da temperatura? Valores observados: 37, 37, 37, 38, 39, 39, 39ºC

Duas modas: 37 e 39ºC

10 Engenharia da Qualidade A Ano 2010/01

1) Medidas de tendência central Relação entre média e mediana → fornece a forma da dispersão

A Distribuição simétrica 10 12 14 16 18 14~ 14 x

B Distribuição assimétrica à direita 10 12 14 16 23 14~ 15 x

C Distribuição assimétrica à esquerda 05 12 14 16 18 14~ 13 x

Simétrica Forma de Sino

Assimétrica à Direita Assimetria Positiva

Assimétrica à Esquerda Assimetria Negativa

Mediana tem maior robustez a dados atípicos do que a média

1 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade

Observações individuais apresentam dispersão em torno do valor médio. Isto chama-se variabilidade dos dados

Amplitude

Quartil

Desvio-padrão

Coeficiente de Variação

12 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade

Amplitude: R = Xmax - Xmin

A amplitude é fácil de calcular e fornece uma idéia da magnitude da faixa de variação dos dados.

Não informa a respeito da dispersão dos valores que caem entre os dois extremos.

Quando n 10 pode resultar em uma medida de variação bastante satisfatória.

13 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade

Quartis

É qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população

1º quartil ou quartil inferior (Q1) = valor aos 25% da amostra ordenada

2º quartil ou mediana (Q2) = valor até ao qual se encontra 50% da amostra ordenada

3º quartil ou quartil superior (Q3) = valor a aos 75% da amostra ordenada

14 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade

Exemplo

Regra para descobrir os quartis

1)use a mediana para dividir os dados ordenados em duas metades, não inclua a mediana nas metades

2)o quartil inferior (ou superior) é a mediana da metade inferior (ou superior).

15 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade

Variância

Quadrado da distância de todos os valores xi em relação a sua média

Desvio-padrão

A raiz quadrada da variância (é expresso na unidade original dos dados) x N x N

16 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade

Nem sempre se conhece a variância e o desvio padrão populacional. Desta forma, deve-se usar um estimador a partir de uma amostra

amostral n x s alpopulacion N i i i i amostral n x s alpopulacion N i i i i

A correção de Bessel (eliminando 1 grau de liberdade para n < 20) torna a variância amostral um estimador da variância populacional não-viesado.

17 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade

A média é 14 cm, a variância e o desvio-padrão são:

A média e o desvio padrão possuem a mesma unidade de medida

Os desvios de cada valor em relação à média totalizam zero pois a média é o valor central

18 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade Coeficiente de variação

Um desvio padrão pode ser considerado grande ou pequeno dependendo da ordem de grandeza da média da variável.

Quanto menor o CV mais homogêneo é o conjunto de dados.

Medida adimensional, útil para comparar resultados de amostras cujas unidades podem ser diferentes.

s CV

19 Engenharia da Qualidade A Ano 2010/01

2) Medidas de variabilidade

Exemplo

Duas turmas de Eng. da Qualidade obtiveram as seguintes notas:

Turma B: Média = 50, Desvio Padrão = 5 Turma C: Média = 70, Desvio Padrão = 7

Qual das turmas é relativamente mais precisa?

CV C = (7 / 70)*100 = 10%

CV B = (5 / 50)*100 = 10% As duas turmas são igualmente precisas (homogênea).

20 Engenharia da Qualidade A Ano 2010/01

3) Histograma

O histograma é um gráfico de barras cujo eixo horizontal representa a variação total da característica de qualidade subdividida em vários intervalos.

Para cada um destes intervalos é construída uma barra vertical proporcional ao número de observações na amostra pertencente ao respectivo intervalo.

A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados .

21 Engenharia da Qualidade A Ano 2010/01

3) Histograma

Tipos de Histograma Forma de Sino Bi-modal

Truncado Assimétrico

2 Engenharia da Qualidade A Ano 2010/01

3) Histograma Comparação com as especificações

Processo A LIE LSE

Processo B

LIE LSE Processo D Processo C

LIE LSE 23 Engenharia da Qualidade A Ano 2010/01

3) Histograma

Estratificação

Muitas vezes identifica-se distribuições diferentes para níveis distintos dos fatores estratificados (mistura de populações quando se apresentam bimodais)

18 16 14 12 2 20 24 Engenharia da Qualidade A Ano 2010/01

3) Histograma Estratificação

Fornec. A

Fornec. B 25 Engenharia da Qualidade A Ano 2010/01

3) Histograma

Exemplo

A Tabela abaixo apresenta 50 observações de tempos de atendimento em minutos numa central telefônica (em ordem crescente).

26 Engenharia da Qualidade A Ano 2010/01

3) Histograma

Histograma de freqüências relativas.

Intervalos de classeFreqüência absolutaFreqüência relativa

Valor médio do

12 13 14 15 16 17 18 19 intervalo da classe

Histograma

F r e q ü ê n cia r e l a ti

27 Engenharia da Qualidade A Ano 2010/01

4) BoxPlot

Gráfico que apresenta a variabilidade de um conjunto de dados através de 6 medidas

Exemplo: 1, 2, 2, 3, 4, 5, 6

Valor máximo = 6

Q3 = 5 x bar = média = 3,3 Q2 = Mediana = 3

Valor mínimo = 1 Q1 = 2

28 Engenharia da Qualidade A Ano 2010/01

4) BoxPlot

Útil para comparar dispersão, tendência central e pontos extremos de diversas populações (processos) sem fazer suposição quanto a distribuição estatística. Também pode indicar assimetria.

a b C Q3 70 75 57

Mediana 40 45 50

Média 40 40 50

Min 10 15 18

a b c

Q3 Max Mediana Média Min Q1

29 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

Devido à variabilidade inerente do processo, as medidas individuais são diferentes, mas em grupo elas tendem a formar um padrão.

Quando o processo é estável, esse padrão pode ser descrito por uma distribuição de probabilidade.

30 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

Uma distribuição de probabilidade é um modelo matemático que relaciona um certo valor da variável em estudo com a sua probabilidade de ocorrência.

Há dois tipos de distribuição de probabilidade:

assumir certos valores, como por exemplo os valores inteiros: 0, 1, 2, etc

Distribuições Discretas: Quando a variável que está sendo medida só pode -> Distribuição Binomial, Poisson

Distribuições Contínuas: Quando a variável que está sendo medida é expressa em uma escala contínua, como no caso de uma característica dimensional. -> Distribuição Normal

31 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

Uma distribuição de probabilidade pode ser caracterizada por diversos parâmetros.

Os principais são:

Localização

Dispersão

Forma 32 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

Distribuição Normal dxeaFaxP

a zPaxPaxP 1

x a f(x)

a zPaxP

3 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

Função densidade de probabilidade normal acumulada para quatro diferentes conjuntos de parâmetros (μ,σ2)

A linha verde representa a distribuição normal padronizada (que está tabelada)

34 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

Transformação da variável x na variável padronizada z (onde as probabilidades estão tabeladas de -∞ até um determinado z que é função de a).

35 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

As áreas correspondentes as probabilidades da distribuição normal padrão estão tabeladas.

Probabilidade de ocorrência de valores abaixo de Z Probabilidades acumuladas de ocorrência de valores abaixo de Z0

Função acumulada de probabilidades

0,0 z0 = 1

Função densidade de probabilidades

F(z) f(z) z z

36 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades N ~ (0,12)

z = -2 z = -3 z = +3 z = +2 z = +1 z = -1

37 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

Exemplo

A força de tensão de sacos plásticos de supermercado é normalmente distribuída com média 40 lb/in2 com desvio padrão de

2 lb/in2. O comprador exige que os sacos tenham resistência de pelo menos 35 lb/in2.

Qual a probabilidade do produto atender a especificação? zPzPxP xPxP

Função no Excel DIST.NORMP( )

38 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades Exemplo

Distribuição para x (valores reais)Distribuição para Z (valores codificados)

Área de aceitação

39 Engenharia da Qualidade A Ano 2010/01

5) Distribuição de probabilidades

Da distribuição A para B muda a tendência central, mas a variabilidade é constante

ex: mesma máquina, produto diferente

Da distribuição A para C muda a variabilidade, mas a tendência central é constante

ex: mesmo produto, máquina diferente

Da distribuição B para C muda a tendência central e a variabilidade ex: produto diferente, máquina diferente

A distribuição Normal fica completamente caracterizada por dois parâmetros: a média e o desvio-padrão.

40 Engenharia da Qualidade A Ano 2010/01

6) Gráfico de normalidade

Muitos testes usados partem do princípio que os dados amostrados são provenientes de uma população normal

Contudo, pode-se testar se um conjunto de dados tem distribuição normal

Métodos quantitativos: Kolmogorov-Smirnov, Lilliefors e Shapiro- Wilks

Método qualitativo: gráfico de normalidade (Normal Probability Plot)

Caso a distribuição não seja normal, pode-se fazer a transformação Box-Cox (extrair raiz ou aplicar logarítmico em xj)

41 Engenharia da Qualidade A Ano 2010/01

6) Gráfico de normalidade

1 – Ordenar os pontos amostrados de forma crescente (xj)

2 – Calcular Zj amostral – eixo das ordenadas

3 – Calcular Zj teórico – eixo das abscissas 4 – Plotar Zj teórico versus amostral

zamostral j nj nj jnjpteórico n

Função no Excel INV.NORMP( )

Probabilidade teórica para a j-ésima ordenação n = número de elementos j = posição na ordenação

42 Engenharia da Qualidade A Ano 2010/01

6) Gráfico de normalidade

Zj a m o s t r a l

Zj teórico

9,125,48 sx Dados amostrais ordenados com

Se os pontos do gráfico apresentarem um padrão linear, então a distribuição normal é um bom modelo para este conjunto de dados.

43 Engenharia da Qualidade A Ano 2010/01

Tópicos próxima aula

Teorema do limite central Introdução ao Controle Estatístico de Processos

Próximas lâminas

Construção do histograma Boxplot no Excel

4 Engenharia da Qualidade A Ano 2010/01

Construção do histograma

Intervalos de classeFreqüência absoluta

Limite inferior da classe

Limite superior da classe

N observações na classe

Intervalo da classe

45 Engenharia da Qualidade AAno 2010/01

Construção do histograma

a) Determina-se o maior e menor valor do conjunto de dados;

Para o exemplo, Mín = 12,58 e Máx = 18,47 b) Define-se o limite inferior da primeira classe (LI), que deve ser ligeiramente inferior ao menor valor das observações

Para o exemplo, LI = 12,50 c) Define-se o limite superior da última classe (LS), que deve ligeiramente superior ao maior valor das observações;

Para o exemplo, LS = 18,50

46 Engenharia da Qualidade A Ano 2010/01

d) Define-se o número de classese que deve estar compreendido

Construção do histograma entre 5 a 20.

Para o exemplo,Por praticidade (para que a seja = 1), foi

escolhido K = 6.

e) Conhecido o número de classes define-se a amplitude de cada classe:
a = (LS - LI) / K;

Para o exemplo,

47 Engenharia da Qualidade A Ano 2010/01

Construção do histograma

cada classe

f) Conhecida a amplitude das classes, define-se os limites inferior e superior para

Para o exemplo, lim inf = 12,50 elim sup = 12,50 + 1 = 13,50

Para a 1° classe: lim. inf. = LI; lim. sup. = LI+ a; g) Calcula-se a freqüência de cada classe, ou seja, o número de observações pertencentes a cada classe, e completa-se a tabela de freqüência;

Para o exemplo, o número de observações pertencentes ao intervalo 12,50 a 13,50 é 3.

OBS: Use a função CONT.SE() para contar o número de observações Na tabela ao lado, se LI=24 e LS=3, então na coluna A, [24<x<3] = ?

3 35
4 40

A B C 1 25 LI 24 2 30 LS 3 48 Engenharia da Qualidade A Ano 2010/01

Construção do histograma HistogramaPolígono de Freqüência

Abscissa: valor médio da classe

49 Engenharia da Qualidade A Ano 2010/01

Boxplot no Excel

2003 •A ordem deve ser Q3, Max, Mediana, Média, Min, Q1

•Selecione todo o conjunto de dados

•Selecione Inserir Gráfico, tipo Linha com marcadores exibidos a cada valor de dado, clique Avançar

•Selecione Séries em Linha, selecione Concluir

•Selecione no gráfico uma série de dados, com o botão direito selecione Formatar Série de Dados

•Selecione a aba Padrões, na opção Linha selecione Nenhuma, repita o procedimento para as demais séries

•Selecione um dado e com botão direito selecione Formatar

Série de Dados, selecione a aba Opções, selecione Linhas max/min e Barras superiores/inferiores

2007 •A ordem deve ser Q3, Max, Mediana, Média, Min, Q1

•Selecione todo o conjunto de dados

(Parte 1 de 2)

Comentários