Correlação e regressão linear

Correlação e regressão linear

(Parte 1 de 2)

UNIVERSIDADE FEDERAL DA BAHIA

INSTITUTO DE MATEMÁTICA

CORRELAÇÃO E REGRESSÃO ESTATÍSTICA

Salvador

Maio – 2009

ÁRTANO SILVA DOS SANTOS

ESPÁRTANO SILVA DOS SANTOS

CORRELAÇÃO E REGRESSÃO ESTATÍSTICA

Trabalho apresentado ao Professor Jader Cedraz da Disciplina Métodos Estatísticos – MAT 236, da turma T-09, do curso de engenharia Civil, turno vespertino.

Universidade Federal da Bahia

Salvador – 30/05/2009

SUMÁRIO

1 - INTRODUÇÃO............................................................................................................4

2 – CORRELAÇÃO ESTATÍSTICA.................................................................................4

2.1 – TIPOS DE CORRELAÇÃO......................................................................................4

2.2 – DIAGRAMA DE DISPERSÃO................................................................................5

2.3 - COEFICIENTE DE CORRELAÇÃO........................................................................5

2.3.1- COEFICIENTE DE E CORRELAÇÃO LINEAR.................................................5

2.4 – EXERCICÍO RESOLVIDO......................................................................................5

3 - REGRESSÃO ESTATÍSTICA....................................................................................7

3.1 - EQUAÇÃO DE REGRESSÃO .................................................................................7

3.2 - EXERCÍCIOS RESOLVIDOS..................................................................................8

4 - CONCLUSÃO..............................................................................................................9

5 - REFERÊNCIAS BIBLIOGRÁFICAS........................................................................10

1. INTRODUÇÃO

Antes de conceituarmos correlação e regressão estatística deve-se saber porque usá-la.

No estudo de inferência, estuda-se casos com 1 variável e 2 populações. No estudo de Correlação e Regressão Estatísticas dever-se levar em conta 2 variáveis e 1 população. Exemplo: Peso e Comprimento (2variaveis) das baleias (1 população). Dentre esse estudo teremos a correlação e a regressão estatística, cujo principal objetivo é estudar a relação entres essas variáveis. Esse estudo pode ser investigando presença e/ou ausência dessa relação, que pode ser :

1) Quantificando a força dessa relação: correlação

2) Explicitando a forma dessa relação: regressão

2. CORRELAÇÃO ESTATÍSTICA

A correlação é a medida padronizada da relação entre duas variáveis indica a força e a direção do relacionamento linear entre duas variáveis aleatórias.

  • A correlação nunca pode ser maior do que 1 ou menor do que menos 1.

  • Uma correlação próxima a zero indica que as duas variáveis não estão relacionadas.

  • Uma correlação positiva indica que as duas variáveis movem juntas, e a relação é forte quanto mais a correlação se aproxima 1.

  • Uma correlação negativa indica que as duas variáveis movem-se em direções opostas,

  • A relação fica mais forte quanto mais próxima a correlação de -1.

  • Duas variáveis que estão perfeitamente correlacionadas positivamente (r=1) movem-se essencialmente em perfeita proporção na mesma direção,

  • Dois conjuntos que estão perfeitamente correlacionados negativamente movem-se em perfeita proporção em direções opostas.

A relação entre as variáveis é evidenciada pela formação de um padrão no diagrama de Dispersão

2.1 TIPOS DE CORRELAÇÃO

A correlação entre 02 variáveis pode ser:

1. Correlação Positiva : O aumento de uma variável corresponde, ao aumento da outra.

2. Correlação Negativa: O aumento de uma variável corresponde a diminuição da outra.

3. Correlação Linear: Quando é possível ajustar uma reta, ode ser forte (quanto mais próximas da reta) ou fraca (quanto mais próximas da reta).

4. Correlação não-linear: Quando não é possível ajustar uma reta.

2.2 DIAGRAMA DE DISPERSÃO

O diagrama de dispersão é um gráfico onde pontos no espaço cartesiano XY são usados para representar simultaneamente os valores de duas variáveis quantitativas medidas em cada elemento do conjunto de dados. Ele é muito útil para comparar dados, como antes e depois. De acordo com a correlação das variáveis o diagrama pode ser:

2.3 COEFICIENTE DE CORRELAÇÃO

Coeficiente de correlação indica a força e a direção do relacionamento linear entre as duas variáveis a ser estudada, sendo denotada por r. Vários coeficientes são utilizados para situações diferentes, tais como o coeficiente de correlação de Pearson e o coeficiente Linear.

2.3.1COEFICIENTE DE CORRELAÇÃO LINEAR

Esse coeficiente serve para detectar padrões de lineares. (não vale para os padrões não lineares).

  • O valor de r estar sempre entre 1 e -1, ou seja 1 r 1

  • Se r está próximo de 1, há uma forte correlação positiva.

  • Se r está próximo a –1, há uma forte correlação negativa.

  • Se r está próximo de 0, não há correlação linear.

2.4 EXERCICIOS RESOLVIDOS

1º) A tabela abaixo mostra o resultado de uma pesquisa com 10 famílias de determinada região.

Famílias

Renda (R$)

Poupança (R$)

Nº de Filhos

Média de Anos de Estudo da família

A

10

4

8

3

B

15

7

6

4

C

12

5

5

5

D

70

20

1

12

E

80

20

2

16

F

100

30

2

18

G

20

8

3

8

H

30

8

2

8

I

10

3

6

4

J

60

15

1

8

a) Calcular ao coeficiente de correlação Linear entre a renda familiar e a poupança.

Solução:

RENDA (Y)

POUPANÇA (X)

X2

Y2

XY

10

4

16

100

40

15

7

79

225

105

12

5

25

144

60

70

20

400

4.900

1.400

80

20

400

6.400

1.600

100

30

900

10.000

3.000

20

8

64

400

160

30

8

64

900

240

10

3

9

100

30

60

15

225

3.600

900

y =407

x =120

x2=2.152

y2=26.769

xy=7.535

Aplicando na Fórmula :

r = (10 x 7.535 )– (120 x 407 = 0,9835

√(10x2.152) – 1202 √10x26.769 -4072

Existe uma forte correlação linear entre renda e a poupança familiar.

O sinal do coeficiente mostra que as duas variáveis variam no mesmo sentido.

b) Calcular o coeficiente de correlação linear entre renda e números de filhos para as dez famílias.

Solução:

Renda (y)

N° de filhos (x)

X 2

Y 2

XY

10

8

64

100

80

15

6

36

225

90

12

5

25

144

60

70

1

1

4.900

70

80

2

4

6.400

160

100

2

4

10.000

200

20

3

9

400

60

30

2

4

900

60

10

6

36

100

60

60

1

1

3.600

60

407

36

184

26.769

900

y = 407

x = 36

x2 =184

y2 = 26.769

xy = 900

Aplicando a fórmula obtemos:

r = (10 x 900)– (36 x 407) = - 0,758

(Parte 1 de 2)

Comentários