Método de regressão linear

Método de regressão linear

1 VI – MÉTODO DE REGRESSÃO LINEAR

VI.1 EQUAÇÃO DE RETA Toda reta pode ser definida a partir de dois pontos. A equação que define uma reta a partir de dois pontos é dada por: y = Ax + B onde: A e B são constantes; x = variável do eixo horizontal (ordenadas) y = variável do eixo vertical (abcissas)

y2

y1 A

{ b

x1x2 x

Figura 1 Equação de reta

Como A e B são constantes, podemos escrever:

Resolvendo o sistema de duas equações e duas incógnitas acima temos:

Na equação de retay = Ax + B,

A é o coeficiente angular da reta, ou seja, sua inclinação; quando x=0, o valor B é onde a reta cruza o eixo y.

Se tivermos pontos obtidos através de medidas, podemos encontrar uma reta que passa por dois destes pontos. Exemplo: Foi medida a temperatura de um objeto ao longo do tempo:

Os dados foram colocados no gráfico
entre os valores é aparentemente
para estabelecer a equação de reta, ou
do objeto e o tempo

ao lado. Como notamos que a relação linear, podemos escolher dois pontos seja, qual a relação entre a temperatura Neste caso o eixo x é o eixo dos tempos

e o y da Temperatura

2 Figura 2

Para determinar os valores de A e B, escolhemos dois pontos obtidos, por ex. as medidas feitas á 1 hora e 4 horas (35 e 65 graus):

4 – 13
4 – 13 3

A equação que relaciona a temperatura do objeto com o tempo resulta:

Através desta relação, podemos estimar o valor da temperatura para outros pontos, sem precisar realizar mais medidas. Qual seria temperatura nos seguintes tempos:

tempo [h] 00,5 1 2 3 3,5 4 4,5 5 5,5 6 6,5
Temp [oC]

Podemos notar que existem diferenças entre alguns valores medidos e os calculados (como no caso de 2h, 3h e 5h).

Se para o cálculo dos coeficientes A e B, tivéssemos tomado os pontos 3h e 5 h, a equação de reta seria:

Neste exemplo, com apenas 5 medidas, podemos determinar várias equações de reta. Na prática, quando temos muitos pontos medidos, devido às dificuldades de leitura, erros e desvios, as equações possíveis podem ser muitas, ficando difícil decidir qual a que mais se aproxima do fenômeno físico. Na prática, a equação de reta somente nos indica a tendência do comportamento físico do experimento, pois nunca temos certeza se os pontos escolhidos para determiná-la são os melhores.

VI.2 REGRESSÃO LINEAR Às vezes, trabalhamos com experimentos com muitas variáveis, sujeitos a diversos erros de medida.

No gráfico abaixo, são mostrados os pontos obtidos de uma dada experiência. Estimamos que o comportamento físico do fenômeno é linear. Porém, como determinar, qual equação matemática, que melhor representa este fenômeno?. (Vale observar, que este fenômeno pode ser físico ou estatístico, como por exemplo tendências de mercado, produtividade de máquinas e pessoas, etc...)

Figura 3 Dados de um experimento

Para determinar a equação de reta que melhor representa o comportamento deste fenômeno, utilizamos uma análise matemática chamada REGRESSÃO LINEAR. Obteremos uma curva aproximadora, significando uma média ponderada dos pontos obtidos experimentalmente.

A reta a ser determinada, é da mesma forma que a determinada através de dois pontos, ou seja: y = Ax + B o que muda é a forma de cálculo das constantes A e B. Na regressão linear, todos os pontos disponíveis são utilizados para o cálculo destas constantes, e não apenas dois como na equação de reta descrita anteriormente.

Os coeficientes A e B são dados por:

A n x y x y

B y x x xy

Onde: n é o número de medidas

Σ x.y é a somatória das medidas x vezes as medidas y Σ x é a soma de todas as medidas x Σ y é a soma de todas as medidas y Σ x2 é a soma do quadrado de todas as medidas x (Σ x)2 é a soma de todas as medidas x elevada ao quadrado

Exemplo: Obtenção da melhor reta para os dados da medida de temperatura. Os dados obtidos da experiência foram:

tempo [horas] 1 2 3 4 5 Temperatura [Graus Celsius] 35 46 54 65 76

Com estes dados, montamos a tabela I:

x (tempo) y (temperatura)x.y x2
Σx = 1 + 2+ 3 +4 +5 = 15Σy = 35 + 46 + 54 + 65 + 76 = 276
Σ x.y = 35 + 92 + 162 + 260 + 380 = 929Σx2
= 225n = 5 ( 5 medidas)

A n x y x y

B y x x xy

A equação que melhor representa a leitura da temperatura em função do tempo é: T = 10,1 t + 24,9

Temperatura medida 35 46 54 65 76

A soma dos desvios é igual a zero. Ou seja, a reta obtida por regressão linear, passa eqüidistante aos pontos obtidos experimentalmente.

VI.3 COEFICIENTE DE CORRELAÇÃO LINEAR ( r ) É um número adimensional (não tem unidade) que mostra a colinearidade entre os dados.

Quando r = 1, os pontos representam uma reta perfeita Quando r = 0 , os pontos não tem nenhuma relação entre si.

Qaunto maior o coeficiente de correlação r, mais confiável será a aproximação do fenômeno estudado pela equação de reta y = Ax + B.

O coeficiente de correlação linear é dado pela fórmula:

yxyxn r

No exemplo acima:

Como já sabíamos, os dados têm uma colinearidade bastante grande, quase perfeita, o que significa que a aproximação por uma reta é válida.

Quando o coeficiente de correlação linear é muito baixo, próximo de zero, podemos usar outras formas de equação para explicar o fenômeno estudado.

Podemos utilizar a aproximação por uma curva do tipo: y = Cx2 + Dx + E Neste caso, a curva de aproximação seria uma parábola, como indicado na figura 4.

Figura 4 Dados de um experimento – Aproximação por uma parábola

Existem outras formas de aproximação, por exemplo log y = Ax + B. A melhor aproximação é aquela onde o coeficiente de correlação é mais próximo de 1. Estas tentativas são feitas usando softwares, como o Excel e outros.

Bibliogafia:

Probabilidade e Estatística Murray R. Spiegel Coleção Shaun Ed McGraw-Hill,1977

8 Exercícios:

1- Determine a equação e trace a reta para os valores:

2- Na tabela abaixo é dada a distância percorrida (s) por um veículo em função do tempo: (Como estamos relacionando velocidade en função do tempo, o tempo é o eixo x) a) Calcule a equação da reta b) Qual a unidade do coeficiente a? c) Qual a unidade do coeficiente b? d) O tempo começou a ser marcado a partir de quantos Km percorridos? e) Qual a velocidade do veículo?

3 Determine a equação e obtenha o valor do resistor R através da reta abaixo.. (Lembre-se que R = V/I ou seja 1/A )

3- Utilizando a tabela abaixo :

a) Marque os pontos experimentais num gráfico. b) Calcule a equação da reta utilizando dois pontos quaisquer. Trace esta reta num gráfico. c) Calcule a equação de reta por regressão linear .Trace esta reta num gráfico. d) Calcule os desvios. Confira se a soma dos desvios é igual a zero. e) Qual equação representa melhor os dados experimentais? f) Qual a unidade do coeficiente A? g) Qual a unidade do coeficiente B? h) Estes dados são referentes a uma medida de tensão sobre um resistor em série com uma fonte DC. Como seria este circuito?

9 4) A tabela abaixo mostra a idade X e a pressão sistólica para um grupo de 12 mulheres.

a) Supondo que a relação pode ser linear (como no gráfico abaixo), determine a equação de reta utilizando o método de regressão linear. b) Qual a pressão estimada de uma mulher de 45 anos? c) Determine o coeficiente de correlação linear. Justifique se a aproximação dos dados através de uma relação linear é confiável.

função da quantidade de peças produzida (P)
C= -4 P + 380eq1

5) A partir de um estudo, obtivemos uma série de resultados que relacionam o custo de uma peça em Reais (C) em Num cálculo rápido, utilizando o método de dois pontos, obtivemos a equação:

C = -6,8 P + 340eq 2

Num cálculo com mais tempo, utilizando regressão linear, chegamos à equação:

Obs: A quantidade máxima de peças que pode ser produzida é de 30 peças.

a) (0,5)Qual o custo estimado para a produção de 15 peças pela equação 1? b) (0,5)Qual o custo estimado para a produção de 15 peças pela equação 2? c) (0,5)Qual dos custos calculados é mais confiável? Justifique a resposta. d) (1,0) Esboce as duas curvas num mesmo gráfico. Indique a mais confiável. e) (0,5) Um dos valores da equação por regressão, representa os custos fixos, aqueles relacionados a aluguel, salários, etc. Qual o valor do custo fixo? Justifique.

pressão x Idade

P r e s s ã o

Comentários