■ MODELOS LINEARES

■ MODELOS LINEARES

y y = mx + b

Os métodos mais importantes para obter modelos lineares são baseados na seguinte idéia: dado qualquer modelo linear y = mx + b proposto, trace um segmento de reta vertical conectando cada ponto de dados (y i ,y i ) com a reta proposta e considere as diferenças y i − y (Figura 1.7.2).

Essas diferenças, denominadas resíduos, podem ser interpretadas como os “erros” que resultam

Resíduo

ao utilizar a reta para modelar os dados. Pontos acima da reta apresentam erros positivos, pontos

mx i +b

abaixo apresentam erros negativos e pontos na reta não têm erro.

Uma maneira de escolher um modelo linear é procurar aquela reta y = mx + b para a

qual a soma dos resíduos é nula, a justifi cativa sendo que assim os erros positivos e negati-

vos se cancelam. Contudo, não é difícil construir modelos em que esse procedimento produz

Figura 1.7.2

modelos inaceitavelmente pobres, de modo que, por razões que não podemos discutir aqui, o método mais comum de encontrar um modelo linear é procurar aquela reta y = mx + b para a qual a soma dos quadrados dos resíduos é a menor possível. Essa reta é denominada reta de

regressão ou reta de melhor ajuste de mínimos quadrados, ou simplesmente reta de míni-

mos quadrados.

É possível calcular uma reta de regressão mesmo nos casos em que os dados não pos-

A maioria das calculadoras gráfi cas,

suam um padrão linear aparente. Desse modo, é importante ter um método quantitativo para

dos sistemas computacionais simbó-

licos e dos programas de planilhas

determinar se um modelo linear é apropriado para os dados. A medida de linearidade de da-

fornece métodos para obter retas

dos mais comum é o coefi ciente de correlação, que, seguindo a tradição, é denotado por r.

de regressão. Para acompanhar os

Embora uma discussão detalhada de coefi cientes de correlação esteja além do alcance deste

exemplos desta seção será neces- sário que o leitor disponha de algum

livro, aqui temos alguns fatos básicos:

desses recursos computacionais.

• Os valores de r estão no intervalo −1 ≤ r ≤ 1, onde r tem o mesmo sinal da inclinação

da reta de regressão. • Se r é igual a 1 ou a −1, então os pontos de dados estão todos sobre uma reta, de

modo que um modelo linear é um ajuste perfeito para os dados. • Se r = 0, então os pontos de dados não exibem tendência linear alguma e um modelo

linear é inapropriado para os dados.

78 Cálculo

Quanto mais próximo r estiver de 1 ou de −1, mais próximos fi cam os pontos de dados da reta de regressão e mais apropriada é a reta de regressão como um modelo para esses dados. Quanto mais próximo r estiver de 0, mais dispersos estão os pontos de dados e menos apro- priada é a reta de regressão como um modelo para esses dados (Figura 1.7.3).

Enunciado de maneira menos precisa, podemos dizer que o valor de r 2 é uma medida

da percentagem dos pontos de dados que caem em uma “faixa linear mais estreita”. Assim, r = 0,5 signifi ca que 25% dos pontos de dados caem em uma faixa linear mais estreita e r = 0,9 signifi ca que 81% dos pontos caem em uma faixa linear mais estreita. (Uma explicação preci- sa do que signifi ca “faixa linear mais estreita” requer idéias da Estatística.)

T abela 1.7.1

䉴 Exemplo 1

A Tabela 1.7.1 fornece um conjunto de pontos de dados que relacionam a

TEMPERATURA PRESSÃO p

pressão p em atmosferas (atm) e a temperatura T (em °C) de uma quantidade fi xa de dióxido

T (°C) (atm)

de carbono em um cilindro fechado. O gráfi co associado na Figura 1.7.4a sugere que existe

uma relação linear entre a pressão e a temperatura.

(a) Use um recurso computacional para encontrar a reta de mínimos quadrados. Se o

recurso fornecer o coefi ciente de correlação, encontre-o.

(b) Use o modelo obtido em (a) para prever a pressão quando a temperatura for de

250 °C. (c) Use o modelo obtido em (a) para prever a temperatura na qual a pressão do gás

será nula.

Solução (a)

A reta de mínimos quadrados é dada por p = 0,00936T + 2,558 (Figura 1.7.4b)

com coefi ciente de correlação r = 0,998979. Solução (b) Se T = 250, então p = (0,00936)(250) + 2,558 = 4,898 (atm). Solução (c) Resolvendo a equação 0 = p = 0,00936T + 2,558, obtemos T ≈ −273,291ºC. 䉳

p (atm) 3,50

p (atm) 3,50

Pressão

Pressão

Temperatura (°C)

Temperatura (°C)

(a)

(b)

Figura 1.7.4

Capítulo 1 / Funções

Nem sempre é conveniente (ou necessário) obter uma reta de mínimos quadrados para criar um modelo de um fenômeno linear. Em alguns casos, são sufi cientes métodos mais ele- mentares. Aqui temos um exemplo.

䉴 Exemplo 2

A Figura 1.7.5a mostra um gráfi co de temperatura versus altitude transmi- tido pela nave espacial Magellan, quando entrou na atmosfera de Vênus em outubro de 1991. O gráfi co sugere fortemente que há uma relação linear entre temperatura e altitude para alti- tudes entre 35 e 60 km.

(a) Use o gráfi co transmitido pela Magellan para encontrar um modelo linear de tem- peratura versus altitude na atmosfera de Vênus que seja válido entre 35 e 60 km de altitude.

(b) Use o modelo obtido em (a) para estimar a temperatura na superfície de Vênus e discuta as hipóteses feitas para obter a estimativa.

Solução (a) Seja T a temperatura em kelvins e h a altitude em quilômetros. Vamos, primei- ro, estimar a inclinação m da parte linear do gráfi co, depois estimar as coordenadas de um

ponto (h 1 ,T 1 ) nos dados daquela parte e, então, usar a forma ponto-inclinação da reta T −T 1 = m(h −h 1 ) (2) O gráfi co passa aproximadamente pelo ponto (60, 250), assim vamos tomar h 1 ≈ 60 e T 1 ≈

250. Na Figura 1.7.5b, esboçamos uma reta que aproxima a parte linear dos dados. Usando a intersecção da reta com os lados da malha, estimamos a inclinação em

m≈ =− 48 = −8,125 K km /

Temperatura da atmosfera de Vênus Temperatura da atmosfera de Vênus 450

Órbita Magellan 3213

Órbita Magellan 3213 Data: 5 de outubro de 1991

Data: 5 de outubro de 1991 400

Latitude: 67N LTST: 22:05

Latitude: 67N LTST: 22:05

30 40 50 60 70 80 90 100 Altitude h (km)

Altitude h (km) Fonte: NASA

Fonte: NASA

(a) (b)

Figura 1.7.5

80 Cálculo

Substituindo nossas estimativas de h 1 ,T 1 e m em (2), obtemos a equação

No melhor dos casos, o método do

T − 250 = −8,125(h − 60)

Exemplo 2 é grosseiro, uma vez que

ou, de forma equivalente,

depende da obtenção de estimati- vas aproximadas de dados numéri-

T = −8,125h + 737,5

(3)

cos de um gráfi co. Mesmo assim, o resultado fi nal é muito bom, pois as

Solução (b)

A nave espacial Magellan interrompeu a transmissão de dados a uma altitu-

informações recentes da NASA dão

de de aproximadamente 35 km. Assim, não podemos estar certos de que o modelo linear se

a tempertaura na superfície de Vênus em cerca de 740 K (o sufi ciente para

aplique a altitudes mais baixas. Todavia, supondo que o modelo seja válido para altitudes

derreter chumbo).

mais baixas, podemos aproximar a temperatura na superfície de Vênus, fazendo h = 0 em (3). Obtemos T ≈ 737,5 K (464,32°C). 䉳