O desvio padrão da regressão, s

Interpretação dos Resultados dos Mínimos Quadrados Quanto mais próximos os pontos estão da linha prevista pela análise dos mínimos quadrados, menores são os resíduos. A soma dos quadrados dos resíduos, SS resid , é a medida da variação nos valores observados das variáveis dependentes valores de y, que não são explicados pela relação linear prevista entre x e y. SS resid 8-19 Também podemos definir a soma total dos quadrados, SS tot , como SS tot S yy 8-20 A soma total dos quadrados é a medida da variação total nos valores de y observados porque os desvios são medidos a partir do valor médio de y. Uma quantidade importante chamada coeficiente de correlação R 2 mede a fração da variação observada em y que é explicada pela relação linear e é fornecida por 8-21 Quanto mais próximo R 2 está da unidade, melhor o modelo linear explica as variações de y, como mostra- do na Figura 8-6. A diferença entre SS tot e SS resid é a soma dos quadrados devido à regressão, SS regr . Em contraste com SS resid , SS regr é uma medida da variação explicada. Podemos escrever, SS regr SS tot SS resid e R 2 SS regr SS tot R 2 1 SS resid SS tot © y i y 2 © y 2 i ©y i 2 N a N i1 [y i b mx i ] 2 A curva de calibração encontrada no Exemplo 8-4 foi utilizada para a determinação de isoctano em uma mistura de hidrocarbonetos. Uma área de pico de 2,65 foi obtida. Calcule a porcentagem molar de isoctano na mistura e o desvio padrão se a área foi a o resultado de uma única medida e b a média de quatro medidas. Em cada caso, a concentração desconhecida é encontrada a partir do rearranjo da equação dos mí- nimos quadrados para a linha, que fornece mol a Substituindo na Equação 8-18, obtemos: mol b Para a média de quatro medidas mol s c 0,1442 2,0925 C 1 4 1 5 2,65 12,515 2 2,0925 2 1,145 0,046 s c 0,1442 2,0925 C 1 1 1 5 2,65 12,515 2 2,0925 2 1,145 0,076 x y b m y 0,2567 2,0925 2,65 0,2567 2,0925 1,144 EXEMPLO 8-5 O coeficiente de correlação R 2 é uma medida da fração da variação total em y que pode ser explicada pela relação linear entre x e y. Dividindo-se a soma dos quadrados pelo número de graus de liberdade apropriado, podemos obter os valores médios da regressão e para os resíduos erros ao quadrado e então o valor de F. O valor de F fornece uma indicação da significância da regressão. É usado para testar a hipótese nula de que a variância total em y é igual a variância decorrente do erro. Um valor de F menor que o contido nas tabelas, a um dado nível de confiança, indica que a hipótese nula deve ser aceita e que a regressão não é significativa. Um valor grande de F indica que a hipótese nula deve ser rejeitada e que a regressão é significativa. Uma regressão significativa é aquela na qual a variação nos valores de y decorrente da relação linear prevista é grande comparada com aquela devido ao erro resíduos. Quando a regressão é significativa, ocorre um valor grande de F. Encontre o coeficiente de correlação para os dados cromatográficos do Exemplo 8-4. Para cada valor de x i , podemos encontrar um valor previsto de y i a partir da relação linear. Vamos denominar os valores previstos de y i de . Podemos escrever b + mx i e construir uma tabela com os valores de y i observados, os valores previstos, os resíduos, y i – , e os quadrados dos resíduos, y i – 2 . Somando os últimos valores obtemos SS resid , como mostrado na Tabela 8-2. Do Exemplo 8-4, o valor de SS yy 5,07748. Assim, Isso mostra que mais de 98 da variação nas áreas dos picos podem ser explicados pelo modelo linear. Também podemos calcular SS regr como SS regr SS tot SS resid 5,07748 0,06240 5,01508 R 2 1 SS resid SS tot 1 0,0624 5,07748 0,9877 ˆy i ˆy i ˆy i ˆy i ˆy i EXEMPLO 8-6 TABELA 8-2 Obtenção da Soma dos Quadrados dos Resíduos 0,352 1,09 0,99326 0,09674 0,00936 0,803 1,78 1,93698 0,15698 0,02464 1,08 2,60 2,51660 0,08340 0,00696 1,38 3,03 3,14435 0,11435 0,01308 3,91857 0,09143 5,365 12,51 0,06240 0,00836 4,01 1,75 y i yˆ i 2 y i yˆ i yˆ i y i x i Agora podemos calcular o valor de F. Cinco pares xy foram usados para a análise. A soma total dos quadrados tem quatro graus de liberdade associados a ela, uma vez que um deles é perdido no cálculo da média dos valores de y. A soma dos quadrados devido aos resíduos possui três graus de liberdade, porque dois parâmetros m e b são estimados. Além disso, SS regr tem apenas um grau de liberdade, pois corresponde à diferença entre SS tot e SS resid . Em nosso caso, podemos encontrar F de Esse valor de F bastante elevado tem uma pequena chance de ocorrer de forma aleatória, e assim con- cluímos que esta é uma regressão significativa. F SS regr 1 SS resid 3 5,015081 0,06243 241,11