Determinar a hipótese alternativa, H

No teste para viés, não sabemos inicialmente se a diferença entre a média experimental e o valor aceito é devido a erros aleatórios ou a um erro sistemático real. O teste t é usado para determinar a significância da diferença. O Exemplo 7-5 ilustra o uso do teste t para determinar se existe uma tendência no método. Um novo procedimento para a determinação rápida da porcentagem de enxofre em querosene foi tes- tado em uma amostra cujo teor de S era de 0,123 m 0,123, determinado pela forma da sua preparação. Os resultados foram de S 0,112; 0,118; 0,115 e 0,119. Os dados indicam que existe um viés no método em um nível de confiança de 95? A hipótese nula é H : m 0,123 de S e a hipótese alternativa é H a : m 0,123 de S. O teste estatístico agora pode ser calculado como Da Tabela 7-3, verificamos que o valor crítico de t para 3 graus de liberdade e nível de confiança de 95 é de 3,18. Dado que t 3,18, concluímos que existe uma diferença significativa em um nível de 95 de confiança e que existe um viés no método. Observe que se fizermos o teste para um nível de confiança de 99, t crít 5,84 ver Tabela 7-3. Uma vez que 5,84 4,375, poderíamos aceitar a hi- pótese nula, em um nível de confiança de 99, e concluir que não há diferença significativa entre os valores experimental e aceito. Note que nesse caso a resposta depende do nível de confiança que está sen- do usado. Como veremos, a escolha do nível de confiança depende de nosso desejo em aceitar um erro na resposta. O nível de significância 0,05 ou 0,01 representa a probabilidade de se ter um erro pela rejeição da hipótese nula ver Seção 7B-3. t x m s 2N 0,116 0,123 0,032 24 4,375 s C 0,053854 0,464 2 4 4 1 C 0,000030 3 0,0032 S ©x 2 i 0,012544 0,013924 0,013225 0,014161 0,053854 x 0,4644 0,116 S ©x i 0,112 0,118 0,115 0,119 0,464 EXEMPLO 7-5 A probabilidade de uma diferença tão grande ocorrer devido apenas a erros aleatórios pode ser obtida pela função DISTTx;graus_liberdade;caudas do Excel, em que x é o valor do teste t 4,375, o valor graus_ liberdade é igual a 3, para nosso caso, e caudas 2. O resultado DISTT4,375;3;2 5 0,022. Assim sendo, é apenas 2,2 provável ter um valor tão grande devido a erros aleatórios. O valor crítico de t para um dado nível de confiança pode ser obtido no Excel, a partir da função INV.QUIprobabilidade; graus_liberdade. Em nosso caso, INV.QUI0,05;3 3,1825. Se fosse confirmado, por experimentos posteriores, que o método sempre fornece resultados baixos, poderíamos dizer que o método apresenta um viés negativo. 7B-2 Comparação de Duas Médias Experimentais Freqüentemente, os químicos precisam avaliar se uma diferença nas médias de dois conjuntos de dados é verdadeira ou se é o resultado de erros aleatórios. Em alguns casos, os resultados de análises químicas são usados para determinar se dois materiais são idênticos. Em outros, os resultados são usados para estabele- cer se dois métodos analíticos fornecem os mesmos valores ou se dois analistas que utilizam o mesmo método obtêm as mesmas médias. Uma extensão desses procedimentos pode ser empregada para analisar dados pareados. Muitas vezes os dados são coletados aos pares para eliminar uma fonte de variabilidade, observando-se as diferenças existentes em cada par. O Teste t para Diferenças nas Médias No caso de um grande número de medidas em ambos os conjuntos, o teste z, discutido na seção anterior, pode ser modificado para levar em conta uma comparação de dois conjuntos de dados. Mais freqüente- mente, ambos os conjuntos contêm apenas poucos resultados e precisamos empregar o teste t. Para ilus- trar, vamos considerar que N 1 réplicas de análises desenvolvidas pelo analista 1 forneceram um valor médio 1 e que N 2 análises feitas pelo analista 2 pelo mesmo método forneceram o valor médio . A hipótese nula declara que as duas médias são idênticas e que qualquer diferença é o resultado de erros aleatórios. Assim, podemos escrever H : m 1 m 2 . Com mais freqüência, quando se testam as diferenças entre médias de resultados, a hipótese alternativa é H a : m 1 m 2 , e o teste é de duas caudas. Em algumas situações, contudo, poderíamos testar H a : m 1 m 2 , ou H a : m 1 m 2 e usar um teste do tipo de uma cauda. Nesse caso, vamos considerar que o teste de duas caudas seja empregado. Se os dados foram coletados da mesma maneira e os analistas foram ambos cuidadosos, seria seguro na maioria das vezes considerar que os desvios padrão de ambos os conjuntos sejam similares. Assim, ambos os s 1 e s 2 são estimativas do desvio padrão da população s. Para se ter uma estimativa melhor de s que aquela dada por s 1 e s 2 sozinhos, usamos o desvio padrão combinado ver Seção 6B-4. Da Equação 6-6, o desvio padrão da média do analista 1 é dado por . A variância da média para o analista 1 é Da mesma forma, a variância da média para o analista 2 é No teste t, estamos interessados na diferença entre as médias, ou seja, . A variância da diferença entre as médias é dada por O desvio padrão da diferença entre as médias pode ser encontrado extraindo-se a raiz quadrada, após a substituição dos valores de e anteriores. Se agora fizermos uma consideração posterior de que o desvio padrão combinado s comb é uma estimativa melhor de s que s m1 ou s m2 , podemos escrever O teste estatístico t então é determinado por 7-7 t x 1 x 2 s comb C N 1 N 2 N 1 N 2 s d 2N C s 2 comb N 1 s 2 comb N 2 s comb C N 1 N 2 N 1 N 2 s d 2N C s 2 1 N 1 s 2 2 N 2 s 2 m2 s 2 m1 s 2 d s 2 m1 s 2 m2 s 2 d x 1 x 2 s 2 m2 s 2 2 N 2 s 2 m1 s 2 1 N 1 s m1 s 1 2N 1 x 2 x O teste estatístico é então comparado com o valor crítico de t obtido a partir da tabela, para o nível de con- fiança específico desejado. O número de graus de liberdade para se encontrar o valor crítico de t na Tabela 7-3 é N 1 N 2 2. Se o valor absoluto do teste estatístico for menor que o valor crítico, a hipótese nula é aceita e não há diferença significativa entre as médias. Um valor de t maior que o valor crítico indica a existência de uma diferença significativa entre as médias. O Exemplo 7-6 ilustra o uso do teste t para deter- minar se dois barris de vinho são oriundos de diferentes fontes. Dois barris de vinho foram analisados quanto ao seu teor de álcool para se determinar se eles eram provenientes de fontes distintas. Com base em seis análises, o teor médio do primeiro barril foi esta- belecido como 12,61 de etanol. Quatro análises do segundo barril forneceram uma média de 12,53 de álcool. As dez análises geraram um desvio padrão combinado s comb de 0,070. Os dados indicam uma diferença entre os vinhos? A hipótese nula é H : m 1 m 2 ; e a hipótese alternativa, H a : m 1 m 2 . Nesse caso, empregamos a Equação 7-7 para calcular o teste estatístico t. O valor crítico de t para 10 2 8 graus de liberdade, em um nível de confiança de 95, é 2,31. Como 1,771 2,31, aceitamos a hipótese nula em um nível de confiança de 95 e concluímos que não há diferença no teor de álcool dos vinhos. A probabilidade de se ter um valor de t de 1,771 pode ser calculada usando a função DISTT do Excel e é DISTT1,771,8,2 0,11. Dessa forma, exis- tem mais de 10 de chance de que poderíamos ter um erro dessa dimensão devido a um erro aleatório. t x 1 x 2 s comb C N 1 N 2 N 1 N 2 12,61 12,53 0,07 C 6 4 6 4 1,771 EXEMPLO 7-6 No Exemplo 7-5 nenhuma diferença significativa entre os dois vinhos foi detectada ao nível de probabilidade de 95. Essa afirmativa equivale a dizer que m 1 é igual a m 2 com um certo grau de con- fiança. Os testes não provam, contudo, que os vinhos são provenientes da mesma fonte. Mais do que isso, é concebível que um vinho seja tinto e o outro, branco. Estabelecer com uma pro- babilidade razoável que os dois vinhos são provenientes da mesma fonte requer testes extensivos de ou- tras características, tais como sabor, odor, cor e índice de refração, assim como o teor de ácido tartárico, açúcar e o teor de elementos traço. Se as diferenças significativas não forem reveladas por todos esses testes e outros mais, então pode ser possível julgar que os dois vinhos possuem uma origem comum. Em contraste, a obtenção de uma diferença significativa em qualquer dos testes poderia mostrar claramente que os vinhos são diferentes. Assim, a determinação de uma diferença significativa por um único teste é muito mais reveladora que o estabelecimento da ausência de diferença. Se existem boas razões para se acreditar que os desvios padrão de dois conjuntos de dados diferem, o teste t para duas amostras precisa ser empregado. 2 Entretanto, o nível de significância para esse teste t é apenas aproximado e o número de graus de liberdade é mais difícil de ser calculado. 2 Para mais informações, ver J. L. Devore e N. R. Farnum, Applied Statistics for Engineers and Scientists. Pacific Grove, CA: Duxbury Press at BrooksCole Publishing Co., 1999, p. 340-344.