Conceitos de testes de hipótese

Testes de hipótese

É comum que queiramos saber o quanto uma amostra corrobora uma hipótese científica. Neste caso, podemos aplicar um teste de hipótese, isto é, um procedimento que decidirá se a hipótese é ou não rejeitada diante da amostra obtida.

Por exemplo, considere que X1,,Xn são observações independentes realizadas com uma régua ao medir um determinado objeto. Suponha que XiN(μ,σ02), onde σ02 é conhecido e indica precisão das medidas feitas com a régua. Uma pessoa poderia estar interessada na hipótese de que o objeto tem 15 cm. Formalmente, chamamos esta hipótese de hipótese nula e a representamos por H0:μ=15. Gostaríamos de saber se é possível rejeitar H0 com base nos dados.

Tipos de erro

Existem 4 possíveis resultados que podem decorrer de um teste de hipótese. Note que o teste de hipótese pode rejeitar ou não rejeitar a hipótese nula e, também, esta hipótese pode ser verdadeira ou falsa. Assim, existem 4 combinações de resultados possíveis:

  • (Acerto) A hipótese nula é verdadeira e não é rejeitada.
  • (Acerto) A hipótese nula é falsa e é rejeitada.
  • (Erro tipo I) A hipótese nula é verdadeira e é rejeitada.
  • (Erro tipo II) A hipótese nula é falsa e não é rejeitada.

Estas combinações podem ser representadas na seguinte tabela:

H é verdadeira H é falsa

Note que existe um balanço entre os erros tipo I e II. Por exemplo, se quiséssemos que a probabilidade de cometer um erro tipo I fosse 0, então poderíamos nunca rejeitar H. Contudo, neste caso, a probabilidade de cometer um erro tipo II seria 1. Analogamente, se sempre rejeitarmos H, então as probabilidades de erro tipo I e II serão, respectivamente, 1 e 0. Na prática, rejeitamos H0 quando os dados oferecem evidência contrária a este hipótese. Assim, buscamos que as probabilidades de cometer um erro tipo I ou um erro tipo II sejam baixas.

Uma outra observação importante é que, em geral, não sabemos se cometemos um erro em um teste de hipótese. Para saber se H0 é verdadeiro ou não, seria necessária observar a população. Como apenas somos capazes de observar a amostra, não somos capazes de determinar se H0 é verdadeiro ou não. Assim, não sabemos se o resultado do teste de hipótese foi um acerto ou um erro.

Apesar da limitação acima, podemos controlar as probabilidades de erro tipo I e II de um teste. Isto é, podemos desenvolver testes que, antes de observar o banco de dados, tenham uma baixa probabilidade de cometer um erro.

Convecionou-se que a hipótese nula deve ser escolhida de tal forma que o erro tipo I seja mais grave que o erro tipo II. Por exemplo, é mais grave concluir que um rio não está poluído quando ele está poluído do que concluir que ele está poluído quando de fato não está. Assim, neste caso, tomaríamos a hipótese nula como aquela de que o rio está poluído, pois assim o erro tipo I seria o de rejeitar que o rio está poluído quando ele de fato está.

Como o erro tipo I é o mais grave, construímos testes de hipótese que diretamente controlam a probabilidade de erro tipo I. Formalmente, determinaremos testes de hipótese tais que o erro tipo I seja menor que um valor pré-determinado, α. É comum que α seja chamado de nível de significância do teste.

Exemplo: normal com variância conhecida

Considere que X1,,Xn são observações independentes e tais que XiN(μ,σ02), onde σ02 é conhecido. Por exemplo, Xi pode ser o peso da i-ésima vaca alimentada com uma determinada ração. Deseja-se provar que o peso médio de vacas alimentadas com esta ração é maior do que 500kg, ou seja, a hipótese nula é H0:μ500.

Para capturar o quanta a evidência os dados trazem contra H0, podemos calcular o quanto a média amostral supera o valor de μ0, isto é, X¯μ0. Gostaríamos de rejeitar a hipótese nula quando X¯ é muito maior que μ0, isto é, X¯μ0>c, onde c é escolhido de forma a controlar o erro tipo I. A seguir, veremos como realizar este controle.

O erro tipo I é a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. Isto é, para obter o erro tipo I, queremos calcular P(X¯μ0>c) sob H0. Especificamente, gostaríamos que P(X¯μ0>c)α sob H0. Para realizar esta desigualdade, note que decorre das propriedades da distribuição normal que, sob o valor extremo o extremo da hipótese nula (μ=μ0), temos que X¯μ0N(0,σ02n). Assim, utilizando a padronização da distribuição normal, obtemos que se μ=500, Z:=X¯μ0σ02nN(0,1) Portanto, P(X¯μ0>c)=P(X¯μ0σ02n>ncσ0)=P(Z>ncσ0)=1P(Zncσ0)=1pnorm(ncσ0) Para controlar o erro tipo I, desejamos que sob H0, P(X¯μ0>c)=α. Utilizamos as equações acima, obtemos α=1pnorm(ncσ0)1α=pnorm(ncσ0)qnorm(1α)=qnorm(pnorm(ncσ0))qnorm(1α)=ncσ0qnorm(1α)σ0n=c Assim, para controlar o erro tipo I em α, rejeitamos a a hipótese nula H0:μμ0 quando X¯μ0>qnorm(1α)σ0n.

Por exemplo, considere que observamos 9 vacas alimentadas com a ração de interesse. Sabemos que o desvio padrão nos pesos destas vacas é de 50kg e, portanto, o peso de cada vaca é XiN(μ,502). O peso médio destas foi de 530. Se desejamos testar a hipótese H0:μ500 a um nível de α=5%, podemos realizar os cálculos no R da seguinte forma:

mu0 = 500
n = 9
sigma0 = 50
media = 530
alpha = 0.05
qnorm(1-alpha)
## [1] 1.644854
c = qnorm(1-alpha) * sigma0 / sqrt(n)
c
## [1] 27.41423
media - mu0 > c
## [1] TRUE

Como a média amostral supera c a um nível de 0.05, rejeitamos a hipótese nula. Note que, se exercemos um maior controle sobre o erro tipo I, então não rejeitaremos a hipótese nula. Por exemplo, se tomássemos α=0.01, então o teste de hipótese seria mais conservador e não rejeitaríamos a hipótese nula.

alpha = 0.01
qnorm(1-alpha)
## [1] 2.326348
c = qnorm(1-alpha) * sigma0 / sqrt(n)
c
## [1] 38.77246
media - mu0  > c
## [1] FALSE

p-valor

Na amostra estudada no exemplo anterior, verificamos que se fixássemos α=0.05, então o teste rejeitaria a hipótese nula. Por outro lado, se fixássemos α=0.01, o teste não rejeitaria a hipótese nula. Isto ocorre pois quanto menor o valor de α, mais o teste fica conservador em rejeitar H0. Decorre deste comportamento que, enquanto que para valores “grandes” de α, o teste rejeitará H0, para valores “pequenos” de α o teste não rejeitará H0.

Um valor de interesse é o menor α tal que o teste rejeita H0 para a amostra observada. Este α é comumente chamado de p-valor. Este valor pode ser muito útil para compartilhar resultados. Note que, para a amostra observada, se um pesquisador fixar um α>α, então ele rejeitará H0. Por outro lado, se ele fixar α<α, então não rejeitará H0. Assim, somente comparando o p-valor com o α fixado, é possível saber o resultado do teste. Portanto, mesmo pesquisadores fixando níveis de significância diferentes podem saber o resultado do teste de hipótese apenas observando o p-valor.

p-valor na normal com variância conhecida

No exemplo do teste de hipótese para a média da normal com variância conhecida, lembre que H0:μμ0 é rejeitado para todos os valores de α tais que:

X¯μ0>qnorm(1α)σ0n Portanto, o menor valor de α tal que H0 é rejeitado, α é tal que X¯μ0=qnorm(1α)σ0n Com algumas manipulações aritméticas podemos determinar o valor de α, isto é, o p-valor: X¯μ0=qnorm(1α)σ0nn(X¯μ0)σ0=qnorm(1α)pnorm(n(X¯μ0)σ0)=pnorm(qnorm(1α))pnorm(n(X¯μ0)σ0)=1α1pnorm(n(X¯μ0)σ0)=α Portanto, o p-valor neste caso é o α tal que α=1pnorm(n(X¯μ0)σ0)

Exercícios

  1. Descreva em suas próprias palavras: teste de hipótese, erro tipo I, erro tipo II, nível de significância e p-valor.

  2. Um cientista mede um objeto 9 vezes com um paquímetro e observa os valores em mm de: 1.2, 1.4, 1.7, 1.3, 1.5, 1.1, 1.8, 1.4, 1.1. Se as medições com o paquímetro tem desvio padrão de 0.2 mm, o pesquisador consegue rejeitar a hipótese de que o comprimento do objeto é menor do que 1.3mm? Qual o p-valor para esta hipótese na amostra observada?

  3. Considere o caso da normal com variância conhecida. Ou seja, cada observação é tal que XiN(μ,σ02). Considere que desejamos testar H0:μμ0. Neste caso, faria sentido calcular como evidência contra H0 o quanto X¯ é menor que μ0? Se sim, rejeitaríamos H0 quando X¯μ0<c. Utilizando passos análogos ao da seção da normal com variância conhecida, o valor de c tal que a probabilidade de erro tipo I é controlada por α. Determine o p-valor deste teste.

  4. Considere novamente o caso da normal com variância conhecida, ou seja, cada observação é tal que XiN(μ,σ02). A medida |X¯μ0| captura evidência contra H0:μ=μ0? Se desejamos rejeitar H0 quando |X¯μ0|>c, determine o valor de c que controla o erro tipo I em α. Determine o p-valor deste teste.

Previous
Next