Conceitos de testes de hipótese

Testes de hipótese

É comum que queiramos saber o quanto uma amostra corrobora uma hipótese científica. Neste caso, podemos aplicar um teste de hipótese, isto é, um procedimento que decidirá se a hipótese é ou não rejeitada diante da amostra obtida.

Por exemplo, considere que $X_{1}, \dots, X_{n}$ são observações independentes realizadas com uma régua ao medir um determinado objeto. Suponha que $X_{i} \sim N (μ, σ_{0}^{2})$ , onde $σ_{0}^{2}$ é conhecido e indica precisão das medidas feitas com a régua. Uma pessoa poderia estar interessada na hipótese de que o objeto tem $15$ cm. Formalmente, chamamos esta hipótese de hipótese nula e a representamos por $H_{0} : μ = 15$ . Gostaríamos de saber se é possível rejeitar $H_{0}$ com base nos dados.

Tipos de erro

Existem $4$ possíveis resultados que podem decorrer de um teste de hipótese. Note que o teste de hipótese pode rejeitar ou não rejeitar a hipótese nula e, também, esta hipótese pode ser verdadeira ou falsa. Assim, existem $4$ combinações de resultados possíveis:

(Acerto) A hipótese nula é verdadeira e não é rejeitada.
(Acerto) A hipótese nula é falsa e é rejeitada.
(Erro tipo I) A hipótese nula é verdadeira e é rejeitada.
(Erro tipo II) A hipótese nula é falsa e não é rejeitada.

Estas combinações podem ser representadas na seguinte tabela:

Note que existe um balanço entre os erros tipo I e II. Por exemplo, se quiséssemos que a probabilidade de cometer um erro tipo I fosse 0, então poderíamos nunca rejeitar H. Contudo, neste caso, a probabilidade de cometer um erro tipo II seria 1. Analogamente, se sempre rejeitarmos H, então as probabilidades de erro tipo I e II serão, respectivamente, 1 e 0. Na prática, rejeitamos $H_{0}$ quando os dados oferecem evidência contrária a este hipótese. Assim, buscamos que as probabilidades de cometer um erro tipo I ou um erro tipo II sejam baixas.

Uma outra observação importante é que, em geral, não sabemos se cometemos um erro em um teste de hipótese. Para saber se $H_{0}$ é verdadeiro ou não, seria necessária observar a população. Como apenas somos capazes de observar a amostra, não somos capazes de determinar se $H_{0}$ é verdadeiro ou não. Assim, não sabemos se o resultado do teste de hipótese foi um acerto ou um erro.

Apesar da limitação acima, podemos controlar as probabilidades de erro tipo I e II de um teste. Isto é, podemos desenvolver testes que, antes de observar o banco de dados, tenham uma baixa probabilidade de cometer um erro.

Convecionou-se que a hipótese nula deve ser escolhida de tal forma que o erro tipo I seja mais grave que o erro tipo II. Por exemplo, é mais grave concluir que um rio não está poluído quando ele está poluído do que concluir que ele está poluído quando de fato não está. Assim, neste caso, tomaríamos a hipótese nula como aquela de que o rio está poluído, pois assim o erro tipo I seria o de rejeitar que o rio está poluído quando ele de fato está.

Como o erro tipo I é o mais grave, construímos testes de hipótese que diretamente controlam a probabilidade de erro tipo I. Formalmente, determinaremos testes de hipótese tais que o erro tipo I seja menor que um valor pré-determinado, $α$ . É comum que $α$ seja chamado de nível de significância do teste.

Exemplo: normal com variância conhecida

Considere que $X_{1}, \dots, X_{n}$ são observações independentes e tais que $X_{i} \sim N (μ, σ_{0}^{2})$ , onde $σ_{0}^{2}$ é conhecido. Por exemplo, $X_{i}$ pode ser o peso da $i$ -ésima vaca alimentada com uma determinada ração. Deseja-se provar que o peso médio de vacas alimentadas com esta ração é maior do que $500 k g$ , ou seja, a hipótese nula é $H_{0} : μ \leq 500$ .

Para capturar o quanta a evidência os dados trazem contra $H_{0}$ , podemos calcular o quanto a média amostral supera o valor de $μ_{0}$ , isto é, $\bar{X} - μ_{0}$ . Gostaríamos de rejeitar a hipótese nula quando $\bar{X}$ é muito maior que $μ_{0}$ , isto é, $\bar{X} - μ_{0} > c$ , onde $c$ é escolhido de forma a controlar o erro tipo I. A seguir, veremos como realizar este controle.

O erro tipo I é a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. Isto é, para obter o erro tipo I, queremos calcular $P (\bar{X} - μ_{0} > c)$ sob $H_{0}$ . Especificamente, gostaríamos que $P (\bar{X} - μ_{0} > c) \leq α$ sob $H_{0}$ . Para realizar esta desigualdade, note que decorre das propriedades da distribuição normal que, sob o valor extremo o extremo da hipótese nula ( $μ = μ_{0}$ ), temos que $\bar{X} - μ_{0} \sim N (0, \frac{σ_{0}^{2}}{n})$ . Assim, utilizando a padronização da distribuição normal, obtemos que se $μ = 500$ , $Z := \frac{\bar{X} - μ_{0}}{\sqrt{\frac{σ_{0}^{2}}{n}}} \sim N (0, 1)$ Portanto, $\begin{aligned} P (\bar{X} - μ_{0} > c) & = P (\frac{\bar{X} - μ_{0}}{\sqrt{\frac{σ_{0}^{2}}{n}}} > \frac{\sqrt{n} c}{σ_{0}}) \\ = P (Z > \frac{\sqrt{n} c}{σ_{0}}) \\ = 1 - P (Z \leq \frac{\sqrt{n} c}{σ_{0}}) \\ = 1 - pnorm (\frac{\sqrt{n} c}{σ_{0}}) \end{aligned}$ Para controlar o erro tipo $I$ , desejamos que sob $H_{0}$ , $P (\bar{X} - μ_{0} > c) = α$ . Utilizamos as equações acima, obtemos $\begin{aligned} α & = 1 - pnorm (\frac{\sqrt{n} c}{σ_{0}}) \\ 1 - α & = pnorm (\frac{\sqrt{n} c}{σ_{0}}) \\ qnorm (1 - α) & = qnorm (pnorm (\frac{\sqrt{n} c}{σ_{0}})) \\ qnorm (1 - α) & = \frac{\sqrt{n} c}{σ_{0}} \\ \frac{qnorm (1 - α) σ_{0}}{\sqrt{n}} & = c \end{aligned}$ Assim, para controlar o erro tipo I em $α$ , rejeitamos a a hipótese nula $H_{0} : μ \leq μ_{0}$ quando $\bar{X} - μ_{0} > \frac{qnorm (1 - α) σ_{0}}{\sqrt{n}} .$

Por exemplo, considere que observamos $9$ vacas alimentadas com a ração de interesse. Sabemos que o desvio padrão nos pesos destas vacas é de $50 k g$ e, portanto, o peso de cada vaca é $X_{i} \sim N (μ, 50^{2})$ . O peso médio destas foi de $530$ . Se desejamos testar a hipótese $H_{0} : μ \leq 500$ a um nível de $α = 5 %$ , podemos realizar os cálculos no R da seguinte forma:

mu0 = 500
n = 9
sigma0 = 50
media = 530
alpha = 0.05
qnorm(1-alpha)

## [1] 1.644854

c = qnorm(1-alpha) * sigma0 / sqrt(n)
c

## [1] 27.41423

media - mu0 > c

## [1] TRUE

Como a média amostral supera $c$ a um nível de $0.05$ , rejeitamos a hipótese nula. Note que, se exercemos um maior controle sobre o erro tipo I, então não rejeitaremos a hipótese nula. Por exemplo, se tomássemos $α = 0.01$ , então o teste de hipótese seria mais conservador e não rejeitaríamos a hipótese nula.

alpha = 0.01
qnorm(1-alpha)

## [1] 2.326348

c = qnorm(1-alpha) * sigma0 / sqrt(n)
c

## [1] 38.77246

media - mu0  > c

## [1] FALSE

p-valor

Na amostra estudada no exemplo anterior, verificamos que se fixássemos $α = 0.05$ , então o teste rejeitaria a hipótese nula. Por outro lado, se fixássemos $α = 0.01$ , o teste não rejeitaria a hipótese nula. Isto ocorre pois quanto menor o valor de $α$ , mais o teste fica conservador em rejeitar $H_{0}$ . Decorre deste comportamento que, enquanto que para valores “grandes” de $α$ , o teste rejeitará $H_{0}$ , para valores “pequenos” de $α$ o teste não rejeitará $H_{0}$ .

Um valor de interesse é o menor $α$ tal que o teste rejeita $H_{0}$ para a amostra observada. Este $α^{*}$ é comumente chamado de p-valor. Este valor pode ser muito útil para compartilhar resultados. Note que, para a amostra observada, se um pesquisador fixar um $α > α^{*}$ , então ele rejeitará $H_{0}$ . Por outro lado, se ele fixar $α < α^{*}$ , então não rejeitará $H_{0}$ . Assim, somente comparando o p-valor com o $α$ fixado, é possível saber o resultado do teste. Portanto, mesmo pesquisadores fixando níveis de significância diferentes podem saber o resultado do teste de hipótese apenas observando o p-valor.

p-valor na normal com variância conhecida

No exemplo do teste de hipótese para a média da normal com variância conhecida, lembre que $H_{0} : μ \leq μ_{0}$ é rejeitado para todos os valores de $α$ tais que:

$\bar{X} - μ_{0} > \frac{qnorm (1 - α) σ_{0}}{\sqrt{n}}$ Portanto, o menor valor de $α$ tal que $H_{0}$ é rejeitado, $α^{*}$ é tal que $\bar{X} - μ_{0} = \frac{qnorm (1 - α^{*}) σ_{0}}{\sqrt{n}}$ Com algumas manipulações aritméticas podemos determinar o valor de $α^{*}$ , isto é, o p-valor: $\begin{aligned} \bar{X} - μ_{0} & = \frac{qnorm (1 - α^{*}) σ_{0}}{\sqrt{n}} \\ \frac{\sqrt{n} (\bar{X} - μ_{0})}{σ_{0}} & = qnorm (1 - α^{*}) \\ pnorm (\frac{\sqrt{n} (\bar{X} - μ_{0})}{σ_{0}}) & = pnorm (qnorm (1 - α^{*})) \\ pnorm (\frac{\sqrt{n} (\bar{X} - μ_{0})}{σ_{0}}) & = 1 - α^{*} \\ 1 - pnorm (\frac{\sqrt{n} (\bar{X} - μ_{0})}{σ_{0}}) & = α^{*} \end{aligned}$ Portanto, o p-valor neste caso é o $α^{*}$ tal que $α^{*} = 1 - pnorm (\frac{\sqrt{n} (\bar{X} - μ_{0})}{σ_{0}})$

Exercícios

Descreva em suas próprias palavras: teste de hipótese, erro tipo I, erro tipo II, nível de significância e p-valor.
Um cientista mede um objeto $9$ vezes com um paquímetro e observa os valores em mm de: 1.2, 1.4, 1.7, 1.3, 1.5, 1.1, 1.8, 1.4, 1.1. Se as medições com o paquímetro tem desvio padrão de 0.2 mm, o pesquisador consegue rejeitar a hipótese de que o comprimento do objeto é menor do que $1.3 m m$ ? Qual o p-valor para esta hipótese na amostra observada?
Considere o caso da normal com variância conhecida. Ou seja, cada observação é tal que $X_{i} \sim N (μ, σ_{0}^{2})$ . Considere que desejamos testar $H_{0} : μ \geq μ_{0}$ . Neste caso, faria sentido calcular como evidência contra $H_{0}$ o quanto $\bar{X}$ é menor que $μ_{0}$ ? Se sim, rejeitaríamos $H_{0}$ quando $\bar{X} - μ_{0} < c$ . Utilizando passos análogos ao da seção da normal com variância conhecida, o valor de $c$ tal que a probabilidade de erro tipo I é controlada por $α$ . Determine o p-valor deste teste.
Considere novamente o caso da normal com variância conhecida, ou seja, cada observação é tal que $X_{i} \sim N (μ, σ_{0}^{2})$ . A medida $| \bar{X} - μ_{0} |$ captura evidência contra $H_{0} : μ = μ_{0}$ ? Se desejamos rejeitar $H_{0}$ quando $| \bar{X} - μ_{0} | > c$ , determine o valor de $c$ que controla o erro tipo I em $α$ . Determine o p-valor deste teste.

Last updated on Jan 1, 0001