Aula 8 - Testes de hipótese

Conceitos de testes de hipótese

Em uma amostra, observa-se uma variável \(X_1, \ldots, X_n\) independentes e tais que \(X_i \sim N(\mu, \sigma^2)\). É comum que desejemos testar hipóteses científicas a respeito da população. Por exemplo, a variável medida poderia ser o peso em uma amostra de ovelhas obtidas de uma determinada fazenda. Se o peso médio de ovelhas saudáveis é 100kg, poderia-se ter interesse em testar se o peso médio das ovelhas na fazenda inspecionada é de 100kg. Em termos do modelo utilizado, isto seria equivalente a testar se \(\mu = 100\). Também poderia-se testar se o peso médio das vacas obtidas está acima ou abaixo de 100kg. Isto é, se \(\mu > 100\) ou \(\mu < 100\).

Note que no exemplo acima as hipóteses são proposições sobre parâmetros populacionais. Isto é, são afirmações sobre quantidades que não observamos. Neste sentido, o desafio de testes hipóteses consiste em obter conclusões a respeito de quantidades que não observamos diretamente. Neste sentido, é inevitável que um teste leve a conclusões incorretas em alguns casos. Contudo, podemos projetá-lo para que a probabilidade de erro seja controlada. Conceitualmente, existem 2 tipos de erros que podem ocorrer, indicados abaixo:

Por convenção, os testes de hipótese que estudaremos controlam a probabilidade de erro tipo I. Isto é, controlam a probabilidade de que rejeitemos a hipótese de interesse quando ela é verdadeira. Como a probabilidade de erro tipo I é controlada, é razoável escolher a hipótese de tal forma que este é o erro mais grave. Por exemplo, considere que desejamos testar se uma usina nuclear é segura. A princípio, poderíamos testar a hipótese de que a usina é segura ou testar a hipótese de que a usina é insegura. Contudo, (i) concluir que a usina é segura quando ela é insegura é muito mais grave do que (ii) concluir que a usina é insegura quando ela é segura. Assim, tomaríamos (i) como sendo o erro tipo I. A forma de obter este resultado é tomar como hipótese que a usina é insegura. Neste caso, o erro tipo I seria concluir que a rejeitar que a usina é insegura (concluir que é segura) quando ela é insegura. Observe que, se tomássemos como hipótese a usina ser segura, então o erro tipo I seria concluir que ela é insegura quando ela é segura e, assim, não obteríamos o resultado almejado.

A hipótese que será testada é comumente chamada de hipótese nula. Também, a negação desta hipótese é chamada de hipótese alternativa. Assim, no exemplo da usina nuclear, a hipótese nula é a de que a usina é insegura e a hipótese alternativa é a de que a usina é segura.

Uma vez desenvolvidos os principais conceitos de testes de hipótese, podemos apresentar alguns testes que são comumente utilizados.

Testes de hipótese para uma população

Considere que \(X_1, \ldots X_n\) são independentes e tais que \(X_i \sim N(\mu, \sigma^2)\) e \(\mu_0\) algum valhor conhecido. Algumas hipótese comumente testadas são \(\mu = \mu_0\), \(\mu > \mu_0\) e \(\mu < \mu_0\). Assim, no exemplo das ovelhas anteriormente discutido, \(\mu_0\) seria \(100\). Nesta seção estudaremos como testar como uma destas hipóteses.

Teste bilateral

Considere que desejamos testar \(\mu = \mu_0\). Lembre que a média amostral, \(\bar{X}\), em geral assume valors próximos de \(\mu\). Assim, se a hipótese nula fosse verdadeira, teríamos que \(\bar{X}\) estaria próximo de \(\mu_0\). Em outras palavras, se \(\bar{X}\) estiver longe de \(\mu_0\), então teremos bons indícios para rejeitar a hipótese nula. Dizer que \(\bar{X}\) está longe de \(\mu_0\) pode ser interpretado como \(|\bar{X}-\mu_0| > k\), para algum \(k\) grande. Assim, resta determinar qual \(k\) é suficientemente grande para que, sob a hipótese nula, a probabilidade de \(|\bar{X}-\mu_0| > k\) acontecer seja baixa, isto é, a probabilidade do erro tipo I seja pequena.

Para controlar esta probabilidade de erro, utilizamos o Teorema do Limite Central para constatar que \(\frac{\sqrt{n}(\bar{X}-\mu)}{S} \approx N(0,1)\). Assim, se rejeitarmos a hipótese nula quando

\[ |\bar{X}-\mu| > \frac{2 \cdot S}{\sqrt{n}}, \] então a probabilidade de erro tipo I será inferior a 5%. De forma mais geral, se \(z_{1-0.5\alpha}\) é o \(1-0.5\alpha\) percentil da distribuição normal, então controlamos a probabilidade de erro tipo I por \(\alpha\) se rejeitarmos a hipótese nula quando \(|\bar{X}-\mu| > \frac{z_{1-0.5\alpha}S}{\sqrt{n}}\).

É importante notar que, ainda que historicamente o controle do erro tipo I por 5% tenha sido considerado adequado e usado como padrão, este nem sempre é o caso. Por exemplo, considere o caso em que estamos testando se uma usina nuclear é insegura. Neste caso, controlar o erro tipo I en 5% equivale a concluir incorretamente que uma usina nuclear é segura a cada 20 usinas inseguras testadas. Semelhantemente, se um juiz está testando a hipótese de que um réu é inocente, controlar o erro tipo I em 5% equivale a condenar 1 a cada 20 inocentes julgados. Estes casos evidenciam que, ainda que erros sejam inevitáveis num teste de hipótese, talvez o controle de 5% seja inadequado em muitas situações práticas. Com base em quão grave é o erro tipo I em relação ao erro tipo II, vocês terão de decidir qual é o controle adequado da probabilidade de cometer este erro.

Testes unilaterais

- \(\mu > \mu_0\)

Considere que desejamos testar \(\mu > \mu_0\). Sob a hipótese nula, esperamos que \(\bar{X}\) assuma valores maiores ou iguais a \(\mu_0\). Assim, temos evidências contrários a este hipótese quando \(\bar{X}\) assume valores pequenos, isto é, quando \(\bar{X} < \mu_0 - k\). Semelhantemente ao caso do teste bilateral, podemos utilizar o Teorema do Limite Central para concluir que controlamos o erro tipo I em 5% se rejeitarmos a hipótese nula quando

\[ \bar{X} < \mu_0 - \frac{1,64 \cdot S}{\sqrt{n}}. \]

Note que, enquanto que o teste bilateral usa a constante \(2\), o teste unilateral usa a constante \(1,64\). Isto ocorre pois, enquanto que o teste bilateral distribui a probabilidade de erro tipo I tanto para valores pequenos quanto para valores grandes de \(\bar{X}\), o teste unilateral apresentado distribui a probabilidade de erro tipo I apenas para valores pequenos de \(\bar{X}\). Assim, uma variedade maior de valores pequenos de \(\bar{X}\) levam à rejeição de \(\bar{X} < \mu_0\).

De forma mais geral, se quisermos controlar a probabilidade de erro tipo I em \(\alpha\), então a hipótese nula é rejeitada quando \(\bar{X} < \mu_0 - \frac{z_{1-\alpha} \cdot S}{\sqrt{n}}\).

- \(\mu < \mu_0\)

Para testarmos a hipótese \(\mu > \mu_0\), aplicamos um raciocínio espelhado àquele que empregamos para \(\mu < \mu_0\). Assim, controlamos a probabilidade de erro tipo I em 5% se rejeitarmos a hipótese quando

\[ \bar{X} > \mu_0 + \frac{1,64 \cdot S}{\sqrt{n}}. \] De forma mais geral, controlamos a probabilidade de erro tipo I em \(\alpha\) se rejeitarmos a hipótese nula quando \(\bar{X} > \mu_0 + \frac{z_{1-\alpha} \cdot S}{\sqrt{n}}\).

Exercícios

  1. Um juiz deseja testar se um réu é inocente ou se ele é culpado por cometer um determinado crime. Para tal, contempla as hipóteses “o réu é inocente” e “o réu é culpado”. Argumente à luz dos conceitos de testes de hipótese qual hipótese deve ser testada.

  2. Considere que o mesmo juiz decide que é inaceitável condenar um inocente. Assim, ele determina que a probabilidade de condenar um réu quando ele é inocente deve ser \(0\). Explique a este juiz possíveis problemas que podem ocorrer ao tomar uma probabildade de erro tipo I tão baixa.

  3. Ainda no exemplo do juiz, qual probabilidade de erro tipo I você acredita que seja adequada?

  4. A água de um rio é própria para consumo se a concentração de uma determinada substância tóxica for inferior a \(1 mg/L\). 16 amostras de água deste rio foram tomadas e observou-se as seguintes concentrações da substância tóxica:

##  [1] 0.92 0.65 0.39 0.53 0.60 0.51 0.85 0.61 0.54 0.52 0.74 0.59 0.72 0.79
## [15] 0.89 0.75

Determine qual hipótese deve ser testada pelo pesquisador e aplique o teste adequado.