Testes de Hipótese
É comum que queiramos saber o quanto uma amostra corrobora uma hipótese científica. Neste caso, podemos aplicar um teste de hipótese, isto é, um procedimento que decidirá se a hipótese é ou não rejeitada diante da amostra obtida. A hipótese que está sendo testado é comumente chamada de hipótese nula,
Por exemplo, considere que
Tipos de erro
Existem
- (Acerto) A hipótese nula é verdadeira e não é rejeitada.
- (Acerto) A hipótese nula é falsa e é rejeitada.
- (Erro tipo I) A hipótese nula é verdadeira e é rejeitada.
- (Erro tipo II) A hipótese nula é falsa e não é rejeitada.
Note que existe um balanço entre os erros tipo I e II. Por exemplo, se quiséssemos que a probabilidade de cometer um erro tipo I fosse 0, então poderíamos nunca rejeitar H. Contudo, neste caso, a probabilidade de cometerum erro tipo II seria 1. Analogamente, se sempre rejeitarmos H, então as probabilidades de erro tipo I e II serão, respectivamente, 1 e 0. Na prática, rejeitamos
Uma outra observação importante é que, em geral, não sabemos se cometemos um erro em um teste de hipótese. Para saber se
Apesar da limitação acima, podemos controlar as probabilidades de erro tipo I e II de um teste. Isto é, podemos desenvolver testes que, antes de observar o banco de dados, tenham uma baixa probabilidade de cometer um erro.
Convecionou-se que a hipótese nula deve ser escolhida de tal forma que o erro tipo I seja mais grave que o erro tipo II. Por exemplo, pode ser mais grave concluir que um rio não está poluído quando ele está poluído do que concluir que ele está poluído quando de fato não está. Assim, neste caso, tomaríamos a hipótese nula como aquela de que o rio está poluído, pois assim o erro tipo I seria o de rejeitar que o rio está poluído quando ele de fato está. Similarmente, a hipótese científica tomada como hipótese nula geralmente é o status quo.
Como o erro tipo I é o mais grave, construímos testes de hipótese que diretamente controlam a probabilidade de erro tipo I. Formalmente, determinaremos testes de hipótese tais que o erro tipo I seja menor que um valor pré-determinado,
Exemplo: Amostra Bernoulli
Considere que
O exemplo a seguir estuda a taxa de reforma de sentenças por Câmaras Criminais em recursos nos quais o Ministério Público é polo passivo. Para cada Câmara, testa-se a hipótese que a taxa de reforma é 50%.
library(tidyverse)
read_csv("./camaras.csv") %>%
mutate(
reforma = decisao %in% c("Parcialmente", "Provido"),
camara = gsub(" de Direito Criminal", "", camara)
) %>%
group_by(camara, polo_mp) %>%
summarise(taxa_reforma = mean(reforma), n_dados = n()) %>%
filter(n_dados > 100) %>%
mutate(
se = sqrt(taxa_reforma * (1 - taxa_reforma) / n_dados),
lower = taxa_reforma - qnorm(0.975) * se,
upper = taxa_reforma + qnorm(0.975) * se,
rejeita_h0 = abs(taxa_reforma-0.5) > qnorm(0.975)* se
) %>%
ggplot(aes(x = camara, y = taxa_reforma, color = rejeita_h0)) +
geom_point(size = 3) + # Mean points
geom_errorbar(aes(ymin = lower, ymax = upper), width = 0.2, color = "black") +
geom_hline(yintercept = 0.5, linetype = "dashed", color = "red") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
ylab("Taxa de Reforma") +
xlab("Câmara de Direito Penal") +
labs(color = "Rejeita Hipótese")

P-valor
Considere que se fixássemos
Um valor de interesse é o menor
Exercícios
Descreva em suas próprias palavras: teste de hipótese, erro tipo I, erro tipo II, nível de significância e p-valor.
Um cientista mede um objeto
vezes com um paquímetro e observa os valores em mm de: 1.2, 1.4, 1.7, 1.3, 1.5, 1.1, 1.8, 1.4, 1.1. Se as medições com o paquímetro tem desvio padrão de 0.2 mm, o pesquisador consegue rejeitar a hipótese de que o comprimento do objeto é menor do que ? Qual o p-valor para esta hipótese na amostra observada?Considere o caso da normal com variância conhecida. Ou seja, cada observação é tal que
. Considere que desejamos testar . Neste caso, faria sentido calcular como evidência contra o quanto é menor que ? Se sim, rejeitaríamos quando . Utilizando passos análogos ao da seção da normal com variância conhecida, o valor de tal que a probabilidade de erro tipo I é controlada por . Determine o p-valor deste teste.Considere novamente o caso da normal com variância conhecida, ou seja, cada observação é tal que
. A medida captura evidência contra ? Se desejamos rejeitar quando , determine o valor de que controla o erro tipo I em . Determine o p-valor deste teste.