Intervalos de Confiança I
Em algumas situações, desejamos criar
um intervalo pequeno tal que
seja bastante plausível que
o parâmetro esteja dentro dele.
A seguir, veremos formalmente como
operacionalizar este objetivo.
Estaremos interessados em construir
um intervalo de confiança para
O primeiro passo consiste em observar que
um intervalo é constituído por
um limite inferior,
A seguir, veremos alguns exemplos de intervalo de confiança.
Normal com variância conhecida
Considere que
No R, o comando qnorm(
Aplicação numérica
Considere que
n = 9
media = 8
alpha = 0.05
sigma = 1
print(qnorm(1-0.5*alpha))
## [1] 1.959964
l_1 = media - sigma/sqrt(n) * qnorm(1-0.5*alpha)
l_2 = media - sigma/sqrt(n) * qnorm(0.5*alpha)
c(l_1, l_2)
## [1] 7.346679 8.653321
Isto é,
Interpretação
Intervalos de confiança são interpretados
incorretamente com frequência. Por exemplo,
considere que, antes que a amostra seja observada
temos
Note que a probabilidade de 95% no exemplo é
calculada antes de a amostra ter sido coletada.
Em outras palavras, podemos interpretar que,
se gerarmos vários bancos de dados independentes
da mesma população, então
Estudo de simulação
Podemos utilizar um estudo de simulação para
afiar nossa intuição sobre esta interpretação.
A vantagem de um estudo de simulação é que
ele é uma dos raros casos em que sabemos quais
são os parâmetros populacionais que geram a amostra.
Assim, podemos verificar empiricamente
se nossos métodos estão funcionando adequadamente.
Neste exemplo, geraremos uma amostra em que
mu = 10
sigma = 1
n = 36
alpha = 0.05
x = rnorm(n, mu, sigma)
Para gerar um intervalo de confiança, podemos usar o código abaixo:
ic = function(x, alpha)
{
l = mean(x) - qnorm(1-alpha/2)*sigma/sqrt(n)
u = mean(x) - qnorm(alpha/2)*sigma/sqrt(n)
c(l, u)
}
Suscintamente, a função ic nos retorna dois valores: o limite inferior e o limite superior do intervalo de confiança. Usando estes esclarecimentos, a função ic nos retorna exatamente o intervalo de confiança que vimos em aula. Para esta simulação, temos o intervalo:
library(tidyverse)
ic_obs = ic(x, alpha)
ic_obs %>% round(2)
## [1] 9.92 10.58
Como neste estudo de simulação sabemos que
(mu <= ic_obs[2]) && (mu >= ic_obs[1])
## [1] TRUE
É por isso que neste curso que dizemos que,
após a amostra ser observada,
é falso que a probabilidade de
o intervalo
obtido conter o parâmetro é
Então o que significa
termos confiança de
Como estamos realizando um estudo de simulação, podemos concretizar este experimento mental:
B = 10^5
sucesso = rep(NA, B)
for(ii in 1:B)
{
x = rnorm(n, mu, sigma)
ic_obs = ic(x , alpha)
sucesso[ii] = (mu <= ic_obs[2]) && (mu >= ic_obs[1])
}
mean(sucesso) %>% round(2)
## [1] 0.95
Neste código, coletamos
Exercícios
Defina e interprete intervalo de confiança em suas próprias palavras.
Um experimentalista experiente realizou
medições da largura de um objeto usando um paquímetro. A média destas observações foi de . O desvio padrão do experimentalista com o paquímetro é de . Usando estas informações, construa intervalo com confiança 90%, 95% e 99% para a largura do objeto.No exemplo da normal com variância conhecida, obtemos que o comprimento do intervalo de confiança é
. Isto ocorre pois . Interprete , e e como estas quantidades inluenciam no tamanho do intervalo de confiança.O caso da normal com variância populacional conhecida é um caso especial do caso da normal com variância populacional desconhecida. Em particular, o intervalo de confiança obtido para a variância populacional desconhecida é válido mesmo quando ela é conhecida. Apesar disso, é indesejável usar este intervalo neste caso. Por quê?
Obtenha a linha de raciocínio completa para obter o intervalo de confiança no caso da normal com variância desconhecida.