Parâmetros e Intervalos de Confiança
Inferência estatística e parâmetros
A inferência estatística consiste em fazer afirmações sobre características de uma população a partir de amostras desta. A partir deste ponto, estudaremos diversos métodos de inferência estatística.
Para que seja possível fazer inferência estatística,
a probabilidade descreve como
a amostra se relaciona com a população.
Por exemplo, podemos considerar
Contudo, ao contrário do exemplo acima,
em geral não sabemos descrever perfeitamente
a população que temos interesse.
Por exemplo, se estamos medindo um objeto,
em geral não sabemos qual é o seu comprimento.
Assim, se
Para solucionar este problema, utilizamos parâmetros.
Um parâmetro é uma quantidade desconhecida da população.
Por exemplo, no parágrafo anterior,
o comprimento do objeto medido
seria um parâmetro, que poderíamos denotar por
Intervalos de Confiança
Em algumas situações, desejamos criar
um intervalo pequeno tal que
seja bastante plausível que
o parâmetro esteja dentro dele.
A seguir, veremos formalmente como
operacionalizar este objetivo.
Estaremos interessados em construir
um intervalo de confiança para
O primeiro passo consiste em observar que
um intervalo é constituído por
um limite inferior,
A seguir, veremos alguns exemplos de intervalo de confiança.
Normal com variância conhecida
Considere que
Aplicação numérica
Considere que
n = 9
media = 8
alpha = 0.05
sigma = 1
print(qnorm(1-0.5*alpha))
## [1] 1.959964
l_1 = media - sigma/sqrt(n) * qnorm(1-0.5*alpha)
print(l_1)
## [1] 7.346679
print(qnorm(0.5*alpha))
## [1] -1.959964
l_2 = media - sigma/sqrt(n) * qnorm(0.5*alpha)
print(l_2)
## [1] 8.653321
Isto é,
Normal com variância desconhecida
Quando
Neste caso, usamos o fato de que
Interpretação
Intervalos de confiança são interpretados
incorretamente com frequência. Por exemplo,
considere que, antes que a amostra seja observada
temos
Note que a probabilidade de 95% no exemplo é
calculada antes de a amostra ter sido coletada.
Em outras palavras, podemos interpretar que,
se gerarmos vários bancos de dados independentes
da mesma população, então
mu = 2
sigma = 4
n = 100
num_experimentos = 10000
sucessos = 0
for(ii in 1:num_experimentos)
{
dados = rnorm(n, mu, sigma)
l1 = mean(dados) - sigma/sqrt(n) * qnorm(1-0.5*alpha)
l2 = mean(dados) - sigma/sqrt(n) * qnorm(0.5*alpha)
sucessos = sucessos + (mu > l1 & mu < l2)
}
sucessos/num_experimentos
## [1] 0.952
Exercícios
Defina e interprete intervalo de confiança em suas próprias palavras.
Um experimentalista experiente realizou
medições da largura de um objeto usando um paquímetro. A média destas observações foi de . O desvio padrão do experimentalista com o paquímetro é de . Usando estas informações, construa intervalo com confiança 90%, 95% e 99% para a largura do objeto.No exemplo da normal com variância conhecida, obtemos que o comprimento do intervalo de confiança é
. Isto ocorre pois . Interprete , e e como estas quantidades inluenciam no tamanho do intervalo de confiança.O caso da normal com variância populacional conhecida é um caso especial do caso da normal com variância populacional desconhecida. Em particular, o intervalo de confiança obtido para a variância populacional desconhecida é válido mesmo quando ela é conhecida. Apesar disso, é indesejável usar este intervalo neste caso. Por quê?
Obtenha a linha de raciocínio completa para obter o intervalo de confiança no caso da normal com variância desconhecida.