Variáveis aleatórias e Probabilidade
Variáveis aleatórias
É comum que desejemos generalizar as conclusões que obtemos de um banco de dados para uma população. Por exemplo, no banco de dados de adubos, amostras de adubo com fosfato em geral tem um efeito maior que amostras de adubo sem fosfato. Será verdade, fora de nossa amostra, que adubos com fosfato tem efeito superior a adubos sem fosfato?
Para responder a questões como essa, é preciso desenvolver uma ferramenta que ligue as observações realizadas na amostra a observações futuras. Para realizar esta conexão descrevemos o nosso conhecimento antes de coletar o banco de dados. Neste contexto, havia incerteza sobre quais dados seriam observados. Por exemplo, considere que um experimento consiste em medir um objeto 10 vezes com um paquímetro. Devido aos erros de medição diversos valores serão observados. Cada medição tem um resultado incerto, com vários possíveis valores.
Para designar observações incertas,
usamos variáveis aleatórias.
Em particular, lembre-se que um
banco de dados é uma matriz em que
as linhas são unidades amostrais e
as colunas são variáveis.
Designamos por
Proposições
Utilizando variáveis aleatórias,
é possível definir proposições de interesse.
Proposições simples envolvem uma única variável
e são, por exemplo, “
Probabilidade
A probabilidade de uma proposição é
uma medida de quão plausível esta proposição é.
Seja
A probabilidade tem certas propriedades que
ela deve satisfazer. Primeiramente,
para toda proposição a sua probabilidade deve
estar entre 0 e 1.
Se
Relações entre proposições
Dizemos que duas proposições são mutuamente exclusivas se é impossível que ambas ocorram simultaneamente. Isto é,
e são mutuamente exclusivas se “ e ” é impossível. Por exemplo, se é uma variável aleatória que designa o resultado de uma moeda, então “ = cara” e “ = coroa” são mutuamente exclusivas. É uma propriedade da probabilidade que, se e são proposições mutuamente exclusivas, então:Dizemos que duas proposições são independentes se aprender uma proposição não traz informação sobre a outra. Por exemplo, considere que
e designam o resultado de dois lançamentos separados de um dado. Usualmente, não acreditamos que um lançamento de um dado traz informação sobre o outro. Assim, por exemplo, é independente de . se e são proposições independentes, então:Dizemos que duas variáveis aleatórias,
e , são independentes se qualquer par de proposições sobre e são independentes. Por exemplo, se e são independentes, então e são independentes. Para muitos bancos de dados que estudaremos neste curso, será comum supormos que, para toda variável, , as observações desta variável são independentes para cada unidade amostral. Isto é, são independentes.Atenção: Exceto em casos extremos, um par de proposições nunca é simultaneamente “mutuamente exclusivo” e “independente”. De fato, se
e são mutuamente exclusivos e aprendemos que ocorreu, então sabemos com certeza que não ocorreu. Isto é, traz informação sobre . Estes conceitos sejam frequentemente confundidos! Tome cuidado!
Interpretações da probabilidade.
Simetria
Os conceitos de probabilidade iniciaram seu desenvolvimento com o estudo de jogos de azar. Isto ocorreu provavelmente porque nestes jogos lidamos com incertezas em um ambiente controlado. O funcionamento de um dado é relativamente simples em relação ao objeto de pesquisas científicas modernas.
Por exemplo, os possíveis resultados do
lançamento de um dado (1, 2, 3, 4, 5 e 6)
são simétricos e, assim,
todos são igualmente plausíveis.
Neste caso, obtemos que
a probabilidade de cada possibilidade é
Frequência
Na maior parte de pesquisas científicas modernas, nãoé possível usar diretamente o juízo de simetria apresentado anteriormente. Por exemplo, quando realizamos uma reação química, esta pode produzir o efeito desejado ou não. Em geral, estas possibilidades não são igualmente plausíveis. Assim, é necessário desenvolver um conceito mais abrangente de probabilidade.
Para tal, imaginamos uma sequência de experimentos independentes em que realizamos a reação química estudada. Podemos calcular a proporção de experimentos tais que a reação química produziu o efeito desejado. Ainda que, para um número finito de experimentos, esta proporção apresente variabilidade, quando o número o número de experimentos torna-se grande, a proporção concentra-se em um valor. Segundo a interpretação baseada em frequências, este valor designa a probabilidade de a reação química produzir o resultado satisfatório. Isto é, a probabilidade de que a reação química produza um resultado satisfatório é a proporção de experimentos independentes em que obtemos este resultado, quando realizamos um número muito grande de experimentos.
Por exemplo, a figura abaixo apresenta a proporção de vezes que um evento ocorre para vários possíveis números de realizações de experimentos independentes. Qual a probabilidade de ocorrência do evento?

Apostas
Existem experimentos tais que não conseguimos
imaginar repetições independentes.
Por exemplo, imagine as eleições presidenciais
de 2018 como experimento.
Existirá uma única eleição presidencial de 2018 e,
assim, não conseguimos imaginar uma sequência de
repetições independentes deste experimento.
Assim, a interpretação frequentista não consegue
responder a questões como:
“Qual a probabilidade de o candidato
Neste sentido, existe uma interpretação alternativa
de probabilidade baseada em apostas.
Considere uma aposta em que você ganha R$1 se
uma proposição,
Possíveis vantagens da interpretação baseada em apoastas é que ela enfatiza que o juízo de probabilidade é subjetivo e que ela pode ser aplicada a experimentos que não podem ser repetidos.
Exercícios
Descreva em suas próprias palavras o significado de “mutuamente exclusivos” e “independentes”. Apresente um exemplo de um par de proposições para cada expressão.
Considere as proposições: A = “Choverá hoje” e B = “Não choverá hoje”. Elas são mutuamente exclusivas? São independentes?
Considere as proposições: A = “Choverá hoje” e B = “Choverá amanhã”. Elas são mutuamente exclusivas? São independentes?
Um dado de 6 faces é arremessado. Qual é a probabilidade de que,
, um número par seja sorteado? Qual é a probabilidade de que, , o número 3 ou 6 seja sorteado? As duas proposições acima são independentes? Verifique se .Dividam-se em grupos e arremessem uma moeda várias vezes. Construam um banco de dados juntando todos os seus lançamentos. Para este banco de dados, esbocem como a proporção de caras varia de acordo com o número de lançamentos.
Uma moeda de duas faces simétricas é arremessada duas vezes. Seja
a proposição de que o resultado do primeiro lançamento foi cara e a proposição de que em ambos os lançamentos ocorreu o mesmo resultado.
Determine
, , e . e são independentes? São mutuamente exclusivos?