Veja na tabela abaixo o número da questão que foi sorteada para você. Se seu número de matrícula não estiver na tabela, entre em contato comigo pelo Telegram.
matricula |
questao |
---|---|
119060007 |
1 |
119060025 |
3 |
119060038 |
8 |
119060043 |
9 |
120060010 |
4 |
120060014 |
6 |
120060029 |
7 |
120060034 |
10 |
216060055 |
5 |
219060053 |
2 |
Clique o botão Code
, no início desta página, para baixar o arquivo Rmd deste documento.
Certifique-se de que o pacote fnaufelRmd
está instalado. Use os comandos
install.packages("devtools")
devtools::install_github("fnaufel/fnaufelRmd")
Edite o arquivo Rmd para resolver a sua questão.
Cada item que pede para você construir um intervalo de confiança ou para você fazer um teste de hipóteses deve ser resolvido de duas maneiras (exceto quando houver instrução dizendo o contrário):
Fazendo os cálculos passo a passo, como nos vídeos do curso, e
Usando as funções prontas do R para IC e testes de hipótese que foram usadas nos vídeos do curso.
Escreva o máximo possível sobre o seu raciocínio. Justifique suas respostas.
Teste suas respostas. Tudo deve estar executando sem erros.
Envie no Moodle:
O arquivo Rmd com as suas resoluções e
Um vídeo de até \(5\) minutos explicando as suas resoluções.
Bom trabalho.
Uma amostra aleatória de \(86\) pessoas inclui \(41\) fumantes.
Construa um intervalo de confiança de \(95\%\) para o percentual de fumantes na população de onde foi coletada a amostra.
Faça um teste de hipóteses para avaliar a afirmação de que o percentual de fumantes na população é diferente de \(50\%\). Use \(\alpha = 0{,}05\).
Qual o tamanho mínimo da amostra necessária para estimar, com um nível de confiança de \(95\%\) e uma margem de erro de \(0{,}05\) (\(5\) pontos percentuais), a proporção de alunos universitários que completam a graduação em \(4\) anos ou menos? Nada mais é sabido sobre a população.
Explique por que você escolheu o valor de \(\hat p\) que você escolheu.
Em uma amostra de \(400\) alunos universitários, \(150\) completaram a graduação em \(4\) anos ou menos. Teste a afirmação de que, na população, menos de \(40\%\) dos alunos universitários completam a graduação neste tempo.
Observe a foto abaixo, que mostra parte de uma multidão. A quantidade de pessoas em cada setor quadrado foi estimada por um algoritmo.
Os valores obtidos para os setores da foto foram
setores <- c(
200, 400, 800, 1000, 400, 800, 700, 1000, 400, 200, 700, 900, 400, 400, 700, 900,
600, 700, 900, 650, 672, 700, 900, 450, 566, 700, 900
)
Construa um intervalo de confiança de \(95\%\) para a quantidade média de pessoas por setor na multidão inteira (inclusive as partes que não aparecem na foto).
Usando o resultado do item anterior e considerando que a multidão inteira cobre \(50\) setores, construa um intervalo de confiança para o total de pessoas na multidão.
Faça um teste de hipóteses para avaliar a afirmação de que a multidão inteira consiste de mais de \(35\) mil pessoas. Use \(\alpha = 0{,}05\).
Qual o tamanho mínimo da amostra necessária para estimar, com um nível de confiança de \(95\%\) e uma margem de erro de \(2\) batimentos por minuto (bpm), a pulsação média de mulheres adultas? De estudos anteriores, podemos usar a informação de que o desvio padrão da população é \(\sigma = 12{,}54\) bpm.
O vetor pulsacao
contém os valores das pulsações (em bpm) de diversas mulheres.
pulsacao <- c(
80, 94, 58, 66, 56, 82, 78, 86, 88, 56, 36, 66, 84, 76, 78, 64, 66,
78, 60, 64, 84, 82, 70, 74, 86, 90, 88, 90, 90, 94, 68, 90, 82, 80, 74,
56, 100, 74, 76, 76, 86, 74, 66, 62, 78, 68, 62, 62, 74, 104, 54, 74,
74, 84, 60, 52, 84, 66, 56, 66, 84, 64, 64, 78, 104, 84, 84, 62, 82, 64,
78, 76, 86, 72, 82, 82, 66, 58, 62, 80, 58, 82, 76, 70, 88, 44, 58, 64,
68, 70, 58, 72, 80, 70, 74, 72, 66, 82, 98, 74, 80, 82, 56, 78, 100, 56,
68, 72, 64, 94, 72, 56, 80, 76, 56, 56, 54, 72, 70, 80, 72, 62, 96, 72,
60, 98, 72, 80, 84, 68, 86, 72, 80, 64, 82, 80, 62, 74, 96, 72, 96, 64,
62, 82, 76, 94, 74
)
Teste a afirmação de que a pulsação média de mulheres adultas é menor do que \(70\) bpm. Use \(\alpha = 0{,}05\). Use o fato de que \(\sigma = 12{,}54\) bpm.
Refaça o item anterior sem usar o fato de que \(\sigma = 12{,}54\) bpm.
Compare e comente os resultados.
Em uma amostra \(A\) de \(200\) pessoas, \(124\) possuem um PlayStation.
O método de bootstrapping consiste em simular muitas amostras — com reposição — a partir dos elementos desta amostra original \(A\). A partir destas muitas amostras simuladas, você pode calcular intervalos de confiança como explicado abaixo:
Armazene, em uma lista, \(10\) mil amostras, cada uma com \(200\) pessoas sorteadas com reposição a partir da amostra original \(A\) acima (com todas as \(200\) pessoas tendo a mesma probabilidade de sorteio).
Armazene, em um vetor de \(10\) mil elementos, as proporções de possuidores de PlayStations nas amostras obtidas no item anterior.
Imprima os valores deste vetor que estão no quantil \(0{,}05\) e no quantil \(0{,}95\). Estes são os extremos do intervalo de confiança para a proporção de possuidores de PlayStations na população, com \(95\%\) de confiança, calculados via bootstrapping.
Uma das vantagens do bootstrapping é não precisar de qualquer conhecimento sobre a população — sua distribuição, sua variância etc.
Use a função prop.test()
do R para construir um intervalo de confiança para a proporção de possuidores de PlayStations na população, com \(95\%\) de confiança — não é necessário fazer os cálculos passo a passo.
Compare com o resultado do bootstrapping.
Uma amostra das quantidades de radiação emitidas por telefones celulares consiste dos seguintes valores:
radiacao <- c(38, 55, 86, 91, 99, 103, 145)
O método de bootstrapping consiste em simular muitas amostras — com reposição — a partir dos elementos desta amostra original. A partir destas muitas amostras simuladas, você pode calcular intervalos de confiança como explicado abaixo:
Armazene, em uma lista, \(10\) mil amostras, cada uma com \(7\) elementos sorteados com reposição a partir do vetor radiacao
(com todos os elementos tendo a mesma probabilidade de sorteio).
Armazene, em um vetor de \(10\) mil elementos, as médias das amostras obtidas no item anterior.
Imprima os valores deste vetor que estão no quantil \(0{,}05\) e no quantil \(0{,}95\). Estes são os extremos do intervalo de confiança para a radiação média na população, com \(95\%\) de confiança, calculados via bootstrapping.
Uma das vantagens do bootstrapping é não precisar de qualquer conhecimento sobre a população — sua distribuição, sua variância etc.
Use a função t.test()
do R para construir um intervalo de confiança para a radiação média, com \(95\%\) de confiança — não é necessário fazer os cálculos passo a passo.
Compare com o resultado do bootstrapping.
Dentre \(306\) pessoas com mais de \(55\) anos, \(68\) disseram que sonham em preto e branco.
Dentre \(298\) pessoas com menos de \(25\) anos, \(13\) disseram que sonham em preto e branco.
Construa um intervalo de confiança de \(99\%\) para a diferença entre as duas proporções.
Teste a afirmação de que a proporção de pessoas com mais de \(55\) anos que sonham em preto e branco é maior do que a proporção de pessoas com menos de \(25\) anos que sonham em preto e branco. Use \(\alpha = 0{,}01\).
Professoras mulheres recebem avaliações melhores do que professores homens?
Em uma universidade, as professoras mulheres receberam as seguintes notas dos alunos:
mulheres <- c(
4.3, 4.3, 4.4, 4.0, 3.4, 4.7, 2.9, 4.0, 4.3, 3.4, 3.4, 3.3
)
Na mesma universidade, os professores homens receberam as seguintes notas:
homens <- c(
4.5, 3.7, 4.2, 3.9, 3.1, 4.0, 3.8, 3.4, 4.5, 3.8, 4.3, 4.4, 4.1, 4.2, 4.0
)
Nada é sabido sobre as variâncias das duas populações.
Construa um intervalo de confiança de \(95\%\) para a diferença entre as médias.
Teste a afirmação de que as médias são diferentes. Use \(\alpha = 0{,}05\).
A tabela abaixo mostra as quantidades de palavras faladas em um dia pelos maridos e mulheres em \(8\) casais:
casal | marido | mulher |
---|---|---|
1 | 15.684 | 24.625 |
2 | 26.429 | 13.397 |
3 | 1.411 | 18.338 |
4 | 7.771 | 17.791 |
5 | 18.876 | 12.964 |
6 | 15.477 | 16.937 |
7 | 14.069 | 16.255 |
8 | 25.835 | 18.667 |
Construa um intervalo de confiança de \(95\%\) para a diferença média entre as quantidades de palavras faladas pelos dois cônjuges de um casal.
Teste a afirmação de que, em casais em geral, a mulher fala mais do que o homem. Use \(\alpha = 0{,}05\).
A tabela abaixo mostra as temperatura corporais (em graus Celsius) de \(32\) pessoas, medidas de manhã e de tarde:
pessoa | manhã | tarde |
---|---|---|
1 | 36,7 | 36,7 |
2 | 37,0 | 37,1 |
3 | 36,3 | 36,7 |
4 | 36,8 | 37,1 |
5 | 36,8 | 37,1 |
6 | 36,8 | 36,4 |
7 | 35,9 | 37,0 |
8 | 36,3 | 37,0 |
9 | 36,3 | 37,1 |
10 | 36,8 | 36,7 |
11 | 36,3 | 36,8 |
12 | 36,6 | 36,7 |
13 | 36,9 | 36,7 |
14 | 36,4 | 36,1 |
15 | 35,7 | 36,2 |
16 | 36,7 | 36,8 |
17 | 37,1 | 37,1 |
18 | 37,4 | 37,4 |
19 | 37,1 | 36,6 |
20 | 36,5 | 36,9 |
21 | 37,2 | 36,5 |
22 | 36,7 | 36,8 |
23 | 37,1 | 36,5 |
24 | 36,4 | 36,2 |
25 | 37,2 | 36,9 |
26 | 36,9 | 37,0 |
27 | 36,2 | 36,3 |
28 | 37,1 | 35,9 |
29 | 36,3 | 36,1 |
30 | 37,1 | 36,9 |
31 | 37,2 | 36,8 |
32 | 37,3 | 37,0 |
O método de bootstrapping consiste em simular muitas amostras — com reposição — a partir dos elementos desta amostra original. A partir destas muitas amostras simuladas, você pode calcular intervalos de confiança como explicado abaixo:
Calcule a diferença entre a temperatura matinal e a temperatura vespertina para cada pessoa, armazenando os resultados em um vetor diferencas
, com \(32\) valores.
Armazene, em uma lista, \(10\) mil amostras, cada uma com \(32\) elementos sorteados com reposição a partir do vetor diferencas
(com todos os elementos tendo a mesma probabilidade de sorteio).
Armazene, em um vetor de \(10\) mil elementos, as médias das amostras obtidas no item anterior.
Imprima os valores deste vetor que estão no quantil \(0{,}05\) e no quantil \(0{,}95\). Estes são os extremos do intervalo de confiança para a diferença média de temperatura na população, com \(95\%\) de confiança, calculados via bootstrapping.
Uma das vantagens do bootstrapping é não precisar de qualquer conhecimento sobre a população — sua distribuição, sua variância etc.
Use a função t.test()
do R para construir um intervalo de confiança para a diferença média de temperatura na população, com \(95\%\) de confiança — não é necessário fazer os cálculos passo a passo.
Compare com o resultado do bootstrapping.
Baseado em https://web.archive.org/web/20101008192855/http://www.lifeslittlemysteries.com/how-is-crowd-size-estimated--1074/↩︎
Baseado em Murzyn, E. (2008). “Do we only dream in colour? a comparison of reported dream colour in younger and older adults with different experiences of black and white media.” Consciousness and Cognition, 17(4), 1228–1237. http://dx.doi.org/10.1016/j.concog.2008.09.002↩︎
Baseado em Andrew Gelman e Jennifer Hill, “Replication Data for Data Analysis Using Regression Multilevel Hierarchical Models” (2009), http://hdl.handle.net/1902.1/10285↩︎
Baseado em Mehl, M. R., Vazire, S., Nairán Ramírez-Esparza, Slatcher, R. B., & Pennebaker, J. W. (2007). “Are Women Really More Talkative Than Men?”, Science, 317(5834), 82. http://dx.doi.org/10.1126/science.1139940↩︎