Veja na tabela abaixo os números das questôes que foram sorteadas para você. Se seu número de matrícula não estiver na tabela, entre em contato comigo pelo Telegram.
020060001 |
2.17, |
3.2, 3.26, |
4.1 |
020060003 |
2.19, |
3.13, 3.32, |
4.1 |
114060043 |
2.6, |
3.18, 3.30, |
4.1 |
115060047 |
2.12, |
3.9, 3.21, |
4.1 |
118060029 |
2.11, |
3.20, 3.33, |
4.1 |
119060007 |
2.10, |
3.11, 3.24, |
4.1 |
119060011 |
2.3, |
3.5, 3.31, |
4.1 |
119060025 |
2.5, |
3.12, 3.23, |
4.1 |
120060005 |
2.4, |
3.14, 3.37, |
4.1 |
120060007 |
2.8, |
3.3, 3.27, |
4.1 |
120060009 |
2.7, |
3.6, 3.29, |
4.1 |
218060052 |
2.15, |
3.7, 3.35, |
4.1 |
218060053 |
2.14, |
3.15, 3.25, |
4.1 |
218060070 |
2.2, |
3.17, 3.36, |
4.1 |
218060076 |
2.20, |
3.8, 3.22, |
4.1 |
219060086 |
2.18, |
3.4, 3.40, |
4.1 |
220060047 |
2.16, |
3.19, 3.39, |
4.1 |
220060059 |
2.9, |
3.1, 3.34, |
4.1 |
220060063 |
2.1, |
3.10, 3.28, |
4.1 |
920060073 |
2.13, |
3.16, 3.38, |
4.1 |
Clique o botão Code
, no início desta página, para baixar o arquivo Rmd deste documento.
Edite o arquivo Rmd para resolver as suas questões.
Se quiser resolver questões que não foram sorteadas para você, fique à vontade. Na verdade, em alguns casos, uma questão sua pode depender da resposta da questão de outro aluno.
Escreva o máximo possível sobre o seu raciocínio. Justifique suas respostas.
Teste suas respostas. Tudo deve estar executando sem erros.
Envie no Moodle:
O arquivo Rmd com as suas resoluções e
Um vídeo de até \(5\) minutos explicando as suas resoluções.
Bom trabalho.
Para gerar um arquivo HTML a partir deste documento, você precisa dos seguintes pacotes do R:
conflicted
devtools
fnaufelRmd
kableExtra
knitr
latex2exp
leaflet
sessioninfo
summarytools
tidyverse
Se você estiver usando o Ubuntu, você precisa instalar — pelo sistema, não pelo R — o pacote libgdal-dev
. Faça isto antes de executar o código abaixo.
Execute o seguinte código para instalar os pacotes que estão faltando no seu ambiente:
if (!require('devtools'))
install.packages('devtools')
if (!require('fnaufelRmd'))
devtools::install_github("fnaufel/fnaufelRmd")
pacotes <- c(
'conflicted',
'kableExtra',
'knitr',
'latex2exp',
'leaflet',
'sessioninfo',
'summarytools',
'tidyverse'
)
instalar_se_preciso <- function(x) {
if (!require(x, character.only = TRUE))
install.packages(x)
}
invisible(sapply(pacotes, instalar_se_preciso))
Se houver erro na instalação, entre em contato comigo pelo Telegram, enviando todas as mensagens emitidas quando você executou os comandos.
Os nomes das colunas originais estão em inglês. Para ver o dicionário de dados — documentação sobre cada uma das colunas — visite https://www.kaggle.com/datasets/crisparada/brazilian-cities?select=Data_Dictionary.csv.
Eis uma função para renomear as colunas para português. Ela simplesmente retorna um vetor com os novos nomes, na mesma ordem que as colunas originais.
renomear <- function(x) {
c(
'cidade',
'estado',
'capital',
'pop_resid',
'pop_resid_bras',
'pop_resid_estr',
'unidades_domest',
'unidades_domest_urban',
'unidades_domest_rural',
'pop_regular',
'pop_regular_1',
'pop_regular_1_4',
'pop_regular_5_9',
'pop_regular_10_14',
'pop_regular_15_59',
'pop_regular_60_mais',
'area_cultivada',
'producao_rural',
'idhm_ranking',
'idhm',
'idhm_renda',
'idhm_longevidade',
'idhm_educacao',
'longitude',
'latitude',
'altitude',
'tv_assinatura',
'telefones_fixos',
'area',
'regiao_turismo',
'categoria_turismo',
'pop_estimada',
'tipo',
'gva_agropec',
'gva_industria',
'gva_servicos',
'gva_publico',
'gva_total',
'impostos',
'pib',
'pop_pib',
'pib_capita',
'atividade_principal',
'despesas_municipais',
'empresas_tot',
'empresas_a',
'empresas_b',
'empresas_c',
'empresas_d',
'empresas_e',
'empresas_f',
'empresas_g',
'empresas_h',
'empresas_i',
'empresas_j',
'empresas_k',
'empresas_l',
'empresas_m',
'empresas_n',
'empresas_o',
'empresas_p',
'empresas_q',
'empresas_r',
'empresas_s',
'empresas_t',
'empresas_u',
'hoteis',
'camas',
'agencias_priv',
'agencias_publ',
'bancos_priv',
'bancos_publ',
'patrimonio_bancos_priv',
'patrimonio_bancos_publ',
'carros',
'motos',
'tratores',
'uber',
'mac',
'walmart',
'correios'
)
}
Ler os dados, renomear as colunas e mudar o tipo de duas delas:
cidades <- read_csv(
'https://github.com/fnaufel/lista1-cidades-br/raw/master/dados/BRAZIL_CITIES_REV2022.CSV'
) %>%
rename_with(.fn = renomear) %>%
mutate(
capital = as.logical(capital),
uber = as.logical(uber)
)
## Rows: 5578 Columns: 81
## ── Column specification ─────────────────────────────────────────────────────────────
## Delimiter: ","
## chr (6): CITY, STATE, REGIAO_TUR, CATEGORIA_TUR, RURAL_URBAN, GVA_MAIN
## dbl (75): CAPITAL, IBGE_RES_POP, IBGE_RES_POP_BRAS, IBGE_RES_POP_ESTR, IBGE_DU, I...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Examinar a tibble com dfSummary
:
Variável | Estatísticas / Valores | Freqs (% de Válidos) | Faltante | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cidade [character] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
estado [character] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
capital [logical] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_resid [numeric] |
|
5044 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_resid_bras [numeric] |
|
5072 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_resid_estr [numeric] |
|
359 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
unidades_domest [numeric] |
|
4197 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
unidades_domest_urban [numeric] |
|
3769 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
unidades_domest_rural [numeric] |
|
2653 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_regular [numeric] |
|
4785 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_regular_1 [numeric] |
|
1030 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_regular_1_4 [numeric] |
|
2019 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_regular_5_9 [numeric] |
|
2314 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_regular_10_14 [numeric] |
|
2472 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_regular_15_59 [numeric] |
|
4478 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_regular_60_mais [numeric] |
|
2622 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
area_cultivada [numeric] |
|
4339 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
producao_rural [numeric] |
|
5010 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
idhm_ranking [numeric] |
|
5566 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
idhm [numeric] |
|
350 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
idhm_renda [numeric] |
|
391 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
idhm_longevidade [numeric] |
|
221 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
idhm_educacao [numeric] |
|
467 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
longitude [numeric] |
|
5496 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
latitude [numeric] |
|
5489 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
altitude [numeric] |
|
5549 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
tv_assinatura [numeric] |
|
1923 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
telefones_fixos [numeric] |
|
2237 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
area [numeric] |
|
5556 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
regiao_turismo [character] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
categoria_turismo [character] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_estimada [numeric] |
|
5096 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
tipo [character] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
gva_agropec [numeric] |
|
5373 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
gva_industria [numeric] |
|
5126 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
gva_servicos [numeric] |
|
5460 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
gva_publico [numeric] |
|
5435 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
gva_total [numeric] |
|
5537 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
impostos [numeric] |
|
4981 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pib [numeric] |
|
5530 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pop_pib [numeric] |
|
5114 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
pib_capita [numeric] |
|
5046 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
atividade_principal [character] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
despesas_municipais [numeric] |
|
4071 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_tot [numeric] |
|
1458 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_a [numeric] |
|
247 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_b [numeric] |
|
55 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_c [numeric] |
|
483 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_d [numeric] |
|
26 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_e [numeric] |
|
63 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_f [numeric] |
|
345 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_g [numeric] |
|
996 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_h [numeric] |
|
344 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_i [numeric] |
|
396 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_j [numeric] |
|
211 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_k [numeric] |
|
173 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_l [numeric] |
|
193 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_m [numeric] |
|
317 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_n [numeric] |
|
398 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_o [numeric] |
|
47 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_p [numeric] |
|
276 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_q [numeric] |
|
296 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_r [numeric] |
|
163 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_s [numeric] |
|
340 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_t [numeric] | 1 valor distinto |
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
empresas_u [numeric] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
hoteis [numeric] |
|
33 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
camas [numeric] |
|
369 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
agencias_priv [numeric] |
|
61 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
agencias_publ [numeric] |
|
51 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
bancos_priv [numeric] |
|
20 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
bancos_publ [numeric] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
patrimonio_bancos_priv [numeric] |
|
2333 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
patrimonio_bancos_publ [numeric] |
|
2921 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
carros [numeric] |
|
3577 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
motos [numeric] |
|
3358 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
tratores [numeric] |
|
130 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
uber [logical] |
|
|
0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
mac [numeric] |
|
20 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
walmart [numeric] |
|
12 valores distintos | 0 (0,0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
correios [numeric] |
|
36 valores distintos | 0 (0,0%) |
Gerado por summarytools 1.0.0 (R versão 4.1.3)
2022-05-03
pop_resid
(população de residentes) é a soma de pop_resid_bras
(população de residentes brasileiros) com pop_resid_estr
(população de residentes estrangeiros). Use a função all
.unidades_domest
(unidades domésticas) é a soma de unidades_domest_urban
(urbanas) com unidades_domest_rural
(rurais). Use a função all
.categoria_turismo
, substitua os zeros por NA
e converta tudo para um fator ordenado com níveis \(E < D < C < B < A\). Use a função factor
.atividade_principal
, substitua os zeros por NA
e converta tudo para um fator não-ordenado.regiao
, com a região geográfica (Norte, Nordeste, Centro-Oeste, Sudeste, ou Sul) onde está cada município. Use os níveis ‘N’, ‘NE’, ‘CO’, ‘SE’, ‘S’.Na coluna regiao_turismo
, substitua os zeros por NA
.
Quantas regiões de turismo são?
Qual tem mais municípios?
Qual tem menos municípios?
Quantos municípios não fazem parte de região de turismo?
Existe alguma região de turismo contendo cidades de estados diferentes?
Gere uma tibble com todos os valores distintos de regiao_turismo
, sem repetições.
Quais são as \(10\) palavras mais comuns que iniciam os nomes de regiões de turismo? Use a função word
.
Liste, em ordem alfabética, os nomes completos das regiões de turismo cujos nomes começam com palavras desta lista.
pib_capita
é o resultado da divisão de pib
por pop_pib
. Use a função all
.Quais as \(10\) cidades que têm a maior quantidade de carros por habitante?
Quais as \(10\) cidades que têm a menor quantidade de carros por habitante?
Quais são os tipos destas cidades?
Comente os resultados.
Quais as \(10\) cidades que têm a maior quantidade de motos por habitante?
Quais as \(10\) cidades que têm a menor quantidade de motos por habitante?
Quais são os tipos destas cidades?
Comente os resultados.
Quais as \(10\) cidades que têm a maior quantidade de tratores por habitante? Ignore as cidades que têm zero tratores.
Quais as \(10\) cidades que têm a menor quantidade de tratores por habitante? Ignore as cidades que têm zero tratores.
Quais são os tipos destas cidades?
Comente os resultados.
Quais as \(10\) cidades que têm a maior área?
Quais as \(10\) cidades que têm a menor área?
Quais são os tipos destas cidades?
Comente os resultados.
Quais as \(10\) cidades que têm a maior produção rural?
Quais as \(10\) cidades que têm a menor produção rural?
Quais são os tipos destas cidades? Ignore as cidades que têm zero produção rural.
Comente os resultados.
Quais as \(10\) cidades que têm a maior produção rural per capita?
Quais as \(10\) cidades que têm a menor produção rural per capita?
Quais são os tipos destas cidades? Ignore as cidades que têm zero produção rural.
Comente os resultados.
Quais as \(10\) cidades que têm a maior densidade demográfica?
Quais as \(10\) cidades que têm a menor densidade demográfica?
Quais são os tipos destas cidades?
Comente os resultados.
Quais são as \(10\) cidades de maior e menor latitude?
Quais são as \(10\) cidades de maior e menor longitude?
Quais são as \(10\) cidades de maior e menor altitude?
Responda as perguntas acima [por região geográfica]. Você vai precisar da resposta desta questão.
Todos os gráficos devem ser feitos com o pacote ggplot2.
Todos os gráficos devem incluir títulos, rótulos, legendas, e outros elementos para facilitar a compreensão. Imagine que seus gráficos serão publicados em uma revista científica.
Apenas para as cidades que têm McDonald’s, faça um scatterplot de quantidade de McDonald’s (no eixo \(y\)) por população (no eixo \(x\)).
Use geom_smooth
para gerar uma reta de regressão (com method = 'lm'
e se = FALSE
).
Existe alguma correlação entre as quantidades? Comente.
Apenas para as cidades que têm Walmart, faça um scatterplot de quantidade de Walmarts (no eixo \(y\)) por população (no eixo \(x\)).
Use geom_smooth
para gerar uma reta de regressão (com method = 'lm'
e se = FALSE
).
Existe alguma correlação entre as quantidades? Comente.
Faça um scatterplot de IDHM (no eixo \(y\)) por PIB per capita (no eixo \(x\)).
Use geom_smooth
para gerar uma reta de regressão (com method = 'lm'
e se = FALSE
).
Existe alguma correlação entre as quantidades? Comente.
Faça um scatterplot de IDHM (no eixo \(y\)) por despesas municipais (no eixo \(x\)).
Use geom_smooth
para gerar uma reta de regressão (com method = 'lm'
e se = FALSE
).
Existe alguma correlação entre as quantidades? Comente.
Faça um scatterplot de IDHM (no eixo \(y\)) por quantidade de carros (no eixo \(x\)).
Use geom_smooth
para gerar uma reta de regressão (com method = 'lm'
e se = FALSE
).
Existe alguma correlação entre as quantidades? Comente.
Faça um scatterplot de IDHM (no eixo \(y\)) por quantidade de motos (no eixo \(x\)).
Use geom_smooth
para gerar uma reta de regressão (com method = 'lm'
e se = FALSE
).
Existe alguma correlação entre as quantidades? Comente.
Faça um scatterplot de IDHM (no eixo \(y\)) por quantidade de tratores (no eixo \(x\)). Ignore as cidades que têm zero tratores.
Use geom_smooth
para gerar uma reta de regressão (com method = 'lm'
e se = FALSE
).
Existe alguma correlação entre as quantidades? Comente.
Faça um histograma da quantidade de agências de correios. Use o número de classes que você achar mais adequado.
Comente os resultados.
Faça um histograma da razão (número de agências de correio) / (população). Use o número de classes que você achar mais adequado.
Comente os resultados.
Faça um histograma da quantidade de agências bancárias públicas. Use o número de classes que você achar mais adequado.
Compare com a distribuição de agências privadas.
Comente os resultados.
Faça um histograma da razão (número de agências bancárias públicas) / (população). Use o número de classes que você achar mais adequado.
Compare com a distribuição de agências privadas.
Comente os resultados.
Faça um histograma da quantidade de agências bancárias privadas. Use o número de classes que você achar mais adequado.
Compare com a distribuição de agências públicas.
Comente os resultados.
Faça um histograma da razão (número de agências bancárias privadas) / (população). Use o número de classes que você achar mais adequado.
Compare com a distribuição de agências públicas.
Comente os resultados.
Faça um histograma das áreas das cidades. Use o número de classes que você achar mais adequado.
Comente os resultados.
Faça histogramas das áreas das cidades, facetados por região geográfica. Use o número de classes que você achar mais adequado. Você vai precisar da resposta desta questão.
Comente os resultados.
Faça um histograma das populações das cidades. Use o número de classes que você achar mais adequado.
Comente os resultados.
Faça histogramas das populações das cidades, facetados por região geográfica. Use o número de classes que você achar mais adequado. Você vai precisar da resposta desta questão.
Comente os resultados.
Faça um histograma do valor do PIB. Use o número de classes que você achar mais adequado.
Comente os resultados.
Faça um histograma do valor do PIB per capita. Use o número de classes que você achar mais adequado.
Comente os resultados.
Faça histogramas das quantidades de telefones fixos per capita, facetados por região geográfica. Use o número de classes que você achar mais adequado. Você vai precisar da resposta desta questão.
Comente os resultados.
Faça histogramas das quantidades de assinaturas de TV por assinatura per capita, facetados por região geográfica. Use o número de classes que você achar mais adequado. Você vai precisar da resposta desta questão.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) do PIB, com um boxplot para cada atividade principal. Faça com que os boxplots sejam horizontais, para facilitar a leitura dos nomes das atividades.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) do PIB per capita, com um boxplot para cada atividade principal. Faça com que os boxplots sejam horizontais, para facilitar a leitura dos nomes das atividades.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) da quantidade de hotéis, com um boxplot para cada categoria de turismo.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) das populações, com um boxplot para cada região geográfica. Você vai precisar da resposta desta questão.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) das densidades demográficas, com um boxplot para cada região geográfica. Você vai precisar da resposta desta questão.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) da quantidade de carros per capita, com um boxplot para cada tipo de cidade.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) da quantidade de motos per capita, com um boxplot para cada tipo de cidade.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) da quantidade de tratores per capita, com um boxplot para cada tipo de cidade.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) da quantidade de hotéis, com um boxplot para cada valor de uber
.
Comente os resultados.
Faça boxplots lado a lado (no mesmo gráfico, sem facetar) do valor do PIB per capita, com um boxplot para cada valor de uber
.
Comente os resultados.
Faça um gráfico de barras das quantidades de cidades, com uma barra por região. Você vai precisar da resposta desta questão.
Use a função fct_reorder
para dispor as barras em ordem decrescente de altura.
Em outro gráfico, use a função fct_reorder
para dispor as barras em ordem crescente de altura.
Comente os resultados.
Faça um gráfico de barras das populações totais, com uma barra por região. Você vai precisar da resposta desta questão.
Use a função fct_reorder
para dispor as barras em ordem decrescente de altura.
Em outro gráfico, use a função fct_reorder
para dispor as barras em ordem crescente de altura.
Comente os resultados.
Faça um gráfico de barras dos PIBs totais, com uma barra por região. Você vai precisar da resposta desta questão.
Use a função fct_reorder
para dispor as barras em ordem decrescente de altura.
Em outro gráfico, use a função fct_reorder
para dispor as barras em ordem crescente de altura.
Comente os resultados.
Faça um gráfico de barras das produções rurais totais, com uma barra por região. Você vai precisar da resposta desta questão.
Use a função fct_reorder
para dispor as barras em ordem decrescente de altura.
Em outro gráfico, use a função fct_reorder
para dispor as barras em ordem crescente de altura.
Comente os resultados.
Faça um gráfico de barras da população brasileira, com uma barra por faixa etária.
Use a função fct_reorder
para dispor as barras em ordem decrescente de altura.
Em outro gráfico, use a função fct_reorder
para dispor as barras em ordem crescente de altura.
Em qual ordem você acha que as barras devem aparecer? Por quê?
Comente os resultados.
Faça um gráfico de barras da população brasileira, com um conjunto de barras para cada região. Você vai precisar da resposta desta questão.
Cada conjunto deve ter \(6\) barras lado a lado, uma para cada faixa etária. Use o argumento dodge
na geometria adequada.
Comente os resultados.
Faça um gráfico de barras da população brasileira, com uma barra por região. Você vai precisar da resposta desta questão.
Todas as barras devem ser da mesma altura, e o eixo \(y\) deve ir de \(0\) até \(1\), representando proporções.
Cada barra deve ser subdividida em faixas horizontais de cores diferentes, uma faixa colorida para cada faixa etária, de acordo com as proporções de cada faixa etária em cada região.
Comente os resultados.
Faça um gráfico de barras da população brasileira, com um conjunto de barras para cada tipo de cidade.
Cada conjunto deve ter \(6\) barras lado a lado, uma para cada faixa etária. Use o argumento dodge
na geometria adequada.
Comente os resultados.
Faça um gráfico de barras da população brasileira, com uma barra por tipo de cidade.
Todas as barras devem ser da mesma altura, e o eixo \(y\) deve ir de \(0\) até \(1\), representando proporções.
Cada barra deve ser subdividida em faixas horizontais de cores diferentes, uma faixa colorida para cada faixa etária, de acordo com as proporções de cada faixa etária em cada tipo de cidade.
Comente os resultados.
Leia algum tutorial sobre o pacote leaflet
:
Em inglês: https://rstudio.github.io/leaflet/ (basta ler os \(5\) primeiros itens do menu).
Em português: http://sillasgonzaga.com/material/cdr/htmlwidgets.html#leaflet (até “Marcadores”).
Escolha qualquer uma das questões do tipo “Quais as \(10\) cidades…”, na seção de análise exploratória.
Resolva a questão e modifique o código abaixo para criar marcadores mostrando as cidades da resposta, rotulados com os nomes das cidades (use o argumento label
).
Quando o usuário clicar o mouse sobre a cidade, deve aparecer a informação relevante pedida pela questão (use o argumento popup
).
Acrescente outras informações que você achar importantes — por exemplo, a classificação da cidade na ordenação que a questão pede.
library(leaflet)
# Um exemplo, apenas. Substitua com a tibble da sua resposta:
df <- cidades %>%
filter(
cidade %in% c('Manaus', 'Brasília', 'Porto Alegre')
)
# O mapa:
leaflet(df) %>%
setView(
lng = mean(df$longitude),
lat = mean(df$latitude),
zoom = 4
) %>%
addTiles() %>%
addMarkers()
## Assuming "longitude" and "latitude" are longitude and latitude, respectively
Faça um segundo mapa interativo com marcadores para as cidades que satisfazem algum critério que você ache interessante. Use a imaginação.