Recursos Adicionais

Materiais de Aprendizagem Curados para R e Análise de Dados

Visão Geral

Esta página fornece recursos adicionais de aprendizagem organizados por tópico do curso. Estes materiais complementam o Curso de R DataTax e permitem que você aprofunde seu conhecimento ou explore tópicos avançados.

NotaUsando Estes Recursos
  • Iniciantes: Concentre-se na seção de Recursos Principais
  • Durante o curso: Consulte os recursos específicos por tópico à medida que completa cada módulo
  • Após a conclusão: Explore os Tópicos Avançados para continuar sua jornada de aprendizagem

Recursos Principais

Estes livros e tutoriais abrangentes formam a base da prática moderna de R. Recomendamos para todos os aprendizes.

R for Data Science (2ª Edição)

Autores: Hadley Wickham, Mine Çetinkaya-Rundel e Garrett Grolemund
Link: https://r4ds.hadley.nz/

O guia definitivo para fazer ciência de dados com R. Nosso curso segue a estrutura pedagógica do R4DS (2e), adaptada para contextos de administração tributária. Esta é a referência mais importante para aprender R.

Melhor para: Iniciantes completos até usuários intermediários
Cobre: Todos os tópicos do nosso curso mais modelagem, comunicação e fluxo de trabalho

Capítulos-chave alinhados com nosso curso: - Cap 1-2: Introdução e Fundamentos de fluxo de trabalho → Módulo 1 - Cap 7-8: Importação de dados → Módulo 2
- Cap 3-5, 12: Transformação de dados com dplyr → Módulo 3 - Cap 6: Organização de dados (reestruturação) → Módulo 4 - Cap 9-11: Visualização com ggplot2 → Módulo 5


Data Science for Economists (and Everyone Else)

Autor: Grant McDermott
Link: https://grantmcdermott.com/ds4e/

Excelentes materiais de curso de Grant McDermott cobrindo fluxos de trabalho de ciência de dados com R. Particularmente forte em práticas modernas de R, controle de versão e pesquisa reproduzível.

Melhor para: Aprendizes que desejam instrução prática e orientada ao fluxo de trabalho
Cobre: Fundamentos de R, manipulação de dados, visualização, regressão, dados espaciais, big data

Destaques: - Explicações claras do ecossistema tidyverse - Integração com Git/GitHub para reprodutibilidade - Exemplos práticos de pesquisa em economia e políticas públicas - Excelente introdução à computação paralela e ferramentas de big data


Introduction to Econometrics with R

Autor: Florian Oswald
Link: https://scpoecon.github.io/ScPoEconometrics/

Livro interativo de econometria com R. Excelente para administradores tributários interessados em inferência causal, avaliação de políticas e análise de regressão.

Melhor para: Usuários prontos para ir além da análise descritiva para modelagem econométrica
Cobre: Regressão linear, inferência causal, dados em painel, variáveis instrumentais

Por que é valioso: - Exemplos e intuição relevantes para políticas públicas - Tutoriais e exercícios interativos - Conecta a manipulação de dados à análise econométrica - Foco em compreender relações causais em dados administrativos


swirl: Learn R, in R

Link: https://swirlstats.com/

Tutoriais interativos de R que rodam diretamente no seu console R. Nenhuma configuração necessária—apenas instale o pacote e comece a aprender.

Melhor para: Iniciantes completos que desejam prática prática e guiada
Cobre: Fundamentos de programação R, obtenção e limpeza de dados, modelos de regressão, inferência estatística

Como usar:

install.packages("swirl")
library(swirl)
swirl()

Por que é ótimo: - Aprenda fazendo, diretamente no R - Feedback imediato sobre seu código - Completamente gratuito e no seu próprio ritmo - Múltiplos cursos disponíveis para diferentes níveis de habilidade


YaRrr! The Pirate’s Guide to R

Autor: Nathaniel Phillips
Link: https://bookdown.org/ndphillips/YaRrr/

Introdução divertida e acessível ao R com tema pirata. Não deixe a apresentação lúdica enganá-lo—este é um guia abrangente.

Melhor para: Iniciantes que desejam uma introdução envolvente e menos formal
Cobre: Fundamentos de R, estruturas de dados, visualização, estatísticas, escrita de funções

Destaques: - E-book gratuito de 250 páginas - Tutoriais em vídeo complementares - Introduz “gráficos piratas” para melhor visualização de dados - Ótimos exemplos e explicações claras


Big Book of R

Autor: Oscar Baruffa
Link: https://www.bigbookofr.com/

Uma coleção curada de mais de 400 livros gratuitos de R organizados por tópico. Sua biblioteca definitiva de R.

Melhor para: Encontrar recursos especializados sobre qualquer tópico relacionado a R
Cobre: Tudo, desde o básico até tópicos avançados como aprendizado de máquina, análise espacial, aplicativos Shiny e aplicações específicas de domínio

Por que marcar este site: - Pesquisável por tópico - Regularmente atualizado com novos livros - A maioria dos recursos é gratuita - Cobre tópicos especializados não encontrados em outros lugares


Plataformas de Aprendizagem Interativa

DataCamp

Link: https://www.datacamp.com/

Plataforma interativa popular com videoaulas e exercícios práticos de codificação no navegador.

Introduction to R (Curso gratuito)
Ponto de partida perfeito com exercícios interativos e dados do mundo real

Prós: - Nenhuma instalação de software necessária - Feedback imediato sobre exercícios - Caminhos de aprendizagem estruturados - Rastreamento de progresso

Nota: Cursos gratuitos disponíveis; assinatura necessária para acesso completo


Harvard Data Science: R Basics

Instrutor: Rafael Irizarry
Link: edX - Harvard Data Science Series

Curso gratuito de Harvard analisando um conjunto de dados reais de crimes enquanto aprende fundamentos de R.

Melhor para: Aprendizes visuais e práticos que desejam instrução de qualidade universitária
Cobre: Tipos de dados, vetores, ordenação, gráficos básicos, manipulação de dados

O que o torna especial: - Aprenda analisando dados reais - Excelente instrutor com explicações claras
- Parte de uma série abrangente de ciência de dados - Gratuito para auditar (certificado custa extra)


Recursos por Módulo do Curso

Módulo 1: Introdução ao R

R for Data Science - Workflow Basics
Capítulo 2 & Capítulo 4
Base para escrever código R claro e legível

Grant McDermott - Introduction to R
Slides de palestra e notas
Guia de início rápido para R com as melhores práticas modernas

swirl - R Programming: The basics
Lições interativas no console R cobrindo fundamentos

YaRrr! - Capítulos 3-6
Introdução ao R, vetores e estruturas de dados básicas

Hands-On Programming with R
https://rstudio-education.github.io/hopr/
Ótimo complemento focando em fundamentos de programação R


Módulo 2: Importação e Exportação de Dados

R for Data Science - Data Import
Capítulo 7 & Capítulo 8
Cobertura abrangente de leitura de arquivos e bancos de dados

Grant McDermott - Data I/O
Trabalhando com diferentes formatos de dados, APIs e bancos de dados

readr documentation
https://readr.tidyverse.org/
Documentação oficial para leitura de dados retangulares

data.table import
https://rdatatable.gitlab.io/data.table/
Importação rápida para conjuntos de dados muito grandes (milhões de linhas)

swirl - Getting and Cleaning Data
Lições interativas sobre importação e organização de dados


Módulo 3: Manipulação de Dados com dplyr

R for Data Science - Data Transformation
Capítulo 3 & Capítulo 4
Referência principal para verbos dplyr: filter, select, mutate, summarize, group_by

R for Data Science - Numbers & Strings
Capítulo 12 & Capítulo 13
Trabalhando com dados numéricos e manipulação de texto

Grant McDermott - Data Wrangling
Exemplos práticos e fluxos de trabalho
Cenários de limpeza de dados do mundo real

dplyr documentation
https://dplyr.tidyverse.org/
Referência oficial com exemplos para cada função

Data Transformation Cheat Sheet
Download PDF do RStudio
Referência rápida para funções dplyr

YaRrr! - Capítulos 7-9
Manipulação de dados com abordagens base R e tidyverse


Módulo 4: Reestruturação e Junção de Dados

R for Data Science - Data Tidying
Capítulo 5
Transformando dados entre formatos amplo e longo

R for Data Science - Joins
Capítulo 19
Combinando conjuntos de dados com junções e operações de conjunto

tidyr documentation
https://tidyr.tidyverse.org/
Documentação oficial para funções de reestruturação

Grant McDermott - Data Wrangling (continuação)
Técnicas avançadas de reestruturação e junção de dados


Módulo 5: Visualização de Dados com ggplot2

R for Data Science - Data Visualization
Capítulos 9-11
Introdução completa ao ggplot2 com camadas, estéticas e facetas

Data Visualization: A Practical Introduction
Autor: Kieran Healy
Link: http://socviz.co/

Livro excelente sobre criação de visualizações eficazes com ggplot2. Vai além da mecânica para discutir princípios de boa visualização de dados.

Melhor para: Qualquer pessoa criando gráficos para relatórios, apresentações ou publicações
Cobre: Fundamentos de ggplot2, princípios de design de gráficos, mapas, saída com qualidade de publicação

Por que ler: - Ensina você a pensar sobre o que torna as visualizações eficazes - Conjuntos de dados reais e exemplos relevantes para políticas públicas - Como refinar gráficos para comunicação profissional - Excelente para administradores tributários preparando relatórios para liderança

ggplot2 Book
https://ggplot2-book.org/
Referência abrangente de Hadley Wickham

R Graphics Cookbook
https://r-graphics.org/
Abordagem baseada em receitas para criar tipos específicos de gráficos

Grant McDermott - Data Visualization
Exemplos práticos e fluxos de trabalho modernos de ggplot2

Data Visualization Cheat Sheet
Download PDF do RStudio
Referência rápida para geoms e estéticas do ggplot2

YaRrr! - Capítulo 10
Introdução aos gráficos base R e gráficos piratas


Tópicos Avançados

Pronto para ir além do básico? Estes recursos cobrem programação avançada de R e aplicações especializadas.

Programação Avançada de R

Advanced R (2ª Edição)
Autor: Hadley Wickham
Link: https://adv-r.hadley.nz/

Mergulho profundo nos conceitos de programação de R. Leitura essencial para quem deseja dominar o R.

Melhor para: Usuários intermediários a avançados
Cobre: Funções, ambientes, programação orientada a objetos, programação funcional, otimização de desempenho

Quando ler: - Após concluir este curso - Quando você quiser escrever suas próprias funções e pacotes - Quando precisar otimizar o desempenho do código - Para entender como o R realmente funciona “por baixo dos panos”

Tópicos-chave para administradores tributários: - Capítulo 6: Funções (escrevendo código reutilizável) - Capítulo 9: Funcionais (funções map, reduce, apply) - Capítulo 23: Medindo desempenho - Capítulo 24: Melhorando desempenho


Aprendizado Estatístico e Modelagem

An Introduction to Statistical Learning
Autores: Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani
Link: https://www.statlearning.com/

A introdução de referência ao aprendizado de máquina e modelagem estatística. Agora com código R e laboratórios.

Melhor para: Usuários prontos para modelagem preditiva e aprendizado de máquina
Cobre: Regressão linear, classificação, reamostragem, regularização, métodos baseados em árvores, agrupamento

Aplicações para administração tributária: - Pontuação de risco para seleção de auditoria - Previsão de comportamento de conformidade tributária
- Classificação de tipos de contribuintes - Detecção de anomalias em cadeias de IVA - Previsão de receita tributária

Como usar: - Comece após dominar os Módulos 1-4 deste curso - Trabalhe nos laboratórios em R - Concentre-se nos capítulos 2-4 para fundamentos de regressão/classificação - Capítulos 5-6 para validação cruzada e seleção de modelos


Dados Espaciais e GIS

Geocomputation with R
Autores: Robin Lovelace, Jakub Nowosad, Jannes Muenchow
Link: https://r.geocompx.org/

Guia abrangente para análise de dados geográficos com R.

Melhor para: Trabalhar com dados tributários espaciais (regiões geográficas, distritos)
Cobre: Estruturas de dados espaciais, sistemas de coordenadas, mapeamento, operações espaciais

Aplicações de administração tributária: - Mapeamento de arrecadação tributária por região - Análise de padrões espaciais de conformidade - Visualização de cobertura de escritórios tributários - Análise de risco geográfica

Pré-requisitos: Conclua este curso primeiro, especialmente o Módulo 5 (visualização)


Mineração de Texto e PLN

Text Mining with R: A Tidy Approach
Autores: Julia Silge e David Robinson
Link: https://www.tidytextmining.com/

Aprenda mineração de texto usando princípios de dados organizados com o pacote tidytext.

Melhor para: Análise de dados de texto não estruturados (comentários, descrições, documentos)
Cobre: Análise de sentimento, frequência de termos, relações de texto, modelagem de tópicos

Aplicações de administração tributária: - Análise de correspondência de contribuintes - Categorização de descrições de negócios - Mineração de notas e relatórios de auditoria - Análise de sentimento de feedback

Pré-requisitos: Conclua os Módulos 1-4 primeiro


Relatórios e Documentos Reproduzíveis

R Markdown: The Definitive Guide
Autores: Yihui Xie, J.J. Allaire, Garrett Grolemund
Link: https://bookdown.org/yihui/rmarkdown/

Guia abrangente para criar relatórios, apresentações e sites reproduzíveis com R Markdown.

Melhor para: Automatização de relatórios e criação de documentos profissionais
Cobre: Documentos PDF/HTML/Word, apresentações, painéis, sites, livros

Aplicações de administração tributária: - Relatórios mensais de conformidade - Resumos de auditoria - Painéis de dados - Documentação interna

R Markdown Cookbook
https://bookdown.org/yihui/rmarkdown-cookbook/
Receitas práticas e dicas para tarefas comuns de R Markdown


Big Data e Desempenho

Grant McDermott - Big Data in Economics
Manipulação eficiente de grandes conjuntos de dados com data.table, bancos de dados e computação paralela

data.table
https://rdatatable.gitlab.io/data.table/
Manipulação rápida de dados grandes (mais de 10 milhões de linhas)

Melhor para: Trabalhar com registros completos de contribuintes ou dados no nível de transação

Efficient R Programming
https://csgillespie.github.io/efficientR/
Aprenda a escrever código R mais rápido e eficiente


Comunidade e Ajuda

Obtendo Ajuda

RStudio Community
https://community.rstudio.com/
Fórum amigável de perguntas e respostas para usuários de R

Stack Overflow - R tag
https://stackoverflow.com/questions/tagged/r
Perguntas e respostas técnicas para questões específicas de programação

R for Data Science Online Learning Community
https://www.rfordatasci.com/
Grupos de estudo e apoio da comunidade


Mantendo-se Atualizado

R Weekly
https://rweekly.org/
Newsletter semanal de notícias e recursos de R

R-bloggers
https://www.r-bloggers.com/
Agregador de posts de blogs e tutoriais de R

#RStats no Twitter/X
Siga a hashtag #RStats para dicas de R, notícias e atualizações da comunidade


Materiais de Referência Rápida

Folhas de Consulta (Downloads em PDF)

Todas disponíveis em https://rstudio.github.io/cheatsheets/

Essenciais para este curso: - RStudio IDE - Data Import (readr, readxl) - Data Transformation (dplyr) - Data Tidying (tidyr) - Data Visualization (ggplot2)

Para tópicos avançados: - String Manipulation (stringr) - Dates and Times (lubridate) - Factors (forcats) - R Markdown / Quarto

De volta ao topo