R 语言数据分析实战

作者

黄湘云

发布日期

2023年12月10日

欢迎

警告

Book in early development. Planned release in 2024.

本书初稿是在 RStudio IDE 内使用 Quarto 编辑的,Quarto 是继R Markdown之后,一个新的开源的科学和技术发布系统,它基于 Pandoc支持输出多种格式的书稿,比如 HTML 网页、EPUB 电子书、DOCX 文档和 PDF 便携式文档等。Quarto 吸收了过去 10 年 R Markdown 取得的经验和教训,在书籍写作、创建博客、制作简历和幻灯片等系列场景中支持更加统一的使用语法,一份源文档输出多种格式,使文档内容在不同场景中的迁移成本更低。了解更多 Quarto 特性,请访问 https://quarto.org/

书中的代码字体采用美观的 Source Code Pro 字体, 为方便跨操作系统编译书籍电子版,正文的中文字体采用开源的 fandol 字体。此外,考虑到美观性,本书图形使用了 Noto 系列中英文字体,它们来自 Google Fonts 字体库,分别是 Noto Sans 无衬线英文字体和 Noto Serif SC 宋体中文字体。

书中 R 包名以粗体表示,如 knitr 包,函数名以等宽体表示,如 plot(),函数的参数名同理。代码块内注释用 # 表示,运行结果每一行开头以 #> 标记。本书写作过程中,依赖 knitr (Xie 2015)ggplot2 (Wickham 2016)lattice (Sarkar 2008) 等众多 R 包。考虑到要同时支持 DOCX、EPUB、PDF 和 HTML 四种书籍格式,书中使用 knitr 包和 gt 包制作静态的表格。

为方便测试贡献者提供的 PR,本书托管在 Github 上,同时启用 Github Action 服务,为书籍自定义了一个可复现全书内容的运行环境,包括 R 软件、扩展包和系统软件依赖,详见仓库中的 DESCRIPTION 文件。你现在看到的是在线编译版本,使用 Quarto 1.4.515,最新一次编译时间是 2023-12-10 22:59:11。

xfun::session_info(packages = c(
  "ggplot2", "gganimate", "ggrepel", "ggraph",
  "ggridges", "ggsignif", "ggforce", "ggdensity",
  "ggbeeswarm", "ggeffects", "ggnewscale",
  "patchwork", "shiny", "plotly", "lattice", 
  "dplyr", "purrr", "tidyr", "data.table",
  "rsconnect", "knitr", "rmarkdown", "gt", "DT",
  "mgcv", "glmnet", "lme4", "xgboost", "spaMM",
  "sf", "stars", "terra", "INLA", "cmdstanr",
  "showtext", "gifski", "tinytex", "magick"
), dependencies = FALSE)
#> R version 4.3.2 (2023-10-31)
#> Platform: x86_64-redhat-linux-gnu (64-bit)
#> Running under: Rocky Linux 9.3 (Blue Onyx)
#> 
#> Locale:
#>   LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
#>   LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
#>   LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
#>   LC_PAPER=en_US.UTF-8       LC_NAME=C                 
#>   LC_ADDRESS=C               LC_TELEPHONE=C            
#>   LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       
#> 
#> Package version:
#>   cmdstanr_0.6.1    data.table_1.14.8 dplyr_1.1.4       DT_0.30          
#>   gganimate_1.0.8   ggbeeswarm_0.7.2  ggdensity_1.0.0   ggeffects_1.3.2  
#>   ggforce_0.4.1     ggnewscale_0.4.9  ggplot2_3.4.4     ggraph_2.1.0     
#>   ggrepel_0.9.4     ggridges_0.5.4    ggsignif_0.6.4    gifski_1.12.0.2  
#>   glmnet_4.1.8      gt_0.10.0         INLA_23.9.9       knitr_1.45       
#>   lattice_0.21.9    lme4_1.1.35.1     magick_2.8.1      mgcv_1.9.0       
#>   patchwork_1.1.3   plotly_4.10.3     purrr_1.0.2       rmarkdown_2.25   
#>   rsconnect_1.1.1   sf_1.0.14         shiny_1.8.0       showtext_0.9.6   
#>   spaMM_4.4.0       stars_0.6.4       terra_1.7.55      tidyr_1.3.0      
#>   tinytex_0.49      xgboost_1.7.6.1  
#> 
#> Pandoc version: 3.1.9
#> 
#> LaTeX version used: 
#>   TeX Live 2020 with tlmgr 2021-02-10