概述
最近我开始着手我的博士论文,其中利用大量不同的空间数据类型。在这一过程中,我发现有很多我还没有意识到的R空间数据分析概念。这份报告的目的是记录其中一些概念,以及我最爱的空间数据分析包。报告的结构如下:首先我们需要问问为什么R是空间分析的首选工具,其次将会探索一个典型的数据分析生命周期。
你可能会问自己,为什么在有商业和开源地理信息系统(分别以ESRI ArcMap和QGIS为代表)时还要用R做空间分析。下面是我的原因中的一些:
- R是免费和开源的;
- 可重复性:研究者可以重复他们自己或其他人的分析,并验证发现;
- 包:有许多R包用于空间数据分析、统计建模、可视化、机器学习和其他。
一些我最爱的空间数据分析包包括:
- sp:这个包提供用于空间数据的类和方法;绘制地图,使用坐标的实用函数。
- rgdal:这个包提供了不同栅格和向量地理空间数据格式的导入与导出;坐标参考系;投影,等等。
- rgeos:提供函数用于处理拓扑操作。
- ggplot2:最流行的数据可视化包,作者是Hadely Wickham。
- ggmap:提供在来自Google地图、Open Street Map,cloudmade和stamen等源的静态地图之上的空间数据可视化函数。
- leaflet:leaflet for R提供函数在R中控制和整合Leaflet,一个交互式地图JavaScript库。
- lubridate:我的空间数据大部分有日期-时间测量,这个包提供了操作日期时间的函数。