R应用空间数据科学

原文地址:http://blog.dominodatalab.com/applied-spatial-data-science-with-r/

概述

最近我开始着手我的博士论文,其中利用大量不同的空间数据类型。在这一过程中,我发现有很多我还没有意识到的R空间数据分析概念。这份报告的目的是记录其中一些概念,以及我最爱的空间数据分析包。报告的结构如下:首先我们需要问问为什么R是空间分析的首选工具,其次将会探索一个典型的数据分析生命周期。

为什么用R做空间数据分析

你可能会问自己,为什么在有商业和开源地理信息系统(分别以ESRI ArcMap和QGIS为代表)时还要用R做空间分析。下面是我的原因中的一些:

  • R是免费和开源的;
  • 可重复性:研究者可以重复他们自己或其他人的分析,并验证发现;
  • 包:有许多R包用于空间数据分析、统计建模、可视化、机器学习和其他。
用于空间数据分析的R

一些我最爱的空间数据分析包包括:

  • sp:这个包提供用于空间数据的类和方法;绘制地图,使用坐标的实用函数。
  • rgdal:这个包提供了不同栅格和向量地理空间数据格式的导入与导出;坐标参考系;投影,等等。
  • rgeos:提供函数用于处理拓扑操作。
  • ggplot2:最流行的数据可视化包,作者是Hadely Wickham
  • ggmap:提供在来自Google地图、Open Street Map,cloudmade和stamen等源的静态地图之上的空间数据可视化函数。
  • leaflet:leaflet for R提供函数在R中控制和整合Leaflet,一个交互式地图JavaScript库。
  • lubridate:我的空间数据大部分有日期-时间测量,这个包提供了操作日期时间的函数。

(更多…)

继续阅读

2015年的NLP应用:音乐创作,打击犯罪和寻找爱

Olga Korobova

http://idibon.com/composing-musicals-fighting-crime-finding-love-nlp-applications-of-2015/


我在Idibon开始干的最好玩工作之一,就是浏览每天的在线新闻源和Twitter流,找寻AI和NLP领域发生的最有趣的事情,并发布在我们的社会媒体频道上。趁着2015年即将结束,我想分享一下这一年中最有趣的NLP应用。

今年,世界各地的人工智能系统已经将NLP用做艺术家、评论家和算命大师。 (更多…)

继续阅读

R结合分析初学者指南

conjoint

 

http://www.analyticsvidhya.com/blog/2015/12/beginner-tutorial-conjoint-analysis/


 

概述

品牌已经变得智能化。他们现在可以清楚地意识到客户喜好。数据真了不起!它几乎揭示了客户过往做过的一切。但是,实现这些里程碑并不是数据本身,还需要数据科学家的专门知识和理解。

分析在市场研究领域的使用尤其突出。让我们举一个例子来理解市场分析。

一家电信公司有不同产品客户的用户信息和交易数据。为设计一个新产品的广告预算是有限的。在这样的条件下,基于历史消费找到感兴趣的客户群对公司来说变得越来越重要。

有一种方法不仅预算友好,还能弄清新设计产品的价值。该方法不做他想,正是结合分析。 (更多…)

继续阅读

物联网:通过平台、数据分析和可视化实现商业价值

1-OapB00WNHoFf239eURPF2g

 

Pranay Prakash
View profile at Medium.com


在过去几年中,我沉浸在物联网(IoT)中,发现客户试图解决的问题非常具体,例如获得能源效益,早期故障检测或远程设备诊断及维修。决策由削减运营成本(OPEX)和节省资本开支(CAPEX)所驱动。

有了全部物联网设备生成的数据,强大的分析和可视化能力有助于做出准确决策并采取及时行动,从而实现这些重要的业务目标。当然,尽管这听起来很吸引人,却没那么简单。为了通过降低运营成本和/或资本开支实现有意义的价值,我们需要有效处理数据收集、分析、可视化和控制。没有这些基本的要素,我们无法利用物联网的力量。

下面是对这些关键要素和利用它们充分实施成功物联网解决方案的概述。

(更多…)

继续阅读

发现假数据科学家的20个问题

下载

import.io

http://blog.import.io/post/20-questions-to-detect-fake-data-scientists?utm_content=buffer3ad71&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer


现在,数据科学家是21世纪最性感的职业,每个人都希望分一块蛋糕。

这表示会有一些装腔作势的数据人士。这些人称自己为数据科学家,但他们并不掌握对应的技能。

这个问题的出现不一定是因为欺骗的目的。数据科学是全新的,且缺乏具有广泛共识的职位描述,意味着很多人只因为处理数据就认为自己是数据科学家。

(更多…)

继续阅读