书籍推荐

 1. 方匡南. 《数据科学》. 电子工业出版社.2018.6


该书是作者在厦门大学开设《数据挖掘》等课程的教学心得,在其课程讲义资料的基础上慢慢整理出本书稿,该书写作历时4年多时间。

数据科学(Data Science)是一门交叉学科,是一门分析和挖掘数据并从中提取规律的学科,包含了统计、机器学习、数据可视化、高性能计算等。近几年,大数据如火如荼,与此同时,数据科学家(Data Scientist)也成为职场中的香饽饽,正如谷歌首席经济学家哈尔ž瓦里恩(Hal Varian2009年在纽约时报撰文所说,“未来十年最性感的工作将是统计学家”,这里的统计学家是广义的统计学家,其中包括了数据科学家。数据科学家职业被招聘网站Glassdoor2016年被评选为美国最佳工作。德勤Deloitte 预测2018年全球企业将至少需要100万数据科学家,大学培养的数据科学家数量远远不能满足市场需求,按照目前数据科学家的培养数量来看,这个缺口是很大的

市面上有各种各样讲大数据、数据科学的书,但更多的是一些讲理念方面的,或者只讲一些抽象的原理和算法,很少从数据到模型的角度去讲解,缺少真正能把数据科学方法、模型与实务操作结合起来的书。该书是一本数据科学的入门教材,从实际的应用案例出发,考虑不同的数据类型,以问题为导向讲解数据科学的模型与方法,在解决实际问题中学习数据科学相关方法。

全书共16章,内容包括数据读写、清洗与预处理,数据可视化,线性回归,线性分类,重抽样,模型选择与正则化,决策树与组合学习,支持向量机,神经网络,无监督学习,推荐算法,文本挖掘,社交网络等。每一章节都提供了实际案例分析,数据和源代码将免费提供给读者。为了方便读者使用,还为本书开发了一个RRDS

本书适合高校数据科学、机器学习、数据挖掘、大数据分析等相关专业的研究生和高年级本科的教学用书,也适合作为相关企业的数据科学家、数据挖掘工程师、数据分析师及数据科学爱好者等的工具书。


              封面.jpg

      本书配套的R包下载(下载后需要本地安装):RDS_0.1.0.tar.gz

或者直接下载对应的R程序和数据:代码及数据.rar

配套PPT下载链接:https://pan.baidu.com/s/1hfHwpZX4xEGbuvqVBenvAQ 密码:1tuk

京东购书链接:http://item.jd.com/12393841.html

2. 方匡南  朱建平 姜叶飞. 《R语言资料分析活用案例详解》. 碁峰资讯发行公司.2015.11

     该书是由方匡南、朱建平、姜叶飞编著的《R数据分析——方法与案例详解》一书,被台湾碁峰资讯发行有限公司引进,并于2015年11月出版了繁体版,仅限于台湾、香港和澳门特别行政区出版发行。     

201702021486026327104240.png


3. 方匡南  朱建平 姜叶飞. 《R数据分析—方法与案例详解》. 电子工业出版社.2015.2

      本书是一本R 语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向, 在解决问题中学习统计方法、R 语言的基本使用以及编程技巧。

      本书内容涵盖R 数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和R 包制作等内容。
      本书的定位是为业界数据分析人员、经济管理类、医学的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的 数学原理,这样能够帮助读者轻松上手学习。R语言快速入门指导教材!

1.png

R数据分析-简版电子书.pdf

《R数据分析-方法与案例详解》配套 PPT和程序,数据: https://github.com/ruiqwy/Book-R-Data-Analysis

 京东购书链接:http://item.jd.com/11652652.html 

该书由台湾碁峰资讯发行有限公司引进,并出版了繁体版。仅限于台湾、香港和澳门特别行政区出版发行http://kuangnanfang.com/?id=24

  

 4. 方匡南  著. 《随机森林组合预测理论及其在金融中的应用》. 厦门大学出版社.2012.5

  

近年来,各学科间不断地融合,研究方法相互渗透已成为现代科学发展的一大趋势。金融理论、数理统计、计量经济学、计算机技术、数据挖掘、机器学习等学科的融合为经济金融的研究提供了新的研究方法和思想。我们注意到,起源于数据挖掘领域的非参数随机森林方法,以非参数决策树方法为基础,借助于机器学习的组合预测思想,结合计算机技术,不仅可以很好地处理非线性、非高斯问题,而且具有较高的预测精度。此外,在非参数随机森林的基础上,不断发展出了分位数回归森林、随机生存回归森林等,并在医学、市场营销、物理、考古等领域都有众多应用。

本书的主要研究成果是由作者的博士学位论文以及后续相关研究组成。本书主要深入研究了最新的非参数随机森林以及由此衍生出来的相关理论和算法,并重点探讨这些方法在经济金融中的应用,尤其是在我国信用卡信用违约预测、基金股票市场的趋势预测、房屋抵押贷款违约预测、保险客户利润率预测以及金融市场风险预测等的应用。

本书适合于经济、金融、统计、管理等专业的高校教师、科研人员以及学生,也适合于经济分析师、企事业、政府经济管理有关预测分析人员。本书理论与应用分别阐述,各自成章,脉络清晰,不同的读者可以根据自己的需要进行有选择地阅读。

封面.png