1. 方匡南 兰伟 《数据挖掘与机器学习》. 高等教育出版社. 2024.3
该书是是数据挖掘和机器学习的入门课程,分为上下两篇,上篇是R语言基础,重点是让学生掌握R语言基础,具备一定的编程基础。下篇是数据挖掘和机器学习方法,内容包括有监督学习(回归、分类、决策树、集成学习、支持向量机、神经网络)和无监督学习(主成分分析、因子分析、典型相关分析和推荐算法)。本书内容全面,讲解深入浅出,在讲解模型原理的同时辅之以翔实的案例分析,让学生能够更快更好地深入理解每个模型;此外,本书理论与实践结合,每章节都会相应地讲解本章所学的方法的R语言程序编写和实务操作,提高学生的动手能力和实际数据分析能力。本书主要面向统计学类和经济管理类的高年级本科生、应用型研究生以及数据挖掘和机器学习的兴趣爱好者等。
2 . 方匡南. 《数据科学》. 电子工业出版社.2018.6
该书是作者在厦门大学开设《数据挖掘》等课程的教学心得,在其课程讲义资料的基础上慢慢整理出本书稿,该书写作历时4年多时间。
数据科学(Data Science)是一门交叉学科,是一门分析和挖掘数据并从中提取规律的学科,包含了统计、机器学习、数据可视化、高性能计算等。近几年,大数据如火如荼,与此同时,数据科学家(Data Scientist)也成为职场中的香饽饽,正如谷歌首席经济学家哈尔瓦里恩(Hal Varian)2009年在纽约时报撰文所说,“未来十年最性感的工作将是统计学家”,这里的统计学家是广义的统计学家,其中包括了数据科学家。数据科学家职业被招聘网站Glassdoor在2016年被评选为美国最佳工作。德勤Deloitte 预测2018年全球企业将至少需要100万数据科学家,大学培养的数据科学家数量远远不能满足市场需求,按照目前数据科学家的培养数量来看,这个缺口是很大的。
市面上有各种各样讲大数据、数据科学的书,但更多的是一些讲理念方面的,或者只讲一些抽象的原理和算法,很少从数据到模型的角度去讲解,缺少真正能把数据科学方法、模型与实务操作结合起来的书。该书是一本数据科学的入门教材,从实际的应用案例出发,考虑不同的数据类型,以问题为导向讲解数据科学的模型与方法,在解决实际问题中学习数据科学相关方法。
全书共16章,内容包括数据读写、清洗与预处理,数据可视化,线性回归,线性分类,重抽样,模型选择与正则化,决策树与组合学习,支持向量机,神经网络,无监督学习,推荐算法,文本挖掘,社交网络等。每一章节都提供了实际案例分析,数据和源代码将免费提供给读者。为了方便读者使用,还为本书开发了一个R包RDS。
本书适合高校数据科学、机器学习、数据挖掘、大数据分析等相关专业的研究生和高年级本科的教学用书,也适合作为相关企业的数据科学家、数据挖掘工程师、数据分析师及数据科学爱好者等的工具书。
本书配套的R包下载(下载后需要本地安装):RDS_0.1.0.tar.gz
或者直接下载对应的R程序和数据:代码及数据.rar
配套PPT下载链接:https://pan.baidu.com/s/1hfHwpZX4xEGbuvqVBenvAQ 密码:1tuk
京东购书链接:http://item.jd.com/12393841.html
3. 方匡南 朱建平 姜叶飞. 《R语言资料分析—活用案例详解》. 碁峰资讯发行公司.2015.11
该书是由方匡南、朱建平、姜叶飞编著的《R数据分析——方法与案例详解》一书,被台湾碁峰资讯发行有限公司引进,并于2015年11月出版了繁体版,仅限于台湾、香港和澳门特别行政区出版发行。
4. 方匡南 朱建平 姜叶飞. 《R数据分析—方法与案例详解》. 电子工业出版社.2015.2
本书是一本R 语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向, 在解决问题中学习统计方法、R 语言的基本使用以及编程技巧。
本书内容涵盖R 数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和R 包制作等内容。
本书的定位是为业界数据分析人员、经济管理类、医学的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的 数学原理,这样能够帮助读者轻松上手学习。R语言快速入门指导教材!
程序与数据:Data&Code.zip
《R数据分析-方法与案例详解》配套 PPT和程序,数据: https://github.com/ruiqwy/Book-R-Data-Analysis
第13章的扩展案例数据,程序和分析报告 案例_基于logistic模型的信用卡违约风险分析与预测.rar
京东购书链接:http://item.jd.com/11652652.html
该书由台湾碁峰资讯发行有限公司引进,并出版了繁体版。仅限于台湾、香港和澳门特别行政区出版发行。https://kuangnanfang.com/?id=24
5. 方匡南 著. 《随机森林组合预测理论及其在金融中的应用》. 厦门大学出版社.2012.5
近年来,各学科间不断地融合,研究方法相互渗透已成为现代科学发展的一大趋势。金融理论、数理统计、计量经济学、计算机技术、数据挖掘、机器学习等学科的融合为经济金融的研究提供了新的研究方法和思想。我们注意到,起源于数据挖掘领域的非参数随机森林方法,以非参数决策树方法为基础,借助于机器学习的组合预测思想,结合计算机技术,不仅可以很好地处理非线性、非高斯问题,而且具有较高的预测精度。此外,在非参数随机森林的基础上,不断发展出了分位数回归森林、随机生存回归森林等,并在医学、市场营销、物理、考古等领域都有众多应用。
本书的主要研究成果是由作者的博士学位论文以及后续相关研究组成。本书主要深入研究了最新的非参数随机森林以及由此衍生出来的相关理论和算法,并重点探讨这些方法在经济金融中的应用,尤其是在我国信用卡信用违约预测、基金股票市场的趋势预测、房屋抵押贷款违约预测、保险客户利润率预测以及金融市场风险预测等的应用。
本书适合于经济、金融、统计、管理等专业的高校教师、科研人员以及学生,也适合于经济分析师、企事业、政府经济管理有关预测分析人员。本书理论与应用分别阐述,各自成章,脉络清晰,不同的读者可以根据自己的需要进行有选择地阅读。