米兰
归根结底,所有的知识都是历史;在抽象的意义上,所有的科学都是数学;在理性的基础上,所有的判断都是统计!
这段感人至深的话是作者从SAS Technology Insider的扉页上读到的。
2019年初,清华大学出版社出版了数据分析书籍《SAS技术内幕:从程序员到数据科学家》。作者为数据分析巨头SAS中国RD中心技术总监吴银良先生,前言为eecs博士生导师张明教授。
作为数据分析方面的专业SAS作品,该书在当当网上依然显示100%好评,实在难能可贵。一步步掌握数据分析的本质和精髓,从数据中获得洞察和智慧,应该是本书作者的核心宗旨。
业内大咖推荐的《SAS技术内幕》,分为上下两册。第一册侧重于SAS程序的语法和练习,第二册侧重于统计学和数据分析的介绍及其在SAS程序中的应用。就像《从程序员到数据科学家》这本书的副标题一样,真正为程序员和数据分析师搭建了一座桥梁。
书中的知识点很好的兼顾了系统性、逻辑性和可读性:程序员需要知道的SAS编程知识,数据分析师需要知道的统计学和数据分析的相关理论。这本书有非常全面的介绍。同时,知识的引入和切换是有逻辑的,符合逻辑的。更妙的是,书中丰富的代码示例便于读者自己学习、练习和调试。代码中使用的数据大部分来自系统本身,或者由几行简单的代码创建,以照顾读者在使用该书进行练习时的方便。
该书第一册第二章详细介绍了SAS的传统数据步骤,第七章介绍了SAS的第二代数据处理步骤DS2。第12章到第17章分别介绍了不同数据结构在SAS编程中的应用。
下册第18章介绍了统计学的基础知识,增加了SAS产品和流程步骤的详细概述,几乎涵盖了所有的基础SAS和SAS/STAT流程步骤。读者不仅可以从书中学到相关的统计学知识,还可以把它作为常备参考书。
在一些章节中,作者不时为读者总结知识点。比如第二十章附录(P403:统计分布之间的关系)揭示了统计分布之间简洁明了的逻辑关系,便于读者记忆和理解(如图2)。
书中最后一章详细论述了圆周率的高精度求解方法和探索分析,令人叹为观止。本书附录提供了业内最准确、最完整的统计查找表及其制作方法,涵盖了二项分布、泊松分布、标准正态分布的累积概率表,不同显著性水平α下t分布、f分布的临界值表。
该书涵盖了全面的知识范围,由浅入深,还涵盖了技术和分析领域的前沿技术。无论是初学者还是相关领域的从业者,都会从本书中获得不同程度的收获。
编辑/庞贝
评论列表()