Python 是⼀款⾮常优秀的通⽤软件; 它免费、开源; 它的模块数⽬有⼏万个, ⽽且还在飞速增长。Python 是⽬前⼏乎所有的知识探索及应⽤领域的最重要的软件⼯具之⼀。
各个领域对 Python 的⼴泛需求产⽣了很多关于 Python 的教科书. 但是, 由于 Python 的应⽤领域太多, 不同领域对 Python 语⾔的需求⼤相径庭, 每本书可能仅适应于某⼀类读者。本书⾯对的是 (⾮计算机背景的) 统计、应⽤数学及数据分析⽅⾯的师⽣和实际⼯作者, ⼒图以最简单的⽅式让读者尽快地掌握 Python 的精髓。本书旨在介绍计算机语⾔, 因此不应看成是统计教科书, 其中涉及的⼀些统计内容仅仅是学习 Python 的载体, 所以并不追求统计内容的完整和全⾯, ⽬的是向已经有些统计知识的⼈介绍 Python。
⽬前世界经济是被技术驱动的, ⽽拥有编程技能则是⼀种优势.。在科学、技术、⼯程等⽅⾯, 有过半的⼯作是由计算机完成的。对能够编程的⼈才需求远远超过供给。 学习编程不仅是社会需要, ⽽且能够教会人如何思考。
能不能迅速学会编程, 关键在于对其是否感兴趣。当然, 从来没有写过程序的⼈不可能事先就有兴趣, 但⼈⽣绝⼤多数兴趣都是后天培养的。对编程的爱好是在编程中培养的。如果你能够把编程作为一种艺术来欣赏, 作为一种嗜好来实践, 那么你的目的就达到了。
在⼤数据时代的数据分析, 最重要的不是掌握⼀两种编程语⾔, ⽽是拥有泛型编程能力(也是⼀种思维⽅式). 有了这种能⼒, 语⾔之间的不同不会造成太多的烦恼。Python 仅仅是⼀种编程语⾔, 但对于编程的初学者来说, 却是⼀个良好的开端。
⼀些⼈说 Python ⽐ R 好学, ⽽另⼀些⼈正相反, 觉得 R 更易掌握。其实, 对于熟悉编程语⾔的⼈来说, 学哪⼀个都很快。它们的区别⼤体如下: 由于统⼀的志愿团队管理, R 的语法相对⽐较⼀致, 安装程序包很简单, ⽽且很容易找到帮助和⽀持, 但由于R 主要⽤于数据分析, 所以⼀些对于统计不那么熟悉的⼈可能觉得对象太专业了。Python 则是⼀款通⽤软件, ⽐ C++ 容易学, 功能并不差, 基于 Python 改进的诸如 Cython 那样的改进或包装版软件运⾏速度也⾮常快。但是, Python 没有统⼀的团队管理, 针对不同 Python 版本的模块⾮常多。因此对于不同的计算机操作系统、不同版本的 Python、不同的模块, ⾸先遇到的就是安装问题, 语法习惯也不尽相同。另外, R 软件的基本语⾔ (即下载 R 之后所装的基本程序包) 本⾝就可以应付相当复杂的统计运算, ⽽相⽐之下 Python 的统计模型没有那么多, 做⼀些统计分析不如 R 那么⽅便, 但从其基本语法所产⽣的成千上万的模块使它⼏乎可以做任何想做的事情。
学习⾃然语⾔必须依靠实践, ⽽不能从背单词和学习语法⼊⼿。学习计算机语⾔也是⼀样, 本书不采⽤详尽的使⽤⼿册式教学, ⽽是通过实践来学会编程语⾔。⽽需要查找某些特定的定义或语法细节, ⽹络查询则是最好的途径。
本书第⼆版⽐第⼀版增加了⼀倍的篇幅, 内容选择和编排都作了⾮常⼤的改变。经验表明, 其中编程思维训练部分的实践可以迅速提升读者的编程能⼒并逐渐形成编程思维; ⽽增加的数据科学内容对于编程和对于数据科学的理解都有裨益。
展开