Python作为一门优秀的编程语言,近年来受到很多编程爱好者的青睐。 一是因为Python本身具有简捷优美、易学易用的特点;二是由于互联网的飞速发展,我们正迎来大数据的时代,而Python无论是在数据的采集与处理方面,还是在数据分析与可视化方面都有独特的优势。我们可以利用Python便捷地开展与数据相关的项目,以很低的学习成本快速完成项目的研究。 Python被大量应用在数据挖掘和机器学习领域,其中使用极其广泛的是IPython、Numpy、pandas、Matplotlib等库。对于希望使用Python来完成数据分析工作的人来说,学习IPython、Numpy、pandas、Matplotlib这个组合是目前看来不错的方向。
(图源:ipython.org) IPython是Python的加强型交互式解释器。 IPython是使用Python进行数据分析、处理、呈现的重要选择之一。它是一个与Python科学计算包(主要包括Numpy、pandas、Matplotlib等)紧密联系的交互式开发环境,它同时也是Python科学计算包的一部分。 主要特点包括:
IPython加上一个文本编辑器是科学计算者使用Python进行数据分析、处理、呈现的最佳选择之一。 IPython主要包括:
IPyton壳 2017年最新发布的IPython壳以及内核具有以下这些重要的特性:
(图源:numpy.org) Numpy是Python科学计算库的基础。 主要包括:
Numpy提供了一个简洁的C语言接口,可以非常方便地使用C语言编写的代码操作Numpy数组对象,反过来使用C语言生成的数组也可以轻松的转化成Numpy数组对象;这一特性使得Python轻松地与其他编程语言C/C 粘结在一起。Numpy除了用作科学计算,也可以用作多维度普通数据的容器;并且可以定义任何类型的数据,使得Numpy高效、无缝地与各种类型的数据分析库连接起来。 Numpy的主要对象是一个多维度的、均匀的多维数组。Numpy提供了各种函数方法可以非常方便灵活的操作数组,熟练掌握数组的基本概念是使用数组这种数据结构的基本要求。
(图源:pandas.pydata.org) pandas是建立在Numpy基础上的高效数据分析处理库,是Python的重要数据分析库。 pandas提供了众多的高级函数,极大地简化了数据处理的流程,尤其是被广泛地应用于金融领域的数据分析。 pandas主要包括:
(图源:matplotlib.org) Matplotlib是一个主要用于绘制二维图形的Python库。 数据可视化是数据分析的重要环节,借助图形能够帮助更加直观地表达出数据背后的”东西”。 Matplolib最初主要模仿Matlab的画图命令,但是它是独立于Matlab的,可以自由、免费使用的绘图包。Matplotlib依赖于之前介绍的Numpy库来提供出色的绘图能力。Matplotlib项目是John Hunter在2002年发起的,目标是建立一个具备以下特点的Python绘图工具包:
经过社区多年以来的努力,Matplotlib已经具备了上面列出的所有特点。现在Matplotlib被广泛地应用于各种生产、科学研究等环境中,比如在网络服务中动态生成图形、在IPython壳下交互使用Matplotlib绘图等。 Matplotlib从概念上可以分为三层: matplotlib.pylab,这一层给主要给用户提供一些简单的命令来生成图形,语法风格和Matlab非常接近。Matplotlib的API,这一层主要给用户提供了直接创建图形、线条、文本等的功能。这是一个抽象层,它并不关心图形的输出。最后一层是后端,主要是管理图形的输出等其他一些功能。 如果你已经决定学习Python数据分析,但是之前没有编程经验,那《Python数据分析从入门到精通》你绝不能错过。Python数据分析“四剑客”在本书上会进行详细深入的介绍。 本书详细地介绍了IPython、Numpy、pandas、Matplotlib库的组成与使用,为科学计算相关人员提供了有用的参考资料。采取循序渐进的写作风格,对于工具的安装、使用步骤、方法技巧逐步展开,加以图解和应用场景,即使完全不懂Python和数据分析的人员,也可以流畅地读完本书。 无论哪种语言,编程的方法、模式、数据结构、算法都是相通的。本书将科学计算、数据结构与各种工具和方法完美结合,让非Python读者也能融会贯通,让学习统计的人能找到更适合的统计方法和数据分析处理方法。 本书最后的两个实战案例适合数据分析入门者,案例的步骤详细、分析到位,能为读者入手真实项目打下良好的基础。 进入小程序参与抽奖,3月22日自动开奖。 本书目录结构 第1篇 Python数据分析语法入门 第1章 初识Python 1
第2章 Python起步必备 27
第3章 Python的数据类型与流程控制语句 41
第4章 可复用的函数与模块 64
第5章 数据结构与算法 82
第6章 面向对象的Python 101
第7章 异常处理与程序调试 120
第8章 pip软件包管理 137
第2篇 Python数据分析工具入门 第9章 IPython科学计算库 142
第10章 Numpy科学计算库 174
第11章 pandas数据分析处理库 216
第12章 Matplotlib数据可视化 260
第3篇 Python数据分析案例实战 第13章 案例1:数据挖掘 288
第14章 案例2:玩转大数据 305
博文视点您阅读的专业智库 喜欢请分享至朋友圈 |
|
来自: CHOK2620 > 《python数据分析》