在python中有很强大的数据分析包,能够帮助我们解决很多数值上、可视图、方程组和积分等难题,如数据科学包numpy、pandas、matplotlib可视图、scipy、scilkit-learn等。其中的numpy、matplotlib可视图,笔者就不再介绍了,需要学习的朋友请看我以前的文章。numpy的文章链接是:python科学数据分析numpy工具库最全教程,让你快速掌握这一框架

matplotlib可视图的教程链接是:

python可视图matplotlib 2D/3D图表,让你快速掌握制作常用的图表

今天笔者来介绍pandas、SciPy和scikit-learn数据包:

1.安装

要学习这些数据包的模块,首先要进行安装数据包操作,安装讲解如下:

numpy、pandas和matplotlib模块的安装时没有什么前提条件的,而SciPy模块的安装,就需要在确保numpy已经安装好的条件下才能进行SciPy模块的安装;scikit-learn在安装前也要确保numpy、SciPy、matplotlib模块已经安装好的条件下才能进行安装,所以笔者建议读者以下面建议的安装顺序去安装:

【1. numpy】—【2. matplotlib】—【3. pandas】—【4. SciPy】—【5. scikit-learn】

window环境下安装(按【win R】键打开终端)输入一下命令进行安装:

python 数据分析平台(python科学数据分析包)(1)

其他的也类似(注意:要确保网络运行正常条件下才能顺利安装)

Linux环境下安装,输入一下命令进行安装:

python 数据分析平台(python科学数据分析包)(2)

其他的也类似(注意:要确保网络运行正常条件下才能顺利安装)

注意:pandas安装成功后,还需要进行如下的安装工作,才能支持pandas对Excel进行读写操作:

python 数据分析平台(python科学数据分析包)(3)

安装工作完成后,下面开始讲解pandas、SciPy和scikit-learn简单入门的实例讲解:

2.pandas数据分析包简单入门教程:

为什么要学习pandas模块呢?要知道pandas 是python下最强大的数据分析和探索工具 功能有哪些?:支持类似SQL的数据增、删、查和改,有丰富的数据处理函数; 支持时间序列分析功能;支持灵活处理缺失数据;着重数据的读取、处理和探索等功能。

pandas有两个函数很重要,一个是Series函数,用来生成序列的,类似于一维数组,另外一种函数是DataFrame函数,类似于一个二维的表格。

(1)常规操作,两大函数应用

实例代码如下:

python 数据分析平台(python科学数据分析包)(4)

运行结果如下截图所示:

python 数据分析平台(python科学数据分析包)(5)

python 数据分析平台(python科学数据分析包)(6)

(2)读取csv文件、Excel表格中的数据

csv文件和Excel表格已经存在的条件下,例如笔者的文件如下:

python 数据分析平台(python科学数据分析包)(7)

实例代码:

python 数据分析平台(python科学数据分析包)(8)

运行结果截图:

python 数据分析平台(python科学数据分析包)(9)

3.SciPy简单入门教程:

介绍一下SciPy有什么作用呢?

1.numpy 提供多维数组功能,而scipy提供了真正的矩阵 2.scipy的功能:最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶转换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算

实例代码和运行结果如下:

python 数据分析平台(python科学数据分析包)(10)

4.scikit-learn简单入门教程:

scikit-learn有什么用?

这是一个机器学习库,包括数据预处理、分类、回归、聚类和模型分析

创建一个机器学习的模型

实例代码和结果截图如下:

python 数据分析平台(python科学数据分析包)(11)

python 数据分析平台(python科学数据分析包)(12)

今天的内容主要是跟大家介绍这些数据科学包模块的一些入门的概念和一些简单的操作实例,学完上面这些,对这些数据科学包也有初步的认知了。

今天的内容到此就结束了,喜欢的朋友可以关注一下【python是一个时代】,更多精彩内容等着你,也可以转发给需要学习的朋友学习学习,希望今天的内容对读者有所帮助。

纸上得来终觉浅,绝知此事要躬行

——【python是一个时代】

,