利用函数计算,基本绘图函数、透视分析等基础方法 数据挖掘的分析基础( 二 )


二、基本绘图函数 1.常用绘图函数

利用函数计算,基本绘图函数、透视分析等基础方法  数据挖掘的分析基础

文章插图
是的基本绘画包,是的图形框架,类似于和R语言 。它是中最著名的绘图包,提供了一整套和相似的命令API,十分适合交互式地进行制图 。在绘制中文图形时,需要做一些基本设置 。
. as plt #基本绘图包
plt.[‘font.sans-serif’]=[‘KaiTi’]; #黑体
plt.[‘axes.’]=False #正常显示图中负号
plt.(=(5,4)); #图形大小
常用的绘图函数:
计数数据用途
bar()
条图
pie()
饼图
plot()
线图
hist()
直方图
1.1计数数据的基本统计图
条图
条图的高度可以是频数或频率,图的形状看起来一样,但是刻度不一样,画条图的函数是bar() 。在对分类数据作条图时,须先对原始数据分组,否则作出的不是分类数据的条图 。
饼图
对分类数据还可以用饼图描述 。饼图用于表示各类别的构成比情况,它以图形的总面积为100%,扇形面积的大小表示事物内部各组成部分所占的百分比 。
1.2计量数据的基本统计图
线图
线图可以显示随时间而变化的连续数据,主要用于显示在相等时间间隔下数据的趋势 。
直方图
直方图用于表示连续型变量的频数分布,常用于考察变量的分布是否服从某种分布类型,如正态分布 。图形以矩形的面几表示各组段的频数(或频率),各矩形的面几总和为总频数(或等于1) 。
散点图
散点图表示一个变量随另一个变量变化的大致趋势,据此可以选择合适的函数对数据点进行拟合 。
1.3图形参数设置 标题、标签、标尺及颜色
plt.xlim(),plt.ylim():设置横/纵坐标范围;
plt.(),plt.():设置坐标抽名称
plt.(),plt.():设置坐标轴刻度
参数用来控制图形的颜色,可简写为c,c=‘red’表示设置为红色 。
线型和符号 。
参数用来控制连线的线型(-:实现,–:虚线,.:点线)
参数用来控制符号的类型,例如,‘o’为绘制实心圆点图 。
绘制函数附加图形
使用高级绘画函数可以画出一幅新图,而低级绘图函数只能作用于已有的图形之上.
垂线:在纵坐标y处画垂直线(plt.axvline())水平线:在横坐标x处画水平线(plt.axhline())
文字函数
text(x,y,,…):在(x,y)处添加指定的文字 。
图例
绘制图形后,可使用()函数给图形加图例 。
1.4误差条图
误差条图是由代表及的线条组成,通常这些线条用于显示有关图中所显示的数据的标准差信息 。
1.5多图
在下,对象可以包含多个子图(Axes),可以使用函数()快速绘制,其调用形式如下: (,,)
利用函数计算,基本绘图函数、透视分析等基础方法  数据挖掘的分析基础

文章插图
2.基于的绘图
数据框有行标签、列标签及分组信息等 。
基本格式如下:
DataFrame.plot(kind='line')kind: 图形类'line':(default)#线图'bar':#垂直条图'barh' :#水平条图'hist' :#直方图'box':#箱线图'kde' :#核密度估计图'area' :#面积图'pie':#饼图'scatter':#散点图
2.1计量数据的绘图
2.2计数数据的绘图
二、数据的透视分析
数据透视分析通常是以透视表的形式进行的 。透视表是一种交互式的表,可以进行某些计算,如求和与计算等 。数据透视表可以动态地改变变量的布置,以便按照不同方式分析数据 。
1.一维频数分析
频数分析,又称’次数分析‘,数据的统计整理方式之一 。