数据分析实战一、城镇居民人均可支配收入的计算

任务
给出2000年-2019年全国以及各个省份的城镇居民人均收入数据(见资源分享),计算给出的起始年份到截止年份之间全国以及各个省份的城镇居民人均收入的平均数 。
示例
计算起始年份2011至截止年份2016的全国以及各个省份的城镇居民人均收入的平均数
计算得到的27612.59即为全国居民人均收入的平均数,以此类推可计算出各个省份的平均数 。
题解 1、调库
import numpy as npimport pandas as pd
2、读取文件

数据分析实战一、城镇居民人均可支配收入的计算

文章插图
data = http://www.kingceram.com/post/pd.read_csv("./Desktop/数据.csv",encoding='gbk')
注意点:
csv、tsv、txt:pd.()
excel:pd.()
mysql:pd.()
pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=False, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, skip_footer=0, doublequote=True, delim_whitespace=False, as_recarray=False, compact_ints=False, use_unsigned=False, low_memory=True, buffer_lines=None, memory_map=False, float_precision=None)
具体内容参考官网 。
3、查看数据类型
data.dtypes
都为类型,而需要得出的结果也是类型,那就不需要转变数据类型 。若所给的数据为字符串型,则需要用下面的函数转换(常会用到)
data.astype('float64')#表格转化为float类型
4、思路分析
遍历解决 。两个for循环 。
一个for用来遍历需要求得起始年份和截止年份,一个for用来遍历全国以及各个省 。
for i in range(20,data['起始年份'].size):#20指的是从第21行开始遍历,因为前20行没有数据,data['起始年份'].size指的是起始年份这一列数据的大小(即所有需要求的数据数目 。)data.iloc[i] = data.loc[(data['年份']>=data['起始年份'][i])&(data['年份']<=data['截止年份'][i]),'全国':].mean()
5、保存数据
data.to_csv("./Desktop/答案.csv",encoding='gbk')
完整代码
【数据分析实战一、城镇居民人均可支配收入的计算】import numpy as npimport pandas as pddata = http://www.kingceram.com/post/pd.read_csv("数据.csv",encoding='gbk')for i in range(20,data['起始年份'].size):data.iloc[i] = data.loc[(data['年份']>=data['起始年份'][i])&(data['年份']<=data['截止年份'][i]),'全国':].mean()data.to_csv("./Desktop/答案.csv",encoding='gbk')