波士顿房价问题可视化:散点图感受价格相关因素数据分布

波士顿房价问题也是机器学习中的一个入门问题 , 这个模块中包含了500多条波士顿房价的数据 , 其中包括13个相关的因素 。类似于鸢尾花数据可视化的处理(参考博文鸢尾花数据进行可视化展示)的处理方式 , 我们先把的数据转换成我们熟悉的DF数据 , 这一次 , 我们是用自带的库中的方法来绘制散点图 。具体的代码如下所示 , 其中用到了一些的技巧 , 总结如下:
【波士顿房价问题可视化:散点图感受价格相关因素数据分布】1.双重for循环列表生成式生成二维的数据列表;
2.zip方法打包两个列表并且转换成字典类型;
3.的的数据创建与读取;
4.的绘图方法 。

波士顿房价问题可视化:散点图感受价格相关因素数据分布

文章插图
from sklearn import datasetsimport pandas as pdimport matplotlib.pyplot as pltimport mathboston = datasets.load_boston()factor_list = list(boston.feature_names)facvals = [ [boston.data[i][index] for i in range(len(boston.data))] for index in range(len(factor_list)) ]factor_list.append('TARGET')facvals.append(boston.target)factor_dict = dict(zip(factor_list,facvals))boston_df = pd.DataFrame(factor_dict, # columns = ['CRIM','CHAS','AGE','TARGET'],)def plot(strfac):x_axis = list(boston_df[strfac])y_axis = list(boston_df['TARGET'])plt.title(strfac)plt.ylabel('Price')plt.scatter(x_axis,y_axis,s=3)for i in range(len(factor_list)):index = i+1factor = factor_list[i]plt.subplot(3,5,index)plot(factor)plt.show()
我们最终生成了以下图形: