波士顿房价问题也是机器学习中的一个入门问题 , 这个模块中包含了500多条波士顿房价的数据 , 其中包括13个相关的因素 。类似于鸢尾花数据可视化的处理(参考博文鸢尾花数据进行可视化展示)的处理方式 , 我们先把的数据转换成我们熟悉的DF数据 , 这一次 , 我们是用自带的库中的方法来绘制散点图 。具体的代码如下所示 , 其中用到了一些的技巧 , 总结如下:
【波士顿房价问题可视化:散点图感受价格相关因素数据分布】1.双重for循环列表生成式生成二维的数据列表;
2.zip方法打包两个列表并且转换成字典类型;
3.的的数据创建与读取;
4.的绘图方法 。
文章插图
from sklearn import datasetsimport pandas as pdimport matplotlib.pyplot as pltimport mathboston = datasets.load_boston()factor_list = list(boston.feature_names)facvals = [ [boston.data[i][index] for i in range(len(boston.data))] for index in range(len(factor_list)) ]factor_list.append('TARGET')facvals.append(boston.target)factor_dict = dict(zip(factor_list,facvals))boston_df = pd.DataFrame(factor_dict, # columns = ['CRIM','CHAS','AGE','TARGET'],)def plot(strfac):x_axis = list(boston_df[strfac])y_axis = list(boston_df['TARGET'])plt.title(strfac)plt.ylabel('Price')plt.scatter(x_axis,y_axis,s=3)for i in range(len(factor_list)):index = i+1factor = factor_list[i]plt.subplot(3,5,index)plot(factor)plt.show()
我们最终生成了以下图形:
- 哭了,软件测试面试中十有八九会问到的问题,后悔没有早知道
- 解决 Ubuntu cherry键盘 三键同时按切换大写的问题
- Docker on WSL2: VmmemWSL 解决WSL2占用内存过多问题
- mybatis实现数据库乐观锁解决并发问题实践
- 哭了,软件测试面试中十有八九会问到的问题,后悔没有早知道。
- 二分类器解决多分类问题
- 关于使用Okhttp导致的证书信任问题
- php和html混合写 先执行哪个_2020五一建模:C题 饲料混合加工问题
- 王道机试 DP篇
- 浮点数float保留小数和四舍五入问题