Rattle :基于R的数据挖掘工具:功能概览

的界面,依次排列的是菜单,工具栏和标签栏 。

Rattle :基于R的数据挖掘工具:功能概览

文章插图
1.的标签栏
一个完整的数据挖掘过程包括以下几个步骤(CRISP-DM,1996)
(1) 理解问题
(2) 理解数据
(3) 准备数据
(4) 建立模型
(5) 模型评估
(6) 运用
基于这个流程,开发了一个方便的标签栏,可以便捷的完成操作 。
这个标签栏从左到右依次排列,各自完成数据挖掘的一个相关步骤 。
Data:选择数据源,输入数据 。
:执行数据探索,理解数据分布 。
Test:提供各种统计检验 。
:变换数据的形式 。
:数据聚类,包括系统聚类,k-均值聚类,和双聚类() 。
:关联规则方法 。
Model:内容最丰富的一个标签 。包括多种方法:决策树,支持向量机,线性模型,
Rattle :基于R的数据挖掘工具:功能概览

文章插图
神经网络,随机森林,提升(Boost) 。
Rattle :基于R的数据挖掘工具:功能概览

文章插图
:模型评估,它会提供一个实际结果和预测结果进行比较的误差矩阵 。
Log:数据挖掘过程的纪录 。它可以给出所进行的操作的R代码,利用这个标签,可以学习R的数据挖掘过程,也可以把纪录以文本形式输出,在R 平台中实现R和的交互 。
2.的工具栏和菜单
工具栏上最主要的一个按钮是按钮(执行) 。所有的操作都要点击来完成(对应的快捷键是F2) 。
按钮,可以完成当前操作的格式化报告(以开放的标准ODT格式) 。
按钮,可以输出来自的各种对象,特别的,完成Moel标签的相关操作后,它会以PMML格式保存当前模型 。
【Rattle :基于R的数据挖掘工具:功能概览】工具栏和标签栏完成的大部分工作,使用菜单也可以完成 。菜单很平凡,特别要指出的一点是,菜单中的Use Cario这一项要选中,这样图形才会以图形设备的形式输出,否则,会作为R图形输出 。