2、数据格式(续)
在WEKA中,每一个横行称作一个实例(Instance),这与统计学中的一个样本或数据库中的一条记录相对应。每个竖行称为一个属性(Attribute),类似于统计学中的变量或数据库中的字段。整个表格也可以称为数据集(Dataset),在WEKA中,数据集呈现了属性之间的一种关系(Relation)。
在上图中,总共有14个实例、5个属性,并且关系名称被定义为“weather”。
WEKA采用的是ARFF(Attribute-Relation File Format)文件格式,这是一种ASCII文件。二维表格形式的数据存储为ARFF文件。以上图数据为例,数据文件可以在WEKA安装目录的“data”子目录下找到,这个文件就是weather.arff。