覆盖主要内容
版本: 6.1.0

兰州二手房房价预测

案例介绍

通过对房天下兰州二手房数据构建房价预测模型,实现二手房房价的预测分析。

数据集介绍

数据集下载:house-handler.csv

案例操作

为了实现对兰州二手房的房价预测,我们需要构建以下工作流:

1、拖动"加载文件"控件到画布中,单击控件,选择"house-handler.csv"上传,上传后控件会显示数据基本信息,案例中的数据集包含5894个实例,15个特征,包含4.8%的缺失值,详细内容如下图所示:

2、拖动"编辑属性类型"控件到画布中,数值类型只保留【建筑面积】、【单价】、【总价】三个字段,其余字段全部设置为离散类型。具体配置如下:

3、创建完属性后,需要将刚创建的属性配置为待预测的目标属性。拖动"属性选择"控件到画布中,将总价从【特征属性】中移动到【目标属性】中,剩余的属性作为【特征属性】用来训练模型。具体配置如下:

4、完成模型构建必要属性的选择后,选择抽样得到的数据用于建模,剩余的数据用于评估模型好坏。拖动"数据抽样"控件到画布中,选择【交叉验证】,具体参数信息如下:

5、我们选择两个可用于回归任务的模型对数据进行建模,分别拖动"线性回归"、"决策树"控件到画布中。其中,"线性回归"控件中选择"岭回归 (L2)"选项,配置如下:

6、"决策树"控件采用默认配置,配置如下;

配置完毕后,分别运行两个控件,完成模型构建。

7、拖动"预测"控件到画布中,连接了测试数据、"线性回归"、"决策树"两个模型后,采用默认的输出配置,运行后模型将把原始数据、类别预测值输出用于模型评估:

8、点击【查看预测结果】对模型预测结果进行查看,默认显示前500条:

9、拖动"测试和评分"控件到画布中,连接"数据抽样"控件的两个输出分别作为训练数据、测试数据,将"线性回归"、"决策树"作为两个模型输入,点击【查看结果】,选中【在测试集中测试】选项,将得到两个模型在回归任务上的相关评价指标,包括MSE、RMS、MAE等,具体信息如下图所示: