2020 数据挖掘入门(浙江警察学院)1455284441 最新满分章节测试答案
本答案对应课程为:点我自动跳转查看
本课程起止时间为:2020-03-03到2020-04-18
本篇答案更新状态:已完结
【作业】第二讲 回归分析 上机实验四
1、 问题:对银行贷款拖欠率数据进行logistics回归,数据见附件中“bankloan.csv”。将数据分成训练集和测试机,用训练集构建回归模型并进行回归诊断和自变量选择,并利用构建好的模型对测试机进行预测。实验步骤如下:1)打开R软件,把bankloan.csv数据导入R中(数据见附件)。2)使用sample()把数据随机分成两个部分:一部分用于训练(80%);另一部分用于测试(20%)。3)使用glm()函数及训练数据构建logistic回归模型。4)使用step()函数对模型进行自变量选择。5)使用回归诊断相关诊断对模型进行异常值检验、多重共线性检验、误差自相关性检验。6)使用predict()函数对测试集进行预测,并把预测结果合并至测试数据集中。
评分规则: 【 按代码给分
】
第三讲 回归方法 第三讲测验
1、 问题:k最近邻法中,随着参数k的变大,最近邻分类器的偏差和方差将如何变化?
选项:
A:偏差增大,方差增大
B:偏差增大,方差减小
C:偏差减小,方差增大
D:偏差减小,方差减小
答案: 【偏差增大,方差减小】
2、 问题:分类树和回归树分别被用于预测什么类型的变量?
选项:
A:定性变量,定性变量
B:定性变量,定量变量
C:定量变量,定量变量
D:定量变量,定性变量
答案: 【定性变量,定量变量】
3、 问题:k最近邻法的基本要素有?
选项:
A:k的选择
B:观测类别
C:决策规则
D:距离度量
答案: 【k的选择;
决策规则;
距离度量】
4、 问题:在分类树中,哪些指标可以作为二叉分裂的准则。
选项:
A:RSS
B:分类错误率
C:基尼指数
D:互熵
答案: 【分类错误率;
基尼指数;
互熵】
5、 问题:在构建回归树的过程中,一般采用递归二叉分裂的方法来划分自变量空间。这种方法的贪婪性体现在构建树的每一过程中,“最优”分裂仅限于某一局部过程,而不是针对全局过程。
选项:
A:正确
B:错误
答案: 【正确】
6、 问题:在分类树中,节点的纯度越高,则互熵的值越大。
选项:
A:正确
B:错误
答案: 【错误】
分析:【在分类树中,节点的纯度越高,则互熵的值越小。】
7、 问题:k最近邻法具有显式的学习过程。
选项:
A:正确
B:错误
答案: 【错误】
8、 问题:一般,我们采用什么方法来估计逻辑斯蒂模型中的参数?
答案: 【极大似然】
9、 问题:在构建回归树的过程中,我们一般采用什么方法将自变量空间划分为J个矩形区域?
答案: 【递归二叉分裂】
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦