本答案对应课程为:点我自动跳转查看
本课程起止时间为:2022-02-21到2022-05-31

【作业】强化学习板块Ⅰ-基础知识 课后习题

1、 问题:以下哪些方法有助于解决模型训练过程中的过拟合问题?A. 正则化B. DropoutC. Batch NormalizationD. 提前终止训练E. 梯度下降
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

2、 问题:隐马尔可夫模型三个基本问题以及相应的算法说法正确的是:A. 评估—前向后向算法B. 解码—维特比算法C. 学习—Baum-Welch算法D. 学习—前向后向算法
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

3、 问题:下面哪些是基于核的机器学习算法?A. Expectation MaximizationB. Radial Basis FunctionC. Linear Discrimimate AnalysisD. Support Vector Machine
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

4、 问题:以下哪些模型是分类模型:A. KNNB. Naïve BayesianC. KmeansD. Logistic Regression
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

5、 问题:以下描述错误的是:A. SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal margin classifier)B. 在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。C. 在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。D. 聚类分析可以看作是一种非监督的分类。
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

6、 问题:强化学习和监督学习、无监督学习的区别是什么?
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

7、 问题:强化学习适合解决什么样的问题?
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

8、 问题:值迭代和策略迭代的区别是什么?
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

9、 问题:MC和TD都是无偏估计吗?
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

10、 问题:简述on-policy和off-policy的区别。
评分规则: 【 作业仅供参考,根据自身学习情况结合课堂内容加深学习理解。

强化学习板块Ⅱ-表格型求解法 单元测验1

1、 问题:由数字5,6,7,9可以组成多少个没有重复数字的三位数
选项:
A:9
B:15
C:24
D:48
答案: 【24

2、 问题:以下属于生成模型的是
选项:
A:svm
B:随机森林
C:隐马尔科夫模型HMM
D:逻辑回归
答案: 【隐马尔科夫模型HMM

3、 问题:下列哪项关于模型能力的描述是正确的
选项:
A:隐藏层层数增加,模型能力一定增加
B:Dropout的比例增加,模型能力增加
C:学习率增加,模型能力增加
D:都不正确
答案: 【都不正确

4、 问题:某城市发生了一起汽车撞人逃跑事件,该城市只有两种颜色的车,蓝20%绿80%,事发时现场有一个目击者,他指证是蓝车,但是根据专家在现场分析,当时那种条件能看正确的可能性是80%,那么,肇事的车是蓝车的概率是多少?
选项:
A:80%
B:84%
C:50%
D:64%
答案: 【50%

5、 问题:以下选项中哪项不能有效解决过拟合?
选项:
A:增加样本数量
B:通过特征选择减少特征数量
C:训练更多迭代次数
D:采用正则化
答案: 【训练更多迭代次数

6、 问题:LR和SVM都可以处理分类问题,而且一般都用于处理______问题
答案: 【二分类

7、 问题:岭回归可以用于解决模型______问题
答案: 【过拟合

8、 问题:L1范数的定义为_
答案: 【向量各元素绝对值之和

9、 问题:K-NN算法在_的情况下效果最好
答案: 【样本较少但是典型性好

10、 问题:机器学习根据是否使用标签信息,可以分为__两大类
答案: 【监督学习和无监督学习

强化学习板块Ⅲ-深度强化学习基础 单元测验

1、 问题:关于Qlearning,以下说法正确的是
选项:
A:Qlearning是一种on policy算法
B:Qlearning是基于策略梯度的算法
C:Qlearning是基于模型的方法
D:以上都不对
答案: 【以上都不对

2、 问题:Qlearning通过()存储Q值
选项:
A:Q table
B:神经网络
C:近似函数
D:以上都不对
答案: 【Q table

3、 问题:关于神经网络,正确的是
选项:
A:神经网络是一种万能近似函数
B:神经网络不能解决空间问题
C:神经网络不能用于强化学习
D:以上都不对
答案: 【神经网络是一种万能近似函数

4、 问题:关于SARSA算法,以下说法正确的是
选项:
A:SARSA是on policy算法
B:SARSA是基于模型的算法
C:SARSA是基于策略梯度的算法
D:以上都不对
答案: 【SARSA是on policy算法

5、 问题:Q learning和SARSA相比,其不同之处在于
选项:
A:SARSA是on policy算法,Qlearning是off policy算法
B:SARSA比Q learning更高效
C:Qlearning能处理连续动作,SARSA不行
D:以上都不对
答案: 【SARSA是on policy算法,Qlearning是off policy算法

6、 问题:DQN是一种()
选项:
A:能处理连续动作问题的算法
B:on-policy算法
C:off-policy算法
D:以上都不对
答案: 【off-policy算法

7、 问题:DQN中,通过()保存Q值
选项:
A:神经网络
B:Q表
C:近似函数
D:以上都不对
答案: 【神经网络

8、 问题:Q learning和DQN的区别在于()
选项:
A:Qlearning能处理连续动作,DQN不能
B:Qlearning是off-policy,DQN是on-policy
C:DQN使用了神经网络和经验回放
D:以上都不对
答案: 【DQN使用了神经网络和经验回放

9、 问题:在DQN算法中,共有()个神经网络
选项:
A:1
B:2
C:3
D:4
答案: 【2

10、 问题:DQN算法的优势不正确的是
选项:
A:避免穷举计算
B:提高时间效率
C:提高空间效率
D:以上都不对
答案: 【以上都不对

11、 问题:关于DQN的优点,以下错误的是
选项:
A:通用性强
B:端到端的训练
C:容易获取各种训练样本

本门课程剩余章节答案为付费内容
本文章不含期末不含主观题!!
本文章不含期末不含主观题!!
支付后可长期查看
有疑问请添加客服QQ 2356025045反馈
如遇卡顿看不了请换个浏览器即可打开
请看清楚了再购买哦,电子资源购买后不支持退款哦

   

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注