机器学习复习

Podcast

Play an AI-generated podcast conversation about this lesson

Download our mobile app to listen on the go

Get App

Questions and Answers

机器学习的目标是什么？

减少训练样本的数量
最大化训练误差
使模型能适用于新样本 (correct)
提高模型对训练数据的适应性

哪种学习方法属于无监督学习？

聚类 (correct)
分类
回归
半监督学习

以下哪项用于评估模型的泛化能力？

损失函数
训练误差
留出法 (correct)
测试误差

以下哪一项是导致过拟合的原因？

模型复杂度过高 (B) Signup and view all the answers

在偏差-方差理论中，偏差指的是什么？

学习算法期望预测和真实结果的偏差 (A) Signup and view all the answers

怎样称呼对样本集进行随机采样后得到的训练集与测试集的划分方法？

自助法 (D) Signup and view all the answers

以下哪个概念与支持向量机有关？

决策边界 (C) Signup and view all the answers

K近邻算法的主要特点是什么？

在训练阶段没有显式的模型构建 (B) Signup and view all the answers

以下哪项是机器学习错误率的定义？

分类错误样本占总样本的比例 (B) Signup and view all the answers

在进行类别不平衡处理时，欠采样的主要目的是什么？

减少负例的样本数 (D) Signup and view all the answers

在机器学习中，模型评估的交叉验证法的过程是怎样的？

将数据分为k个部分，每次划分一部分作为测试集 (B) Signup and view all the answers

类别不平衡问题中，“过采样”主要是指什么？

增加正例样本 (D) Signup and view all the answers

支持向量机中用于寻找决策边界的算法是？

广义瑞利商 (D) Signup and view all the answers

支持向量回归（SVR）模型中，落入间隔带的样本是如何处理的？

不计算损失 (D) Signup and view all the answers

以下哪一项是条件概率的定义？

事件A在事件B发生后仍依赖于B的概率 (D) Signup and view all the answers

在强化学习中，智能体的奖励来自于哪个过程？

动作执行后环境的反应 (C) Signup and view all the answers

深度学习的三大核心问题不包括以下哪一项？

performance (A) Signup and view all the answers

在多臂老虎机问题中，e-贪婪算法的特点是什么？

随机选择动作的概率随时间减少 (B) Signup and view all the answers

香农信息量的单位是什么？

比特 (D) Signup and view all the answers

以下哪个算法并不属于多臂老虎机算法这一范畴？

随机森林算法 (B) Signup and view all the answers

哪个描述最符合对深度学习的定义？

利用神经网络从数据中学习模式 (B) Signup and view all the answers

在马尔可夫决策过程中，价值函数的作用是什么？

评价当前状态的奖励期望 (A) Signup and view all the answers

以下哪项不是特征空间的直接描述？

样本的线性叠加 (C) Signup and view all the answers

相对熵是用来衡量什么的？

两个随机分布的差距 (D) Signup and view all the answers

在深度学习中，输入层和输出层之间的隐藏层添加了什么？

非线性激活函数 (C) Signup and view all the answers

以下哪些选项表示强化学习中的状态转移概率？

下一状态只依赖于当前状态 (C) Signup and view all the answers

深度强化学习的主要特征是什么？

利用深度神经网络进行价值函数和策略近似 (D) Signup and view all the answers

马尔可夫决策过程的五元组中，不包括以下哪个因素？

特征集合 F (A) Signup and view all the answers

在动态规划中，策略评估的目标是？

输出每个状态的价值函数 (C) Signup and view all the answers

以下哪个方法属于无模型强化学习？

Q-learning (B) Signup and view all the answers

在历史数据的基础上更新价值函数的方法是？

经验回放 (B) Signup and view all the answers

对于时序差分学习，以下哪个陈述是正确的？

可以从不完整的轨迹中学习 (B) Signup and view all the answers

下面哪种策略评估的方法强调在每个步骤进行更新？

时序差分 (B) Signup and view all the answers

强化学习的主要目标是什么？

最大化期望奖励 (B) Signup and view all the answers

基于策略的方法有哪些优缺点？

收敛性好，但学习效率低 (A) Signup and view all the answers

关于ε-贪心和玻尔兹曼探索方法，下面哪个是合适的？

都是解决探索-利用窘境的方法 (B) Signup and view all the answers

在深度Q网络(DQN)中，如何增加算法的稳定性？

使用经验回放和双结构网络 (D) Signup and view all the answers

在强化学习中，以下哪个算法是基于价值的方法？

Q-learning (C) Signup and view all the answers

行为克隆算法的一个缺点是什么？

泛化能力差 (B) Signup and view all the answers

以下哪种方法属于基于策略的学习方法？

Sarsa算法 (A) Signup and view all the answers

逆强化学习算法的主要目标是什么？

从专家演示中学习奖励函数 (B) Signup and view all the answers

关于马尔可夫奖励过程和马尔可夫决策过程的区别，哪项描述是正确的？

马尔可夫决策过程由转移概率决定 (C) Signup and view all the answers

主成分分析（PCA）的主要目的是什么？

降维和去噪 (B) Signup and view all the answers

以下哪个算法不是原型聚类方法的代表？

DBSCAN (C) Signup and view all the answers

在聚类任务中，

簇内相似度和簇间相似度 (C) Signup and view all the answers

AdaBoost算法的主要特征是什么？

串行生成学习器并调整训练数据 (A) Signup and view all the answers

在决策树中，节点划分的目的是什么？

提高节点的纯度 (C) Signup and view all the answers

半朴素贝叶斯分类器出现在什么假设下？

仅依赖于一个其他属性 (D) Signup and view all the answers

支持向量机的解稀疏性意味着什么？

仅与支持向量有关 (B) Signup and view all the answers

密度聚类的基础假设是什么？

样本密度可以决定样本连接性 (C) Signup and view all the answers

集成学习的主要目的是什么？

结合多个学习器以完成学习任务 (B) Signup and view all the answers

决策树的剪枝方法主要用于解决什么问题？

过拟合 (C) Signup and view all the answers

在流形学习中，样本的局部特性是什么？

符合欧氏空间的性质 (C) Signup and view all the answers

在EM算法中，主要目标是什么？

最大化已观测数据的边际似然 (C) Signup and view all the answers

在聚类中，常用的相似距离指标不包括哪一个？

余弦距离 (C) Signup and view all the answers

Flashcards

机器学习目标

使得学到的模型能很好地适用于新样本，即拥有良好的泛化能力。

机器学习类型：监督学习

根据已知标签（目标值）训练模型，用于分类或回归任务。