机器学习复习
55 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

机器学习的目标是什么?

  • 减少训练样本的数量
  • 最大化训练误差
  • 使模型能适用于新样本 (correct)
  • 提高模型对训练数据的适应性

哪种学习方法属于无监督学习?

  • 聚类 (correct)
  • 分类
  • 回归
  • 半监督学习

以下哪项用于评估模型的泛化能力?

  • 损失函数
  • 训练误差
  • 留出法 (correct)
  • 测试误差

以下哪一项是导致过拟合的原因?

<p>模型复杂度过高 (B)</p> Signup and view all the answers

在偏差-方差理论中,偏差指的是什么?

<p>学习算法期望预测和真实结果的偏差 (A)</p> Signup and view all the answers

怎样称呼对样本集进行随机采样后得到的训练集与测试集的划分方法?

<p>自助法 (D)</p> Signup and view all the answers

以下哪个概念与支持向量机有关?

<p>决策边界 (C)</p> Signup and view all the answers

K近邻算法的主要特点是什么?

<p>在训练阶段没有显式的模型构建 (B)</p> Signup and view all the answers

以下哪项是机器学习错误率的定义?

<p>分类错误样本占总样本的比例 (B)</p> Signup and view all the answers

在进行类别不平衡处理时,欠采样的主要目的是什么?

<p>减少负例的样本数 (D)</p> Signup and view all the answers

在机器学习中,模型评估的交叉验证法的过程是怎样的?

<p>将数据分为k个部分,每次划分一部分作为测试集 (B)</p> Signup and view all the answers

类别不平衡问题中,“过采样”主要是指什么?

<p>增加正例样本 (D)</p> Signup and view all the answers

支持向量机中用于寻找决策边界的算法是?

<p>广义瑞利商 (D)</p> Signup and view all the answers

支持向量回归(SVR)模型中,落入间隔带的样本是如何处理的?

<p>不计算损失 (D)</p> Signup and view all the answers

以下哪一项是条件概率的定义?

<p>事件A在事件B发生后仍依赖于B的概率 (D)</p> Signup and view all the answers

在强化学习中,智能体的奖励来自于哪个过程?

<p>动作执行后环境的反应 (C)</p> Signup and view all the answers

深度学习的三大核心问题不包括以下哪一项?

<p>performance (A)</p> Signup and view all the answers

在多臂老虎机问题中,e-贪婪算法的特点是什么?

<p>随机选择动作的概率随时间减少 (B)</p> Signup and view all the answers

香农信息量的单位是什么?

<p>比特 (D)</p> Signup and view all the answers

以下哪个算法并不属于多臂老虎机算法这一范畴?

<p>随机森林算法 (B)</p> Signup and view all the answers

哪个描述最符合对深度学习的定义?

<p>利用神经网络从数据中学习模式 (B)</p> Signup and view all the answers

在马尔可夫决策过程中,价值函数的作用是什么?

<p>评价当前状态的奖励期望 (A)</p> Signup and view all the answers

以下哪项不是特征空间的直接描述?

<p>样本的线性叠加 (C)</p> Signup and view all the answers

相对熵是用来衡量什么的?

<p>两个随机分布的差距 (D)</p> Signup and view all the answers

在深度学习中,输入层和输出层之间的隐藏层添加了什么?

<p>非线性激活函数 (C)</p> Signup and view all the answers

以下哪些选项表示强化学习中的状态转移概率?

<p>下一状态只依赖于当前状态 (C)</p> Signup and view all the answers

深度强化学习的主要特征是什么?

<p>利用深度神经网络进行价值函数和策略近似 (D)</p> Signup and view all the answers

马尔可夫决策过程的五元组中,不包括以下哪个因素?

<p>特征集合 F (A)</p> Signup and view all the answers

在动态规划中,策略评估的目标是?

<p>输出每个状态的价值函数 (C)</p> Signup and view all the answers

以下哪个方法属于无模型强化学习?

<p>Q-learning (B)</p> Signup and view all the answers

在历史数据的基础上更新价值函数的方法是?

<p>经验回放 (B)</p> Signup and view all the answers

对于时序差分学习,以下哪个陈述是正确的?

<p>可以从不完整的轨迹中学习 (B)</p> Signup and view all the answers

下面哪种策略评估的方法强调在每个步骤进行更新?

<p>时序差分 (B)</p> Signup and view all the answers

强化学习的主要目标是什么?

<p>最大化期望奖励 (B)</p> Signup and view all the answers

基于策略的方法有哪些优缺点?

<p>收敛性好,但学习效率低 (A)</p> Signup and view all the answers

关于ε-贪心和玻尔兹曼探索方法,下面哪个是合适的?

<p>都是解决探索-利用窘境的方法 (B)</p> Signup and view all the answers

在深度Q网络(DQN)中,如何增加算法的稳定性?

<p>使用经验回放和双结构网络 (D)</p> Signup and view all the answers

在强化学习中,以下哪个算法是基于价值的方法?

<p>Q-learning (C)</p> Signup and view all the answers

行为克隆算法的一个缺点是什么?

<p>泛化能力差 (B)</p> Signup and view all the answers

以下哪种方法属于基于策略的学习方法?

<p>Sarsa算法 (A)</p> Signup and view all the answers

逆强化学习算法的主要目标是什么?

<p>从专家演示中学习奖励函数 (B)</p> Signup and view all the answers

关于马尔可夫奖励过程和马尔可夫决策过程的区别,哪项描述是正确的?

<p>马尔可夫决策过程由转移概率决定 (C)</p> Signup and view all the answers

主成分分析(PCA)的主要目的是什么?

<p>降维和去噪 (B)</p> Signup and view all the answers

以下哪个算法不是原型聚类方法的代表?

<p>DBSCAN (C)</p> Signup and view all the answers

在聚类任务中,

<p>簇内相似度和簇间相似度 (C)</p> Signup and view all the answers

AdaBoost算法的主要特征是什么?

<p>串行生成学习器并调整训练数据 (A)</p> Signup and view all the answers

在决策树中,节点划分的目的是什么?

<p>提高节点的纯度 (C)</p> Signup and view all the answers

半朴素贝叶斯分类器出现在什么假设下?

<p>仅依赖于一个其他属性 (D)</p> Signup and view all the answers

支持向量机的解稀疏性意味着什么?

<p>仅与支持向量有关 (B)</p> Signup and view all the answers

密度聚类的基础假设是什么?

<p>样本密度可以决定样本连接性 (C)</p> Signup and view all the answers

集成学习的主要目的是什么?

<p>结合多个学习器以完成学习任务 (B)</p> Signup and view all the answers

决策树的剪枝方法主要用于解决什么问题?

<p>过拟合 (C)</p> Signup and view all the answers

在流形学习中,样本的局部特性是什么?

<p>符合欧氏空间的性质 (C)</p> Signup and view all the answers

在EM算法中,主要目标是什么?

<p>最大化已观测数据的边际似然 (C)</p> Signup and view all the answers

在聚类中,常用的相似距离指标不包括哪一个?

<p>余弦距离 (C)</p> Signup and view all the answers

Flashcards

机器学习目标

使得学到的模型能很好地适用于新样本,即拥有良好的泛化能力。

机器学习类型:监督学习

根据已知标签(目标值)训练模型,用于分类或回归任务。

机器学习类型:无监督学习

在没有已知标签的情况下训练模型,用于聚类。

独立同分布(i.i.d)

样本之间相互独立,且来自同一分布。

Signup and view all the flashcards

奥卡姆剃刀原则

在多个假设与观察结果一致的情况下,选择最简单的假设。

Signup and view all the flashcards

过拟合

模型在训练集上表现很好,但在测试集上表现很差。

Signup and view all the flashcards

欠拟合

模型在训练集和测试集上都表现不好。

Signup and view all the flashcards

偏差-方差窘境

偏差和方差之间存在冲突,降低偏差往往会增加方差,反之亦然。

Signup and view all the flashcards

线性回归

使用一条直线来拟合数据点。

Signup and view all the flashcards

逻辑回归

用于分类问题的线性模型,输出为0-1之间的概率。

Signup and view all the flashcards

线性判别分析(LDA)

一种用于分类的线性降维方法,通过投影达到分类目的。

Signup and view all the flashcards

K近邻(KNN)

一种基于距离的分类和回归算法。

Signup and view all the flashcards

泛化误差

模型在所有数据上预测错误的期望值

Signup and view all the flashcards

留出法

将数据集划分为训练集和测试集,用于评估模型泛化性能。

Signup and view all the flashcards

交叉验证法

将数据集划分为多个子集,每个子集轮流作为测试集,用于评估模型泛化性能。

Signup and view all the flashcards

主成分分析(PCA)

一种降维技术,通过找到数据集中方差最大的方向来投影数据,最大化投影数据间的可分性,并最小化样本点到超平面的距离。

Signup and view all the flashcards

核化主成分分析(KPCA)

利用核技巧将线性降维方法扩展到非线性数据降维。

Signup and view all the flashcards

流形学习(manifold learning)

一种基于局部欧氏空间性质的降维方法,用于降维和数据可视化。

Signup and view all the flashcards

等度量映射(Isomap)

通过计算测地线距离来保持数据局部邻域结构的降维方法。

Signup and view all the flashcards

局部线性嵌入(LLE)

在降维后空间中保持邻域内线性关系的降维方法。

Signup and view all the flashcards

聚类任务

将数据集划分成不相交的子集(簇),目标是簇内相似度高,簇间相似度低。

Signup and view all the flashcards

k均值算法

一种原型聚类方法,通过最小化每个簇中样本点到簇中心的欧氏距离平方和来划分簇。

Signup and view all the flashcards

学习向量量化(LVQ)

一种原型聚类方法,使用标记数据辅助聚类。

Signup and view all the flashcards

高斯混合聚类

假设样本由高斯混合分布生成并进行聚类的算法。

Signup and view all the flashcards

DBSCAN

一种基于密度的聚类算法,通过邻域参数刻画样本分布紧密度。

Signup and view all the flashcards

AdaBoost

一种Boosting集成学习方法,通过重赋权法或重采样法提升基学习器的性能。

Signup and view all the flashcards

Bagging和随机森林

一种基于Bagging的集成学习方法,通过采样生成基学习器,提高泛化能力。

Signup and view all the flashcards

决策树

一种基于树形结构的分类或回归方法,通过节点划分提高节点纯度。

Signup and view all the flashcards

信息增益

用于决策树节点划分的度量标准之一,偏好数量较多的属性。

Signup and view all the flashcards

支持向量机-核函数

将样本从原始空间映射到更高维的特征空间,使线性不可分的数据在高维空间中线性可分。

Signup and view all the flashcards

支持向量机-软间隔

允许支持向量机在一些样本上不满足约束,使用hinge损失函数,缓解特征空间中线性不可分问题。

Signup and view all the flashcards

支持向量回归(SVR)

允许模型输出和实际输出间存在偏差,落入间隔带的样本不计算损失,从而使得模型获得稀疏性。

Signup and view all the flashcards

深度学习

利用神经网络从数据中学习模式,学习能力强,但需要大量数据进行训练。

Signup and view all the flashcards

多层感知机

在输入层和输出层之间加入隐藏层,每层的计算都由一个线性函数加一个非线性激活函数构成。

Signup and view all the flashcards

前馈神经网络

信息从输入层到输出层单向传播,没有循环反馈。

Signup and view all the flashcards

正则化

通过向模型损失函数中添加正则化项,防止模型过拟合。

Signup and view all the flashcards

香农信息量

用于刻画消除随机变量X在x处的不确定性所需的信息量的大小。

Signup and view all the flashcards

信息量的期望,描述随机变量的平均信息量。

Signup and view all the flashcards

联合熵

描述一对随机变量平均所需要的信息量。

Signup and view all the flashcards

相对熵(KL距离)

衡量两个随机分布的差距,当两个分布相同时,相对熵为0。

Signup and view all the flashcards

交叉熵

衡量估计模型与真实概率分布之间的差异。

Signup and view all the flashcards

互信息

在知道了Y的值以后X的不确定性的减少量,即Y的值透露了多少关于X的信息量。

Signup and view all the flashcards

强化学习

智能体通过与环境交互学习最佳策略,以最大化累积奖励。

Signup and view all the flashcards

马尔可夫性质

一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态。

Signup and view all the flashcards

贝尔曼方程

定义了当前状态与未来状态之间的关系,未来奖励的折扣总和加上即时奖励,就组成了贝尔曼方程。

Signup and view all the flashcards

Q-价值函数

在某一状态下执行某一动作的奖励期望,用于评价不同动作的价值。

Signup and view all the flashcards

马尔可夫决策过程(MDP)

一个用来描述智能体与环境交互的数学模型,包含状态集合、动作集合、状态转移概率、折扣因子和奖励函数。

Signup and view all the flashcards

状态价值函数 (V)

表示从一个状态开始,按照策略采取动作,能获得的未来累积奖励的期望。

Signup and view all the flashcards

动作价值函数 (Q)

表示在特定状态下执行特定动作,能获得的未来累积奖励的期望。

Signup and view all the flashcards

贝尔曼期望方程

描述了状态价值函数或动作价值函数与后续状态价值之间的关系,是解决MDP问题的核心方程。

Signup and view all the flashcards

动态规划(DP)

一种解决最优子结构和重叠子问题问题的算法,在MDP中用于求解最佳策略和状态价值函数。

Signup and view all the flashcards

策略迭代

通过不断迭代策略,最终得到一个最佳策略的方法,需要知道环境模型。

Signup and view all the flashcards

价值迭代

通过不断迭代状态价值函数,最终得到一个最佳策略的方法,需要知道环境模型。

Signup and view all the flashcards

蒙特卡洛方法

通过模拟大量轨迹并计算平均奖励来求解MDP问题,适用于有限长度的马尔可夫决策过程。

Signup and view all the flashcards

时序差分学习

结合了动态规划和蒙特卡洛方法的优点,直接从不完整的经验片段中学习,能够进行在线学习。

Signup and view all the flashcards

自举(Bootstrapping)

利用当前状态的价值估计来更新当前状态的价值,是强化学习中的一种重要技术。

Signup and view all the flashcards

ε-贪心策略

在大多数情况下选择最佳动作,但也以ε概率选择随机动作,用于平衡探索和利用。

Signup and view all the flashcards

深度Q网络(DQN)

一种基于价值的深度学习算法,通过神经网络学习动作价值函数,解决高维状态空间的MDP问题。

Signup and view all the flashcards

经验回放

将历史经验存储起来,并在训练过程中随机抽取样本训练模型,可以提高DQN的稳定性。

Signup and view all the flashcards

双结构网络

在DQN中使用两个神经网络,分别用于选择动作和评估动作价值,可以有效解决Q值高估的问题。

Signup and view all the flashcards

策略梯度方法

一种直接学习策略的方法,通过调整参数来优化策略,使期望奖励最大化。

Signup and view all the flashcards

Study Notes

机器学习复习

  • 机器学习旨在利用计算手段,通过经验改进系统性能,从数据中产生模型,用于新情况的判断。
  • 学习目标不同,机器学习可分为:分类(离散值,包括二分类和多分类)、回归(连续值)和聚类(无标记信息)。
  • 监督学习:分类、回归;无监督学习:聚类;半监督学习:两者结合。
  • 机器学习目标:使模型适用于“新样本”,模型适应新样本的能力为泛化能力。
  • 机器学习通常假设样本空间中的样本服从“独立同分布”(i.i.d)。
  • 算法归纳偏好遵循“奥卡姆剃刀”原则:在多个假设都符合观察结果时,选择最简单的那个。
  • “没有免费的午餐定理”:一个算法在某些问题上优于另一个算法,则必然存在其他问题上另一个算法优于该算法;当所有场景出现的概率相同时,总误差与学习算法无关。
  • 机器学习发展历程:推理期、知识期(专家系统)、学习期(符号主义、连接主义、统计学习)。
  • 错误率:错分样本占总样本比例;误差:样本真实输出与预测输出间的差异,分为:训练误差(训练集)、测试误差(测试集)、泛化误差(除训练集外的所有样本)。
  • 过拟合:学习器将训练样本学习得太好,将训练样本本身的特点当作所有样本的普遍性质,导致泛化性能下降;欠拟合:对训练样本的普遍性质尚未学好。
  • 机器学习评估:泛化性能、时间开销、存储开销、可解释性等。评估方法:留出法、交叉验证法、自助法。
  • 性能度量:衡量模型泛化能力的评价标准,如错误率、精度。
  • 分类结果混淆矩阵:用于评估分类模型性能,包括真正例(TP)、假正例(FP)、真反例(TN)、假反例(FN)。

分类任务

  • 查准率:P = TP / (TP + FP)
  • 查全率:R = TP / (TP + FN)
  • F1 度量:F1 = 2 * P * R / (P + R)
  • 性能度量的三条曲线:P-R曲线、ROC曲线、代价曲线

线性模型

  • 表达式:f(x) = w^Tx + b
  • 优点:形式简单、易于建模、可解释性强。
  • 回归任务:线性回归。
  • 分类任务:二分类任务(对数几率回归、线性判别分析);多分类任务(1对1、1对多和多对多)。

回归任务(线性回归)

  • 目标:学得一个线性模型以尽可能准确地预测实值输出标记。
  • 属性处理:有序属性连续化,无序属性转换为K维变量。
  • 优化方法:最小二乘法(最小化平方损失)。

分类任务

  • 目标:建立函数将分类标记与线性回归模型输出联系起来。
  • 联系函数:理想的单位阶跃函数(不可导、不连续),替代的对数几率函数。
  • 对数几率回归 (Logistic Function),具有单调可微、任意阶可导等优点。
    • 本质:使用对数几率联系分类标记和模型输出。
    • 优点:无需假设数据分布、可获取类别的近似概率预测、可直接应用已有数值优化算法寻找最优解。
    • 求解方法:极大似然法、梯度下降法/牛顿法。

线性判别分析(LDA)

  • 目标:使同类样例的投影点尽可能接近,异类样例的投影点尽可能远离。
  • 方法:广义瑞利商。
  • 优化方法:奇异值分解。
  • 可被视为一种监督降维技术。

类别不平衡

  • 欠采样:去除一些反例。
  • 过采样:增加一些正例。
  • 阈值移动。

K近邻(KNN)

  • 方法:找到训练集中距离最近的k个样本,分类使用投票法,回归用平均法。
  • 特点:无显式训练过程,属于“懒惰学习”。

降维方法

  • 主成分分析(PCA) :最近重构性和最大可分性。

聚类任务

  • 目标:将数据集样本划分为不相交的子集(簇)。
  • 性能度量:簇内相似度高,簇间相似度低。
  • 外部指标:Jaccard 系数、FM 指数、Rand 指数
  • 内部指标:DB指数、Dunn 指数。
  • 距离度量:欧氏距离、曼哈顿距离、VDM、MinkovDM、加权距离等。

原型聚类

  • 基础假设:聚类结构能通过一组原型刻画。
  • 方法:k均值算法、学习向量量化算法、高斯混合聚类算法。

集成学习

  • 方法:构建并结合多个学习器完成学习任务。
  • 特点:个体学习器存在强依赖性/不依赖性;串行/并行方式生成;通过调整训练数据进行学习。
  • 结合策略:数值型输出:简单平均/加权平均;分类输出:绝对多数投票/相对多数投票/加权投票。

决策树

  • 目标:产生泛化能力强的决策树。
  • 节点划分方法:信息增益、增益率、基尼指数。
  • 连续值处理:二分法。
  • 过拟合解决方法:预剪枝、后剪枝。

贝叶斯决策论

  • 基于已知相关概率和误判损失,选择最优类别标记。
  • 目标:最小化总体风险。
  • 生成模型:计算后验概率 P(c|x)。

朴素贝叶斯分类器

  • 属性条件独立性假设,计算效率高。
  • 应用场景:速度要求高、数据更替频繁、数据不断增加。

半朴素贝叶斯分类器

  • 属性在类别之外最多仅依赖一个其他属性。

贝叶斯网络

  • 用有向无环图表示属性依赖关系。
  • 使用条件概率表描述联合概率分布。
  • 评估方法:最小描述长度
  • 近似推断方法:吉布斯采样

支持向量机(SVM)

  • 核函数:将数据映射到更高维的特征空间,计算内积。
    • 线性核
    • 多项式核
    • 高斯核
    • 拉普拉斯核
    • Sigmoid 核
  • 软间隔:允许一些样本不满足约束条件。
  • 支持向量回归(SVR):允许预测值和实际值之间存在偏差,落在间隔带内的样本不计算损失。

神经网络

  • 前馈神经网络:前向传播、反向传播。
  • 卷积神经网络(CNN):局部连接、权值共享、下采样特征。
  • 激活函数:sigmoid、tanh、ReLU、PReLU。
  • 正则化:dropout,模型参数范数惩罚
  • 模型优化:梯度下降算法(批量梯度下降、随机梯度下降、批量随机梯度下降)、优化函数

循环神经网络(RNN)

  • 长短时记忆网络(LSTM) :解决长期依赖问题
  • 门限循环单元(GRU)

Transformer

  • encoder-decoder 模型
  • 注意力机制
  • Token化
  • Embedding
  • 多头自注意力(MHSA)
  • 多层感知机(MLP)

强化学习

  • 智能体、环境、状态、动作、奖励。
  • 策略、价值函数。
  • 模型、策略学习。
  • 探索-利用困境
  • 基于价值方法(Q-learning, DQN)
  • 基于策略方法(策略梯度)
  • 深度强化学习
  • 多臂老虎机

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

机器学习复习_1122 PDF

Description

本测验涵盖机器学习的基础知识,包括分类、回归和聚类等学习目标。它探讨监督学习、无监督学习的特点,并介绍相关的理论和误差概念。通过这个测验,您将能够加深对机器学习原理的理解。

More Like This

Use Quizgecko on...
Browser
Browser