Skip to content

Latest commit

 

History

History
1235 lines (590 loc) · 30.5 KB

File metadata and controls

1235 lines (590 loc) · 30.5 KB

MLAPP 新手友好指南 · 加强版 v2(每章含“本章总结(一段话)”)

结构:为什么重要|入门先做什么|直觉图景|最小例子|常见误区|术语小抄|什么时候用|读完你应该会|往后怎么学|本章总结(一段话)

第 1 章 Introduction

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章用非技术化的方式定义了机器学习、区分了监督/无监督等任务,并用KNN、线性/逻辑回归、交叉验证与过拟合等直观概念搭起全书支架:从数据到模型再到泛化评估。它的目的不是给出细节,而是建立一条‘不确定性下做推断与决策’的思维主线,后续各章都在这条主线上展开。

第 2 章 Probability

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章回顾了概率论与信息论的基本语法:随机变量与常见分布、联合/条件/边缘与Bayes规则、熵/KL/互信息,以及蒙特卡罗近似和中心极限定理。它为后文提供统一的量化语言,使我们能表达不确定性、计算后验与信息量并用数值方法近似难解积分。

第 3 章 Generative models (discrete)

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章聚焦离散数据的生成式建模与朴素贝叶斯分类,以Beta–Binomial与Dirichlet–Multinomial等共轭模型为主线,展示‘似然×先验→后验→后验预测’的闭式推断流程,并在文本分类中讨论平滑、互信息选特征与数值稳定(log-sum-exp)。

第 4 章 Gaussian models

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章系统化多元高斯(MVN)族:条件/边缘仍为高斯、精度矩阵与条件独立关系、Wishart先验,以及线性判别分析(LDA/QDA)的判别式应用。它强调高斯族的解析友好性,既可做判别分类,也支撑线性高斯系统与卡尔曼滤波等后续内容。

第 5 章 Bayesian statistics

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章构建贝叶斯统计学的操作体系:如何总结后验(MAP/区间)、如何比较模型(边际似然与Bayes因子,体现Occam剃刀)、如何选与设先验(非信息/稳健/混合),以及层次与经验贝叶斯在多任务与小样本中的优势,并以贝叶斯决策理论收束。

第 6 章 Frequentist statistics

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章从频率学派视角讨论估计量的采样分布与性质(无偏/一致/最小方差),阐释偏差—方差权衡,并把经验风险最小化/结构风险最小化、正则化与交叉验证等工程实践串成一体,同时提醒对p值与置信区间误读等常见陷阱保持警惕。

第 7 章 Linear regression

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章以线性回归为例阐明‘模型=几何投影’的直觉,证明OLS=高斯噪声下的MLE,并讨论稳健回归与岭回归的正则化效果、数值稳定与证据最大化的超参选择,再给出贝叶斯线性回归的后验与预测,形成从经典到贝叶斯的一条连贯路径。

第 8 章 Logistic regression

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章给出逻辑回归/Softmax回归的规格与优化方法(Newton/IRLS/拟牛顿/在线SGD),讨论正则化与多类扩展,并用拉普拉斯等近似实现贝叶斯版本;同时回顾生成式与判别式分类器的取舍与缺失数据处理,确立工程分类的基础做法。

第 9 章 GLMs & Exponential family

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章把指数族与链接函数结合,构成统一的广义线性模型(GLM)框架,覆盖二项/泊松/序数等多种输出;在此框架下讨论ML/MAP/贝叶斯估计、Probit回归、层次/多任务与GLMMs,以及学习排序的点/对/列表方法与损失设计。

第 10 章 Directed graphical models

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章介绍有向图模型(Bayes网)及其条件独立与d-分离性质,以朴素贝叶斯、HMM与医疗诊断为例说明建模方式;随后给出板式记号、参数与结构学习、含缺失/潜变量的学习与推断方法,为后续EM与结构学习埋下伏笔。

第 11 章 Mixture models & EM

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章以混合模型为核心展示潜变量建模:高斯混合、Multinoulli混合、专家混合等,并系统推导EM算法(含在线与变体)及其理论动机;同时讨论不可识别性与初始化、模型选择(如成分数),以及在缺失数据与更复杂图模型中的应用。

第 12 章 Latent linear models (FA/PCA/ICA)

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章讨论线性潜因子模型:从经典PCA与SVD等价出发,发展到PPCA/FA的概率表达与EM拟合,再到选择潜维、处理缺失与ICA的非高斯独立成分分解;它统一了‘降维/可视化/去噪/源分离’的概率视角。

第 13 章 Sparse linear models

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章研究高维下的稀疏建模:频率派的L1正则(Lasso)及其算法与扩展(组/融合/弹性网、非凸正则),贝叶斯的稀疏先验与ARD/SBL机理,并连接稀疏编码、压缩感知与图像修补/去噪等应用,强调稀疏性带来的泛化、计算与可解释性红利。

第 14 章 Kernels & SVMs

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章系统梳理核函数与核技巧:把非线性问题隐式映射到高维以线性求解;给出核岭回归、KPCA、KDE/核回归与SVM(分类/回归)的训练与调参,并讨论如何选择C与核,及核方法与概率模型之间的联系与差异。

第 15 章 Gaussian processes

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章把高斯过程(GP)作为非参数贝叶斯的代表:由核定义协方差先验,通过条件高斯得到回归与分类的预测分布;随后讨论超参数学习与核设计、与线性模型/核方法/神经网络的联系,以及大数据下的稀疏与近似推断技术。

第 16 章 Adaptive basis / Trees / Boosting / NN

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章覆盖自适应基函数模型:决策树(生长/剪枝)与随机森林、GAM/MARS、Boosting 家族(Ada/Logit/梯度提升)及其函数梯度观点,再到前馈神经网络与反向传播、正则化与集成学习,并讨论黑箱模型的可解释化方法。

第 17 章 Markov & HMM

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章先述马尔可夫链与应用(语言模型、PageRank),再引入隐马尔可夫模型(HMM)的三类推断任务(过滤/平滑/解码)与前向、前后向、Viterbi等算法,讨论EM训练(Baum–Welch)、判别式训练、模型选择与多种结构扩展(半马尔可夫/层次/耦合等)。

第 18 章 State space models

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章以线性高斯状态空间模型为主线,给出卡尔曼滤波/平滑与EM学习及其数值稳定问题,并基于近似法扩展到非线性/非高斯(EKF/UKF/ADF);进一步介绍离散-连续混合SSM与多目标跟踪、故障诊断、经济预测等应用。

第 19 章 UGMs / CRFs / StructSVMs

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章转向无向图模型(MRF/CRF):先给出马尔可夫性质与势函数因子化,再举Ising/Potts/Hopfield/GMRF与Markov逻辑网络等例;随后讨论最大熵训练、伪似然/对比学习与特征诱导,系统介绍线性链CRF的训练与应用,以及结构SVM的概率与非概率两种视角。

第 20 章 Exact inference

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章聚焦精确推断:树上信念传播(串/并行)、变量消元与结点树算法及其复杂度;给出‘树宽’决定可计算性的核心洞见,并指出一般图上精确推断的不可 tractable 性,从而为变分与采样等近似方法提供动机。

第 21 章 Variational inference I

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章以变分推断为主题:把后验近似转化为最大化ELBO的问题,先推导均值场与结构化均值场,再给出VB/VBEM在高斯与线性回归中的示例,同时用局部二次与对数和指数/ Sigmoid 的上界构造可解的变分目标。

第 22 章 More VI / EP / MAP

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章继续展开近似推断:从循环BP的算法与理论(边缘多面体、自由能)出发,引出广义/凸BP;随后系统讲解期望传播(EP)的矩匹配思想与应用(如TrueSkill),并把焦点转到MAP状态估计的图割、线性规划松弛与双分解等优化工具。

第 23 章 Monte Carlo inference

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章讲解蒙特卡罗近似:从拒绝/重要性采样到序贯重要性与粒子滤波(退化与重采样、提议设计),并通过机器人定位、视觉跟踪与时间序列预测等例子展示其威力;同时引入Rao–Blackwell化与RBPF以降低方差或分解问题。

第 24 章 MCMC

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章系统化MCMC:Gibbs与Metropolis–Hastings、提议分布与自适应、阻塞/Collapsed以及辅助变量(切片、Pólya–Gamma)、HMC与退火/并行温度等加强技术;给出收敛诊断与精度评估,并介绍若干证据近似法。

第 25 章 Clustering

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章概览聚类方法与评估:相似度度量的选择、DP混合的贝叶斯非参范式、亲和传播与谱聚类、层次聚类(凝聚/分裂)及选择簇数的方法,并讨论双聚类/多视图等扩展,强调‘度量与评估优先于算法口味’。

第 26 章 Graphical model structure learning

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章讨论图模型的结构学习:相关/依赖网络、树结构(Chow–Liu与MAP森林)、DAG结构的精确与可扩展搜索、潜变量与缺失下的边际似然近似与结构EM、因果DAG与Simpson悖论解析、以及GGM/离散MRF的稀疏化学习(图Lasso/薄结点树)。

第 27 章 Discrete-data LVMs (LDA/RBM/etc.)

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章汇总离散观测的潜变量模型:从指数族PCA到LDA及其变体(相关/动态/监督/LDA-HMM),覆盖Gibbs/VB/在线VI拟合与主题数选择;在图与关系数据上,给出SBM/MMSBM/RTM与IRM;在推荐上,介绍PMF;并以RBM及其学习/应用收尾。

第 28 章 Deep learning

为什么重要(一句话)

  • 本章解释其在全书中的定位与价值。

入门先做什么(Skim / Focus / Skip)

  • 先看提要与例子,抓住主线,再决定是否细读推导。

直觉图景

  • 提供一个比喻或图景帮助理解关键概念。

最小例子(不写代码也能做)

  • 给出一个不写代码也能动手的最小练习。

常见误区

  • 列出新手最常犯的2–3个错误。

术语小抄

  • 罗列5–8个核心术语。

什么时候用(实践场景)

  • 指出最常见的落地场景。

读完你应该会

  • 列出完成本章后可检验的能力点。

往后怎么学(书内锚点)

  • 给出本书内的自然跳转锚点。

本章总结(一段话)

本章以早期深度学习为主题:深生成模型(DBN/DBM、深度自编码器/堆叠去噪AE)与深判别模型(深MLP/CNN),强调贪婪逐层预训练+微调的范式,并通过手写体、可视化/特征学习与检索等案例展示深度表示的优势与当时的实践路径。