文章

扩散模型的基本原理

扩散模型的基本原理

arXiv:2510.21890

摘要

本书聚焦于让扩散模型发展的基本原理,追溯其起源,并展示扩散模型的不同形式如何源于共同的数学思想。

扩散模型首先通过指定一个前向破坏过程,逐步将数据转化为噪声。该前向过程通过定义一系列的中间分布,将数据分布与简单的噪声分布联系起来。扩散模型的核心目标是构建另一个反向过程,该过程将噪声转换为数据,同时恢复前向破坏过程中定义的相同中间分布。

我们描述了三种互补的方法来形式化这一思想。

  • 变分视角:受变分自编码器(VAE)启发,
本文由作者按照 CC BY 4.0 进行授权