# 1.为什么是扩散模型?

生成式AI最里程碑突破其实是GAN。GAN有一个问题是训练不稳定。这就激发研究者开始寻找新的生成模型。 那么,为什么扩散模型能够脱颖而出呢?

# 生成式AI假说

谈到生成式AI,本质上都是基于这样的一个假说:

样本(训练数据)是通过某种概率分布抽样出来的。生成式AI算法的目的就是求解这个概率分布。一旦找到这个概率分布,我们就可以随机从这个概率分布中进行采样,生成新的数据,这个过程就是生成过程,或者说是推理过程。

# 物理世界假说

我们重新回看我们的物理世界,按照爱因斯坦的说法:“宇宙最不可理解之处是它是可理解的。”,换成人话就是说,纷繁复杂的宇宙竟然存在基本的物理学原理。 通过最基本的物理学原理,物质演化出纷繁复杂的物体。

# 统计力学的本质

近代物理学的发展,让我们基本上理解了我们的物理环境的大致原理,即我们所看到的千变万化的现象,都是由最基本的几种力的作用所驱动生成的。

在传统的物理学中,有一门学问就是统计力学。统计力学的本质就是探索微观的粒子之间相互作用,如何形成宏观的现象。

爱因斯坦在1905年发表的布朗运动,在某种程度上揭开了这种神秘的现象背后的数学物理基础。 扩散模型也是一种布朗运动。它是物理世界中物质遵循熵增理论的一种解释。

# 生成式扩散模型是物理世界生成的模拟

我们说生成式扩散模型为什么会在AIGC中产生如此巨大的作用,从根源看,它实际上是对物理世界生成过程的模拟,也就是说本质上因为遵循了我们物理世界的规律,所以是可行的,也是稳定的。因为我们的物理世界的演化一定是按照某种最优化的方式在进行。