. 这个能量函数我们可以用一个神经网络去代表它(但不限于神经网络)。
. 这个"概率分布" 是没有经过标准化(normalization)的(对 x 的积分不为1)。我们可以让它除以一个 使其标准化,但是这个积分通常是求不出来的,而且也不在我们这次的考虑范围内。
我们可以看出,如果 x 取自于原数据的分布(比如说,原数据是一堆苹果的图片,x 也是苹果的图片),那么 应该是一个比较大的值,换言之, 应该是一个比较小的值。反之亦然。
当我们有了如上的能量函数以后,我们可以利用朗之万动力学(Langevin dynamics)对其进行采样:
(比如说长相、肤色、发色等等), 我们针对每一个特征,都训练了其相应的能量函数 . 当我们要组合这些特征时(Conjunction),我们可以直接把相应的"概率分布"相乘:
所以我们对应的采样公式为:
除了组合这些特征以外,我们还有“或”运算:
和“非”运算:
和 有着相似的作用,所以去噪过程的公式:
和上面的朗之万公式是等价的。
这里论文中列举了两种运算,首先是“与”运算(AND):
我们有:
然后是“非”运算(NOT):
最后,迭代的方式即:
完。
B站公式编辑器经常抽风,如果遇到 tex parse error 之类的错误时,刷新一下页面一般就能解决。