← 名词百科

Reparameterization Trick

分类:训练方法

Reparameterization Trick(重参数化技巧)解决了 VAE 训练中采样操作不可微的问题。

问题

VAE 需要从编码器输出的分布中采样来生成潜在变量:

z ∼ N(μ, σ²)   ← 采样操作不可微!梯度无法回传

解法

将随机采样拆解为确定性变换 + 独立随机噪声

原始: z = 从 N(μ, σ²) 采样        (不可微 ❌)
新:   z = μ + σ × ε              (可微 ✅)
      其中 ε ∼ N(0, I)           (独立于模型参数)

为什么可行

  • μ 和 σ 是由编码器输出的确定性值
  • ε 是独立于模型参数的随机噪声
  • 梯度可以沿 μ 和 σ 的路径反向传播到编码器

意义

重参数化技巧让 VAE 可以使用标准的 SGD/Adam 优化器进行端到端训练,无需复杂的蒙特卡洛梯度估计。