本站所有资源均为高质量资源,各种姿势下载。
Earth-Mover距离(EMD)是一种用于衡量两个概率分布之间差异的距离度量方法。它起源于最优运输理论,通过计算将一个分布转化为另一个分布所需的最小"工作量"来定义距离。
EMD的核心思想非常直观:想象两个分布分别代表两堆土堆,这个距离就是计算将第一堆土堆的形状搬运并重新塑造成第二堆土堆形状所需的最小工作量。这里的"工作量"通常定义为移动的土方量乘以移动距离的总和。
这种距离度量在多个领域有广泛应用,尤其适合比较形状或分布不完全重叠的情况。与简单的欧氏距离或KL散度相比,EMD能够更好地捕捉分布的整体形状特征。它在图像处理、计算机视觉和自然语言处理中都有重要应用,比如用于图像检索、文档相似度计算等场景。
EMD的计算涉及解决一个线性规划问题,虽然计算复杂度较高,但它提供了对分布差异更本质的刻画。当两个分布的总质量不同时,EMD还能通过归一化处理来保证距离度量的合理性。