国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

最優(yōu)傳輸問題與Sinkhorn算法

這篇具有很好參考價(jià)值的文章主要介紹了最優(yōu)傳輸問題與Sinkhorn算法。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1 引言

最近看到一篇特征匹配相關(guān)的論文，思想是將特征匹配問題轉(zhuǎn)化為最優(yōu)傳輸問題求解，于是我去學(xué)習(xí)了一下最優(yōu)傳輸問題。
本文主要是對博文 Notes on Optimal Transport 的學(xué)習(xí)做一個(gè)記錄總結(jié)，該博文寫的不錯(cuò)，推薦閱讀。

2 例子：分甜點(diǎn)

文章作者以一個(gè)簡單的甜點(diǎn)分配例子引入了最優(yōu)傳輸問題。
向量 $\mathbf{r}=[3, 3, 3, 4, 2, 2, 2, 1]^{\top}$ 表示 $n = 8$ 個(gè)人需要的甜點(diǎn)數(shù)：
最優(yōu)傳輸問題與Sinkhorn算法
向量 $\mathbf{c}=[4, 2, 6, 4, 4]^{\top}$ 表示 $m = 5$ 種甜點(diǎn)的數(shù)量：

矩陣 $\mathbf{M}\in \mathbb{R}^{5\times 8}$ 表示每個(gè)人對各種甜點(diǎn)的偏好，尺度區(qū)間 $[? 2, 2]$ ，-2表示非常不喜歡，2表示非常喜歡：
最優(yōu)傳輸問題與Sinkhorn算法

我們的目標(biāo)，就是要根據(jù)甜點(diǎn)的數(shù)量，同時(shí)考慮每個(gè)人的需求和偏好，將所有甜點(diǎn)合理地分配到每個(gè)人手中。

3 最優(yōu)傳輸問題

最優(yōu)運(yùn)輸問題的目標(biāo)就是以最小的成本將一個(gè)概率分布轉(zhuǎn)換為另一個(gè)概率分布。上面的分甜點(diǎn)的目標(biāo)，用最優(yōu)傳輸問題的定義來說，就是將概率分布 $\mathbf{c}$ 以最小的成本轉(zhuǎn)換到概率分布 $\mathbf{r}$ 。
這就需要我們求得一個(gè)分配方案，由矩陣 $P\in \mathbb{R}^{n\times m}$ 表示，存儲每個(gè)人分得的每個(gè)甜點(diǎn)的情況。

根據(jù)現(xiàn)實(shí)條件，這個(gè)分配矩陣 $P$ 顯然具有以下約束：

分配的甜點(diǎn)數(shù)量不能為負(fù)數(shù)；
每個(gè)人的需求都要滿足，即 $P$ 的行和服從分布 $\mathbf{r}$ ；
每種甜點(diǎn)要全部分完，即 $P$ 的列和服從分布 $\mathbf{c}$ 。

于是在分布 $\mathbf{r}$ 、 $\mathbf{c}$ 約束下， $P$ 的解空間可以做如下定義：
$U(\mathbf{r}, \mathbf{c})=\left\{P \in \mathbb{R}_{>0}^{n \times m} \mid P \mathbf{1}_{m}=\mathbf{r}, P^{\top} \mathbf{1}_{n}=\mathbf{c}\right\} \tag 1$
PS：這是博文的原公式，這里我有個(gè)疑問，為什么 $P$ 的元素要求嚴(yán)格大于0，而不是大于等于0？希望有同學(xué)能夠解答我的疑惑（感謝）

如前面所述，我們希望最小化轉(zhuǎn)換成本，可以簡單地反轉(zhuǎn)偏好矩陣 $\mathbf{M}$ 的符號，就可以得到成本矩陣（cost matrix）。于是就有了最優(yōu)傳輸問題的公式化表示：
$d_{M}(\mathbf{r}, \mathbf{c})=\min _{P \in U(\mathbf{r}, \mathbf{c})} \sum_{i, j} P_{i j} M_{i j} \tag 2$

標(biāo)量 $d_{M}$ 也被稱為推土機(jī)距離（earth mover distance），因?yàn)樗梢越忉尀橹辽僖苿?dòng)多少“泥土”（成本）才能將一個(gè)土堆（分布）變成另一個(gè)土堆（分布）。

4 Sinkhorn算法

4.1 Sinkhorn距離

Sinkhorn距離是對推土機(jī)距離的一種改進(jìn)，在其基礎(chǔ)上引入了熵正則化項(xiàng)：
$d_{M}^{\lambda}(\mathbf{r}, \mathbf{c})=\min _{P \in U(\mathbf{r}, \mathbf{c})} \sum_{i, j} P_{i j} M_{i j}-\frac{1}{\lambda} h(P) \tag 3$
其中 $h(P)=-\sum{P_{ij}\log{P_{ij}}}$ 稱作 $P$ 的信息熵（information entropy）， $P$ 分布越均勻，信息熵越大。

熵正則化參數(shù) $\lambda$ 負(fù)責(zé)調(diào)整信息熵的影響程度， $\lambda$ 越大，信息熵的影響越小，最終結(jié)果受成本矩陣的影響更大，即更多地考慮每個(gè)人的喜好；反之，最終結(jié)果則更傾向于均勻分配，每種甜點(diǎn)將平均分配給每個(gè)人。

4.2 算法流程

新增的熵正則化項(xiàng)似乎讓問題更加難以優(yōu)化，但Sinkhorn算法提供了一種簡單且有效的方法應(yīng)對這一問題，Sinkhorn算法認(rèn)為，最優(yōu)分配矩陣 $P^*_\lambda$ 的元素應(yīng)該具有如下形式：
$(P^*_\lambda)_{ij}=\alpha_i \beta_j e^{-\lambda M_{ij}} \tag 4$
其中正是 $\alpha_1,...,\alpha_n$ 和 $\beta_1,...,\beta_n$ 使得 $P^*$ 滿足分配矩陣的三個(gè)約束。如何推導(dǎo)出這一形式可以參考SuperGlue中的最優(yōu)傳輸算法詳解一文。

具體流程如下：

給定： 代價(jià)矩陣 $M$ , 分布 $\mathbf{r}$ , 分布 $\mathbf{c}$ , 熵正則化參數(shù) $\lambda$
初始化： 分配矩陣 $P_\lambda=e^{-\lambda M}$
重復(fù)：

縮放行，使得 $P$ 的行和逼近分布 $\mathbf{r}$

縮放列，使得 $P$ 的列和逼近分布 $\mathbf{c}$

直到： 收斂

4.3 代碼實(shí)驗(yàn)

以下是Sinkhorn代碼實(shí)現(xiàn)：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt


r = np.array([3, 3, 3, 4, 2, 2, 2, 1])
c = np.array([4, 2, 6, 4, 4])
M = np.array(
    [[2, 2, 1, 0, 0], 
    [0, -2, -2, -2, -2], 
    [1, 2, 2, 2, -1], 
    [2, 1, 0, 1, -1],
    [0.5, 2, 2, 1, 0], 
    [0, 1, 1, 1, -1], 
    [-2, 2, 2, 1, 1], 
    [2, 1, 2, 1, -1]],
    dtype=float) 
M = -M # 將M變號，從偏好轉(zhuǎn)為代價(jià)

def compute_optimal_transport(M, r, c, lam, eplison=1e-8):
    """
    Computes the optimal transport matrix and Slinkhorn distance using the
    Sinkhorn-Knopp algorithm

    Inputs:
        - M : cost matrix (n x m)
        - r : vector of marginals (n, )
        - c : vector of marginals (m, )
        - lam : strength of the entropic regularization
        - epsilon : convergence parameter

    Outputs:
        - P : optimal transport matrix (n x m)
        - dist : Sinkhorn distance
    """
    n, m = M.shape  # 8, 5
    P = np.exp(-lam * M) # (8, 5)
    P /= P.sum()  # 歸一化
    u = np.zeros(n) # (8, )
    # normalize this matrix
    while np.max(np.abs(u - P.sum(1))) > eplison: # 這里是用行和判斷收斂
        # 對行和列進(jìn)行縮放，使用到了numpy的廣播機(jī)制，不了解廣播機(jī)制的同學(xué)可以去百度一下
        u = P.sum(1) # 行和 (8, )
        P *= (r / u).reshape((-1, 1)) # 縮放行元素，使行和逼近r
        v = P.sum(0) # 列和 (5, )
        P *= (c / v).reshape((1, -1)) # 縮放列元素，使列和逼近c(diǎn)
    return P, np.sum(P * M) # 返回分配矩陣和Sinkhorn距離

我們來看看在不同 $\lambda$ 下，得到的分配矩陣有什么特點(diǎn)：

lam = 0.1

P, d = compute_optimal_transport(M,
        r,
        c, lam=lam)

partition = pd.DataFrame(P, index=np.arange(1, 9), columns=np.arange(1, 6))
ax = partition.plot(kind='bar', stacked=True)
print('Sinkhorn distance: {}'.format(d))
ax.set_ylabel('portions')
ax.set_title('Optimal distribution ($\lambda={}$)'.format(lam))

最優(yōu)傳輸問題與Sinkhorn算法

可以看到每個(gè)人分配得到的甜點(diǎn)基本上都符合初始甜點(diǎn)的分布比例 $\mathbf{c}=[4, 2, 6, 4, 4]^{\top}$ 。

試著調(diào)大 $\lambda$ ：
最優(yōu)傳輸問題與Sinkhorn算法
可以看到最終的分配向每個(gè)人的偏好靠攏了。文章來源地址http://www.zghlxwxcb.cn/news/detail-434851.html

到了這里，關(guān)于最優(yōu)傳輸問題與Sinkhorn算法的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

基于 ARM SoC 的視頻傳輸系統(tǒng)設(shè)計(jì)（10-01-01）引言
新芯設(shè)計(jì)：專注，積累，探索，挑戰(zhàn) ??對于《基于 SoC 的卷積神經(jīng)網(wǎng)絡(luò)車牌識別系統(tǒng)設(shè)計(jì)》這個(gè)極具競爭的項(xiàng)目而言，其主要是通過 CPU 軟核 IP 在純 FPGA 平臺上構(gòu)建一個(gè) AI SoC 卷積神經(jīng)網(wǎng)絡(luò)車牌識別系統(tǒng)，其中，縮放、填充層、卷積層、ReLU、池化層、全連接層 IP 都是 V
2024年01月25日
瀏覽(19)
【算法設(shè)計(jì)與分析】分治法（最近點(diǎn)對問題）
目錄實(shí)驗(yàn)?zāi)康?實(shí)驗(yàn)內(nèi)容與結(jié)果蠻力法求解分治法求解實(shí)驗(yàn)總結(jié) （1）掌握分治法思想。（2）學(xué)會最近點(diǎn)對問題求解方法。算法過程：遍歷n個(gè)點(diǎn)與剩余n-1個(gè)點(diǎn)之間的距離，在計(jì)算點(diǎn)對距離時(shí)不斷更新最短距離的值，遍歷完所有點(diǎn)對后即可求得最短點(diǎn)對距離。偽代碼：復(fù)
2024年02月08日
瀏覽(22)
最優(yōu)化：建模、算法與理論（典型優(yōu)化問題
4.1.1 基本形式和應(yīng)用背景再次說明一下，其實(shí)這本書很多的內(nèi)容之前肯定大家都學(xué)過，但是我覺得這本書和我們之前學(xué)的東西的出發(fā)角度不一樣，他更偏向數(shù)學(xué)，也多一個(gè)角度讓我們?nèi)ダ斫?線性規(guī)劃問題的一般形式如下： min ? x ∈ R n c T x s . t . A x = b G x ≤ e (4.1.1) min_{x{
2024年02月09日
瀏覽(26)
分治法解二維的最近對問題，算法分析與代碼實(shí)現(xiàn)，蠻力法與分治法解決二維的最近對問題的區(qū)別
??【數(shù)據(jù)結(jié)構(gòu)與算法】專題正在持續(xù)更新中，各種數(shù)據(jù)結(jié)構(gòu)的創(chuàng)建原理與運(yùn)用?，經(jīng)典算法的解析?都在這兒，歡迎大家前往訂閱本專題，獲取更多詳細(xì)信息哦?????? ??本系列專欄 - ?數(shù)據(jù)結(jié)構(gòu)與算法_勾欄聽曲_0 ??歡迎大家 ??? ?點(diǎn)贊?? ?評論?? ?收藏?? ??個(gè)人主
2024年02月04日
瀏覽(25)
計(jì)算機(jī)算法分析與設(shè)計(jì)（14）---貪心算法(會場安排問題和最優(yōu)服務(wù)次序問題)
?假設(shè)在足夠多的會場里安排一批活動(dòng)，并希望使用盡可能少的會場。設(shè)計(jì)一個(gè)有效的貪心算法進(jìn)行安排。數(shù)據(jù)輸入：第 1 1 1 行中有一個(gè)整數(shù) n n n ，表示有 n n n 個(gè)待安排的活動(dòng)。接下來的 n n n 行中，每行有 2 2 2 個(gè)正整數(shù)，分別表示 n n n 個(gè)待安排的活動(dòng)的開始時(shí)間和結(jié)束
2024年02月02日
瀏覽(19)
【算法設(shè)計(jì)與分析】C++獨(dú)立任務(wù)最優(yōu)調(diào)度問題
一、問題描述: ? 用2臺處理機(jī)A和B處理n個(gè)作業(yè)。設(shè)第i個(gè)作業(yè)交給機(jī)器A處理時(shí)需要時(shí)間ai，若由機(jī)器B來處理，則需要時(shí)間bi。由于各作業(yè)的特點(diǎn)和機(jī)器的性能關(guān)系，很可能對于某些i，有aibi，而對于某些j,j≠i，有ajbj。既不能將一個(gè)作業(yè)分開由2臺機(jī)器處理，也沒有一臺機(jī)器能同
2024年02月11日
瀏覽(19)
深度學(xué)習(xí)求解稀疏最優(yōu)控制問題的并行化算法
問題改編自論文An FE-Inexact Heterogeneous ADMM for Elliptic Optimal Control Problems with L1-Control Cost { min ? y ( μ ) , u ( μ )
2024年02月07日
瀏覽(21)
小米妙享中心加載失敗電腦能發(fā)現(xiàn)手機(jī)，手機(jī)能發(fā)現(xiàn)電腦，無法打開鏡像畫面，無法打開最近文件，能夠看到但是無法打開，無法流轉(zhuǎn)應(yīng)用，無法共享屏幕
????????本人是小米筆記本PRO14銳龍版WIN11系統(tǒng)，手機(jī)是小米14pro，電腦剛買來的時(shí)候都是可以正常在電腦投屏的，最近投屏總是失敗報(bào)錯(cuò)，查了很久才解決這個(gè)問題可以正常投屏，所以發(fā)出來跟大家分享一下，以作參考。 ? ? ? ? 首先要保證電腦上安裝了小米妙享的最新
2024年02月04日
瀏覽(238)
Java使用遺傳算法，尋找十滴水問題的最優(yōu)解
近期某手游出了個(gè)活動(dòng)，經(jīng)確認(rèn)發(fā)現(xiàn)本質(zhì)為十滴水游戲。簡單說一下規(guī)則，棋盤大小通常為6x6，在游戲開始時(shí)，棋盤隨機(jī)有若干水珠，其大小范圍為1-4。點(diǎn)擊棋盤內(nèi)的一格，會消耗玩家持有的1個(gè)小水滴，同時(shí)使得該單元格的水珠大小+1。如果水珠大小超過4，則水珠發(fā)生爆炸
2024年02月20日
瀏覽(19)
【計(jì)算機(jī)算法】【圖論】【最優(yōu)匹配與點(diǎn)云對準(zhǔn)問題】最（極）大團(tuán)算法
團(tuán)與最大團(tuán)的定義圖頂點(diǎn)集的子集滿足任意兩個(gè)頂點(diǎn)相鄰，稱該子集是該圖的一個(gè)團(tuán)。圖的所有團(tuán)中頂點(diǎn)最多的，即最大的一個(gè)或多個(gè)，稱為圖的最大團(tuán)或極大團(tuán)。圖的最大團(tuán)的實(shí)際應(yīng)用問題 CVPR2023最佳論文之一用最大團(tuán)算法實(shí)現(xiàn)魯棒的點(diǎn)云對準(zhǔn)，有效解決外點(diǎn)問題。顧名
2024年03月15日
瀏覽(17)