一、問題定義
1.1 二叉搜索樹
二叉搜索樹或者是一棵空樹,或者是具有下列性質(zhì)的二叉樹: 若它的左子樹不空,則左子樹上所有結(jié)點(diǎn)的值均小于它的根結(jié)點(diǎn)的值; 若它的右子樹不空,則右子樹上所有結(jié)點(diǎn)的值均大于它的根結(jié)點(diǎn)的值; 它的左、右子樹也分別為二叉搜索樹。
規(guī)定樹根為第0層,圓結(jié)點(diǎn)為數(shù)據(jù),方結(jié)點(diǎn)為數(shù)據(jù)之間的空隙。
1.2 概率分布
實(shí)際上每個數(shù)據(jù)出現(xiàn)的概率是不同的,給定序列 S = < x 1 , x 2 , . . . , x n > S=<x_1,x_2,...,x_n> S=<x1?,x2?,...,xn?>,構(gòu)造二叉搜索樹,形成了 n n n個結(jié)點(diǎn) x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1?,x2?,...,xn?,和 n + 1 n+1 n+1個空隙 ( x 0 , x 1 ) , ( x 1 , x 2 ) , . . . , ( x n ? 1 , x n ) , ( x n , x n + 1 ) (x_0,x_1),(x_1,x_2),...,(x_{n-1},x_n),(x_n,x_{n+1}) (x0?,x1?),(x1?,x2?),...,(xn?1?,xn?),(xn?,xn+1?),其中 x 0 = ? ∞ , x n + 1 = + ∞ x_0=-\infin,x_{n+1}=+\infin x0?=?∞,xn+1?=+∞
記 x x x在 x i x_i xi?出現(xiàn)的概率為 b i b_i bi?,在空隙 ( x i , x i + 1 ) (x_i,x_{i+1}) (xi?,xi+1?)的概率為 a i a_i ai?,則 S S S的存取概率分布為 P = < a 0 , b 1 , a 1 , b 2 , a 2 , . . . , b n , a n > P=<a_0,b_1,a_1,b_2,a_2,...,b_n,a_n> P=<a0?,b1?,a1?,b2?,a2?,...,bn?,an?>
1.3 檢索數(shù)據(jù)的平均時間
對于數(shù)據(jù)集 S = < x 1 , x 2 , . . . , x n > S=<x_1,x_2,...,x_n> S=<x1?,x2?,...,xn?>和存取概率分布 P = < a 0 , b 1 , a 1 , b 2 , a 2 , . . . , b n , a n > P=<a_0,b_1,a_1,b_2,a_2,...,b_n,a_n> P=<a0?,b1?,a1?,b2?,a2?,...,bn?,an?>:
規(guī)定樹根為第0層,結(jié)點(diǎn)
x
i
x_i
xi?在
T
T
T中的深度是
d
(
x
i
)
,
i
=
1
,
2
,
…
,
n
d(x_i), i=1,2,…,n
d(xi?),i=1,2,…,n,空隙
L
j
L_j
Lj?的深度為
d
(
L
j
)
,
j
=
0
,
1
,
…
,
n
d(L_j),j=0,1,…,n
d(Lj?),j=0,1,…,n,平均比較次數(shù)為:
m
(
T
)
=
∑
i
=
1
n
b
i
(
1
+
d
(
x
i
)
)
+
∑
j
=
0
n
a
j
d
(
L
j
)
m(T)=\sum_{i=1}^{n}b_i(1+d(x_i))+ \sum_{j=0}^{n}a_jd(L_j)
m(T)=i=1∑n?bi?(1+d(xi?))+j=0∑n?aj?d(Lj?)
例如,給定樹:
S = < 1 , 2 , 3 , 4 , 5 , 6 > S = < 1, 2, 3, 4, 5, 6 > S=<1,2,3,4,5,6>, P = < 0.04 , ? 0.1 ? , 0.01 , ? 0.2 ? , 0.05 , ? 0.2 ? , 0.02 , ? 0.1 ? , 0.02 , ? 0.1 ? , 0.07 , ? 0.05 ? , 0.04 > P = < 0.04, *0.1*, 0.01, *0.2*, 0.05,*0.2*, 0.02, *0.1*, 0.02, *0.1*,0.07, *0.05*, 0.04 > P=<0.04,?0.1?,0.01,?0.2?,0.05,?0.2?,0.02,?0.1?,0.02,?0.1?,0.07,?0.05?,0.04>( p x i p_{x_i} pxi??用**包圍)
則平均檢索時間為:
m ( T 1 ) = [ 1 × 0.1 + 2 × ( 0.2 + 0.05 ) + 3 × ( 0.1 + 0.2 + 0.1 ) ] + [ 3 × ( 0.04 + 0.01 + 0.05 + 0.02 + 0.02 + 0.07 ) + 2 × 0.04 ] = 2.51 m (T_1)= [1×0.1+2×(0.2+0.05) +3×(0.1+0.2+0.1)]+[3×(0.04+0.01+0.05+0.02+ 0.02+0.07)+2×0.04 ]= 2.51 m(T1?)=[1×0.1+2×(0.2+0.05)+3×(0.1+0.2+0.1)]+[3×(0.04+0.01+0.05+0.02+0.02+0.07)+2×0.04]=2.51
1.4 最優(yōu)二叉搜索樹問題
對于數(shù)據(jù)集 S = < x 1 , x 2 , . . . , x n > S=<x_1,x_2,...,x_n> S=<x1?,x2?,...,xn?>和存取概率分布 P = < a 0 , b 1 , a 1 , b 2 , a 2 , . . . , b n , a n > P=<a_0,b_1,a_1,b_2,a_2,...,b_n,a_n> P=<a0?,b1?,a1?,b2?,a2?,...,bn?,an?>,不同的樹的組織形式會產(chǎn)生不同的平均檢索時間,如何求一棵平均比較次數(shù)最少的二叉搜索樹?
二、算法
2.1 分析問題結(jié)構(gòu)
以 ( i , j ) (i,j) (i,j)為界劃分子問題:
令 S [ i , j ] = < x i , x i + 1 , … , x j > S [i, j] = < x_i , x_{i+1}, … , x_j > S[i,j]=<xi?,xi+1?,…,xj?>,存取概率分布: P = < a i ? , b i , a i , b i + 1 , . . . , b j , a j > P=<a_{i-},b_i,a_i,b_{i+1},...,b_j,a_j> P=<ai??,bi?,ai?,bi+1?,...,bj?,aj?>
2.2 建立遞推關(guān)系
假設(shè)以 x k x_k xk?作為樹的根,則樹被劃分為三部分:
左子樹: S [ i , k ? 1 ] , P [ i , k ? 1 ] S[ i, k?1], P[ i, k?1] S[i,k?1],P[i,k?1]
根: x k x_k xk?
右子樹: S [ k + 1 , j ] , P [ k + 1 , j ] S[ k+1, j ], P[ k+1, j ] S[k+1,j],P[k+1,j]
令 w [ i , j ] = ∑ p = i ? 1 j a p + ∑ q = i j b q {w[i,j]=\sum_{p=i-1}^{j}a_p+ \sum_{q=i}^{j}b_q } w[i,j]=∑p=i?1j?ap?+∑q=ij?bq?,表示 x i x_i xi?到 x j x_j xj?之間所有概率(數(shù)據(jù)和空隙)之和;設(shè) m [ i , j ] m[i,j] m[i,j]是相對于輸入 S [ i , j ] S[i,j] S[i,j]和 P [ i , j ] P[i,j] P[i,j]的最優(yōu)二叉搜索樹的平均比較次數(shù)
則可建立遞推方程:
m
[
i
,
j
]
=
min
?
i
≤
k
≤
j
{
m
[
i
,
k
?
1
]
+
m
[
k
+
1
,
j
]
+
w
[
i
,
j
]
}
1
≤
i
≤
j
≤
n
m
[
i
,
i
?
1
]
=
0
,
i
=
1
,
2
,
.
.
.
,
n
m[i,j]=\min_{i\leq k\leq j}\left \{ m[i,k-1]+m[k+1,j]+w[i,j] \right \} \quad 1\leq i\leq j\leq n \\ m[i,i-1]=0, \quad i=1,2,...,n
m[i,j]=i≤k≤jmin?{m[i,k?1]+m[k+1,j]+w[i,j]}1≤i≤j≤nm[i,i?1]=0,i=1,2,...,n
(1)為了不遺漏最優(yōu)解,所以需要從 x 1 x_1 x1?到 x k x_k xk?依次選取做根嘗試,選出最小值
(2) m [ i , k ? 1 ] m[i,k-1] m[i,k?1]表示以 x k x_k xk?做根的最優(yōu)左子樹的比較次數(shù)
(3) m [ k + 1 , j ] m[k+1,j] m[k+1,j]表示以 x k x_k xk?做根的最優(yōu)右子樹的比較次數(shù)
(4)對于給定的數(shù)據(jù) x x x,需要先與根 x k x_k xk?進(jìn)行比較后才可以進(jìn)入到左子樹或右子樹;而由于使用根 x k x_k xk?將左子樹和右子樹連接起來,子樹的每個結(jié)點(diǎn)高度均增加了一層,所以在比較次數(shù)上也要加1,所以 w [ i , j ] w[i,j] w[i,j]是由增加的左子樹的比較次數(shù)、增加的右子樹的比較次數(shù)、和根的比較次數(shù)之和
w [ i , j ] w[i,j] w[i,j]的證明:
由根
x
k
x_k
xk?引起的比較次數(shù)增加為:
2.3 自底向上計(jì)算
初始化:當(dāng)左子樹或右子樹為空時,其平均查找數(shù)為0
m
[
i
,
i
?
1
]
=
0
,
i
=
1
,
2
,
.
.
.
,
n
m[i,i-1]=0, \quad i=1,2,...,n
m[i,i?1]=0,i=1,2,...,n
不妨以
m
[
1
,
4
]
m[1,4]
m[1,4]來觀察:
m
[
1
,
4
]
=
m
i
n
{
m
[
1
,
0
]
+
m
[
2
,
4
]
+
w
[
1
,
4
]
k
=
1
m
[
1
,
1
]
+
m
[
3
,
4
]
+
w
[
1
,
4
]
k
=
2
m
[
1
,
2
]
+
m
[
4
,
4
]
+
w
[
1
,
4
]
k
=
3
m
[
1
,
3
]
+
m
[
5
,
4
]
+
w
[
1
,
4
]
k
=
4
m[1,4]=min\left\{\begin{matrix} m[1,0]+m[2,4]+w[1,4] & k=1\\ m[1,1]+m[3,4]+w[1,4] & k=2\\ m[1,2]+m[4,4]+w[1,4]& k=3\\ m[1,3]+m[5,4]+w[1,4]& k=4 \end{matrix}\right.
m[1,4]=min?
?
??m[1,0]+m[2,4]+w[1,4]m[1,1]+m[3,4]+w[1,4]m[1,2]+m[4,4]+w[1,4]m[1,3]+m[5,4]+w[1,4]?k=1k=2k=3k=4?
0 | 1 | 2 | 3 | 4 | |
---|---|---|---|---|---|
0 | NULL | NULL | NULL | NULL | NULL |
1 | 0 √ | √ | √ | √ | ※ |
2 | NULL | 0 | √ | ||
3 | NULL | NULL | 0 | √ | |
4 | NULL | NULL | NULL | 0 | √ |
5 | NULL | NULL | NULL | NULL | √ |
顯然,要計(jì)算一個值,我們需要計(jì)算它一行一列的數(shù)據(jù),因此確定計(jì)算順序:
2.4 追蹤最優(yōu)方案
構(gòu)造追蹤數(shù)組 R e c [ 1.. n , 1.. n ] Rec[1..n,1..n] Rec[1..n,1..n], R e c [ i , j ] Rec[i,j] Rec[i,j]表示 S [ i , j ] S[i,j] S[i,j]的根節(jié)點(diǎn) x k x_k xk?。
在計(jì)算 m [ i , j ] m[i,j] m[i,j]的過程中,選出最小的 k k k,記錄 R e c [ i , j ] = k Rec[i,j]=k Rec[i,j]=k
追蹤時,從 R e c [ 1 , n ] Rec[1,n] Rec[1,n]出發(fā),假設(shè) R e c [ 1 , n ] = k Rec[1,n]=k Rec[1,n]=k,則說明在 x k x_k xk?處進(jìn)行了分割,分為子樹 m [ 1 , k ] m[1,k] m[1,k]和 m [ k + 1 , n ] m[k+1,n] m[k+1,n],再分別查看 R e c [ 1 , k ] Rec[1,k] Rec[1,k]和 R e c [ k + 1 , n ] Rec[k+1,n] Rec[k+1,n]…
如此尋找直至對角線部分。
2.5 復(fù)雜度分析
時間復(fù)雜度 O ( n 3 ) O(n^3) O(n3)文章來源:http://www.zghlxwxcb.cn/news/detail-597272.html
空間復(fù)雜度 O ( n 2 ) O(n^2) O(n2)文章來源地址http://www.zghlxwxcb.cn/news/detail-597272.html
到了這里,關(guān)于【動態(tài)規(guī)劃】最優(yōu)二叉搜索樹——算法設(shè)計(jì)與分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!