国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列

2年前作者：存在morning分類：Toy博客閱讀(21)違法舉報

這篇具有很好參考價值的文章主要介紹了【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

廢話不多說，喊一句號子鼓勵自己：程序員永不失業(yè)，程序員走向架構(gòu)！本篇Blog的主題是【】，使用【】這個基本的數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)，這個高頻題的站點是：CodeTop，篩選條件為：目標公司+最近一年+出現(xiàn)頻率排序，由高到低的去?？蚑OP101去找，只有兩個地方都出現(xiàn)過才做這道題（CodeTop本身匯聚了LeetCode的來源），確保刷的題都是高頻要面試考的題。

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

名曲目標題后，附上題目鏈接，后期可以依據(jù)解題思路反復(fù)快速練習(xí)，題目按照題干的基本數(shù)據(jù)結(jié)構(gòu)分類，且每個分類的第一篇必定是對基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)的介紹。

最長重復(fù)子數(shù)組【MID】

線性DP問題再搞一道，最長重復(fù)子數(shù)組

題干

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

解題思路

原題解地址：A 、B數(shù)組各抽出一個前綴數(shù)組，單看它們的末尾項：

如果它們倆不一樣，則公共子數(shù)組肯定不包括它們倆。
如果它們倆一樣，則要考慮它們倆前面的子數(shù)組「能為它們倆提供多大的公共長度」。

繼續(xù)向前遞推的：

如果它們倆的前綴數(shù)組的「末尾項」不相同，由于子數(shù)組的連續(xù)性，前綴數(shù)組不能為它們倆提供公共長度
如果它們倆的前綴數(shù)組的「末尾項」相同，則可以為它們倆提供公共長度：至于提供多長的公共長度？這又取決于前綴數(shù)組的末尾項是否相同……

存在重復(fù)子問題和遞推的方法，可以用動態(tài)規(guī)劃解決?；氐筋}目，A 、B數(shù)組各抽出一個前綴子數(shù)組，單看它們的末尾項

如果它們倆不一樣——以它們倆為末尾項形成的公共子數(shù)組的長度為0：dp[i][j] = 0
如果它們倆一樣，以它們倆為末尾項的公共子數(shù)組，長度保底為1——dp[i][j]至少為 1，要考慮它們倆的前綴數(shù)組——dp[i-1][j-1]能為它們倆提供多大的公共長度

繼續(xù)向前遞推：

如果它們倆的前綴數(shù)組的「末尾項」不相同，前綴數(shù)組提供的公共長度為 0——dp[i-1][j-1] = 0，以它們倆為末尾項的公共子數(shù)組的長度——dp[i][j] = 1
如果它們倆的前綴數(shù)組的「末尾項」相同，前綴部分能提供的公共長度——dp[i-1][j-1]，它至少為 1，以它們倆為末尾項的公共子數(shù)組的長度 dp[i][j] = dp[i-1][j-1] + 1

題目求：最長公共子數(shù)組的長度。不同的公共子數(shù)組的末尾項不一樣。我們考察不同末尾項的公共子數(shù)組，找出最長的那個。
【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

1 定義狀態(tài)（定義子問題）

我們定義dp[i][j]標識：長度為i，末尾項為A[i-1]的子數(shù)組，與長度為j，末尾項為B[j-1]的子數(shù)組，二者的最大公共后綴子數(shù)組長度

2 定義狀態(tài)轉(zhuǎn)移方程

dp[i][j] ：長度為i，末尾項為A[i-1]的子數(shù)組，與長度為j，末尾項為B[j-1]的子數(shù)組，二者的最大公共后綴子數(shù)組長度。

如果 A[i-1] != B[j-1]，有 dp[i][j] = 0
如果 A[i-1] == B[j-1] ，有 dp[i][j] = dp[i-1][j-1] + 1

3 初始化狀態(tài)

為了不判斷邊界條件，我們給DP Table補0，所以base case：如果i==0||j==0，則二者沒有公共部分，dp[i][j]=0

4 求解方向

這里采用自底向上，從最小的狀態(tài)開始求解

5 找到最終解

最長公共子數(shù)組以哪一項為末尾項都有可能，求出每個 dp[i][j]，找出最大值。

代碼實現(xiàn)

給出代碼實現(xiàn)基本檔案

基本數(shù)據(jù)結(jié)構(gòu)：數(shù)組
輔助數(shù)據(jù)結(jié)構(gòu)：無
算法：動態(tài)規(guī)劃
技巧：無

其中數(shù)據(jù)結(jié)構(gòu)、算法和技巧分別來自：

10 個數(shù)據(jù)結(jié)構(gòu)：數(shù)組、鏈表、棧、隊列、散列表、二叉樹、堆、跳表、圖、Trie 樹
10 個算法：遞歸、排序、二分查找、搜索、哈希算法、貪心算法、分治算法、回溯算法、動態(tài)規(guī)劃、字符串匹配算法
技巧：雙指針、滑動窗口、中心擴散

當然包括但不限于以上

import java.util.*;


public class Solution {
    /**
     * 代碼中的類名、方法名、參數(shù)名已經(jīng)指定，請勿修改，直接返回方法規(guī)定的值即可
     *
     *
     * @param number int整型
     * @return int整型
     */
    public int findLength(int[] nums1, int[] nums2) {
        // 1 入?yún)惓Ｐｒ?/span>
        if (nums1 == null || nums2 == null || nums1.length == 0 || nums2.length == 0) {
            return 0;
        }

        // 2 定義dp數(shù)組，dp[i][j] 表示以nums1中以i-1結(jié)尾的元素與nums2中以j-1結(jié)尾的元素最長重復(fù)子數(shù)組
        int rows = nums1.length;
        int cols = nums2.length;
        // base case dp[0][0]=0,初始化第一行第一列為0
        int[][] dp = new int[rows + 1][cols + 1];

        // 3 狀態(tài)轉(zhuǎn)移方程
        int ans = 0;
        for (int i = 1; i <= rows; i++) {
            for (int j = 1; j <= cols; j++) {
                // 如果以i-1,j-1為結(jié)尾的元素相等，則至少重復(fù)子數(shù)組長度+1，并比較大小
                if (nums1[i - 1] == nums2[j - 1]) {
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                    // 設(shè)置值的過程中更新最大值
                    ans = Math.max(ans, dp[i][j]);
                } else {
                    // 如果以i-1,j-1為結(jié)尾的元素不相等，則無重復(fù)子數(shù)組，長度歸0
                    dp[i][j] = 0;
                }
            }
        }

        return ans;
    }
}

復(fù)雜度分析

時間復(fù)雜度：O(N*M)，這里 N 是數(shù)組的長度，我們寫了兩個 for 循環(huán)，每個 for 循環(huán)的時間復(fù)雜度都是線性的；

空間復(fù)雜度：O(N*M)，DP數(shù)組是二維數(shù)組

最長公共子串【MID】

首先來一道最長公共子串，難度還沒有升級，公共字符是連續(xù)的即可

題干

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

解題思路

求兩個數(shù)組或者字符串的最長公共子序列問題，肯定是要用動態(tài)規(guī)劃的。

首先，區(qū)分兩個概念：子序列可以是不連續(xù)的；子數(shù)組（子字符串）需要是連續(xù)的；
另外，單個數(shù)組或者字符串要用動態(tài)規(guī)劃時，可以把動態(tài)規(guī)劃 dp[i] 定義為 nums[0:i] 中想要求的結(jié)果；當兩個數(shù)組或者字符串要用動態(tài)規(guī)劃時，可以把動態(tài)規(guī)劃定義成兩維的 dp[i][j] ，其含義是在 A[0:i] 與 B[0:j] 之間匹配得到的想要的結(jié)果。

1. 狀態(tài)定義

對于本題而言，可以定義 dp[i][j] 表示 text1[0:i-1] 和 text2[0:j-1] 的最長公共子序列。（注：text1[0:i-1] 表示的是 text1 的第 0 個元素到第 i - 1 個元素，兩端都包含）之所以 dp[i][j] 的定義不是 text1[0:i] 和 text[0:j] ，是為了方便當 i = 0 或者 j = 0 的時候，dp[i][j]表示空字符串和另外一個字符串的匹配，這樣 dp[i][j] 可以初始化為空字符串

2. 狀態(tài)轉(zhuǎn)移方程

知道狀態(tài)定義之后，開始寫狀態(tài)轉(zhuǎn)移方程。

當 text1[i - 1] == text2[j - 1] 時，說明兩個子字符串的最后一位相等，所以最長公共子串長度又增加了 1，所以 dp[i][j] = dp[i - 1][j - 1] + text1[i]；
當 text1[i - 1] != text2[j - 1] 時，說明兩個子字符串的最后一位不相等，所以不夠成公共子串，不滿足條件

綜上狀態(tài)轉(zhuǎn)移方程為：

dp[i][j] = dp[i - 1][j - 1] + s1.charAt(i - 1), 當 text1[i?1]==text2[j?1]

當然我們還需要當前最新下標來輔助記錄子串最新的更新位置

3. 狀態(tài)的初始化

初始化就是要看當 i = 0 與 j = 0 時， dp[i][j] 應(yīng)該取值為多少。

當 i = 0 時，dp[0][j] 表示的是 text1中取空字符串跟 text2的最長公共子序列，結(jié)果肯定為空字符串.
當 j = 0 時，dp[i][0] 表示的是 text2中取空字符串跟 text1的最長公共子序列，結(jié)果肯定為空字符串.

綜上，當 i = 0 或者 j = 0 時，dp[i][j] 初始化為空字符串.

4. 遍歷方向與范圍

由于 dp[i][j] 依賴于 dp[i - 1][j - 1] ,，所以 i和 j的遍歷順序肯定是從小到大（自底向上）的。另外，由于當 i和 j 取值為 0 的時候，dp[i][j] = 0，而 dp 數(shù)組本身初始化就是為空字符串，所以，直接讓 i 和 j 從 1 開始遍歷。遍歷的結(jié)束應(yīng)該是字符串的長度為 len(text1)和 len(text2)。

5. 最終返回結(jié)果

由于 dp[i][j] 的含義是 text1[0:i-1] 和 text2[0:j-1] 的最長公共子序列。我們最終希望求的是 text1 和 text2 的最長公共子序列。所以需要返回的結(jié)果是 i = len(text1) 并且 j = len(text2) 時的 dp[len(text1)][len(text2)]。

代碼實現(xiàn)

給出代碼實現(xiàn)基本檔案

基本數(shù)據(jù)結(jié)構(gòu)：字符串
輔助數(shù)據(jù)結(jié)構(gòu)：無
算法：動態(tài)規(guī)劃
技巧：無

其中數(shù)據(jù)結(jié)構(gòu)、算法和技巧分別來自：

10 個數(shù)據(jù)結(jié)構(gòu)：數(shù)組、鏈表、棧、隊列、散列表、二叉樹、堆、跳表、圖、Trie 樹
10 個算法：遞歸、排序、二分查找、搜索、哈希算法、貪心算法、分治算法、回溯算法、動態(tài)規(guī)劃、字符串匹配算法
技巧：雙指針、滑動窗口、中心擴散

當然包括但不限于以上

import java.util.*;


public class Solution {
    /**
     * 代碼中的類名、方法名、參數(shù)名已經(jīng)指定，請勿修改，直接返回方法規(guī)定的值即可
     *
     * longest common substring
     * @param str1 string字符串 the string
     * @param str2 string字符串 the string
     * @return string字符串
     */
    public String LCS (String str1, String str2) {
        // 入?yún)l件判斷
        if (str1 == null || str1.length() == 0 || str2 == null || str2.length() == 1) {
            return null;
        }
        // 1 初始化狀態(tài)
        int ls1 = str1.length();
        int ls2 = str2.length();
        // dp表示范圍為0-ls1的str1與0-ls2的str2的最長公共子串長度
        int[][] dp = new int[ls1 + 1][ls2 + 1];
        int max = 0;
        int latestIndex = 0;

        // 2 遍歷（自底向上）
        for (int i = 1; i <= ls1; i++) {
            for (int j = 1; j <= ls2; j++) {
                // 狀態(tài)轉(zhuǎn)移方程
                if (str1.charAt(i - 1) == str2.charAt(j - 1)) {
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                    // 更新子串最大長度以及當前子串下標
                    if (dp[i][j] > max) {
                        max = dp[i][j];
                        // 公共子串不包含latestIndex位置
                        latestIndex = i;
                    }
                }
            }
        }
        // 上述循環(huán)i從1開始，這里subString右側(cè)為開區(qū)間，剛好適用
        return str1.substring(latestIndex - max, latestIndex);
    }
}

復(fù)雜度分析

時間復(fù)雜度：O(n^2 )，構(gòu)造輔助數(shù)組dp與b，兩層循環(huán)，遞歸是有方向的遞歸，因此只是相當于遍歷了二維數(shù)組
空間復(fù)雜度：O(n^2 )，輔助二維數(shù)組dp與遞歸棧的空間最大為O(n^2 )

最長公共子序列【MID】

難度升級，明確下什么是公共子序列。一個字符串的子序列是指這樣一個新的字符串：它是由原字符串在不改變字符的相對順序的情況下刪除某些字符（也可以不刪除任何字符）后組成的新字符串。

例如，ace是 abcde的子序列，但 aec不是 abcde 的子序列

題干

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

解題思路

求兩個數(shù)組或者字符串的最長公共子序列問題，肯定是要用動態(tài)規(guī)劃的。

首先，區(qū)分兩個概念：子序列可以是不連續(xù)的；子數(shù)組（子字符串）需要是連續(xù)的；
另外，單個數(shù)組或者字符串要用動態(tài)規(guī)劃時，可以把動態(tài)規(guī)劃 dp[i] 定義為 nums[0:i] 中想要求的結(jié)果；當兩個數(shù)組或者字符串要用動態(tài)規(guī)劃時，可以把動態(tài)規(guī)劃定義成兩維的 dp[i][j] ，其含義是在 A[0:i] 與 B[0:j] 之間匹配得到的想要的結(jié)果。

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

1. 狀態(tài)定義

對于本題而言，可以定義 dp[i][j] 表示 text1[0:i-1] 和 text2[0:j-1] 的最長公共子序列。（注：text1[0:i-1] 表示的是 text1 的第 0 個元素到第 i - 1 個元素，兩端都包含）之所以 dp[i][j] 的定義不是 text1[0:i] 和 text[0:j] ，是為了方便當 i = 0 或者 j = 0 的時候，dp[i][j]表示空字符串和另外一個字符串的匹配，這樣 dp[i][j] 可以初始化為空字符串

2. 狀態(tài)轉(zhuǎn)移方程

知道狀態(tài)定義之后，開始寫狀態(tài)轉(zhuǎn)移方程。

當 text1[i - 1] == text2[j - 1] 時，說明兩個子字符串的最后一位相等，所以最長公共子序列又增加了 1，所以 dp[i][j] = dp[i - 1][j - 1] + text1[i]；舉個例子，比如對于 ac 和 bc 而言，他們的最長公共子序列的長度等于 a 和 b 的最長公共子序列長度 0 + text[1] = c。
當 text1[i - 1] != text2[j - 1] 時，說明兩個子字符串的最后一位不相等，那么此時的狀態(tài) dp[i][j] 應(yīng)該是 dp[i - 1][j] 和 dp[i][j - 1] 的最大值。舉個例子，比如對于 ace 和 bc 而言，他們的最長公共子序列等于 ① ace 和 b 的最長公共子序列:空字符串的長度0 與 ② ac 和 bc 的最長公共子序列c長度1 的最大值，即 1，所以選擇長度大的

綜上狀態(tài)轉(zhuǎn)移方程為：

dp[i][j] = dp[i - 1][j - 1] + s1.charAt(i - 1), 當 text1[i?1]==text2[j?1]
dp[i][j] = dp[i - 1][j].length() > dp[i][j - 1].length() ? dp[i - 1][j] : dp[i][j - 1];, 當 text1[i?1]!=text2[j?1]

3. 狀態(tài)的初始化

初始化就是要看當 i = 0 與 j = 0 時， dp[i][j] 應(yīng)該取值為多少。

當 i = 0 時，dp[0][j] 表示的是 text1中取空字符串跟 text2的最長公共子序列，結(jié)果肯定為空字符串.
當 j = 0 時，dp[i][0] 表示的是 text2中取空字符串跟 text1的最長公共子序列，結(jié)果肯定為空字符串.

綜上，當 i = 0 或者 j = 0 時，dp[i][j] 初始化為空字符串.

4. 遍歷方向與范圍

由于 dp[i][j] 依賴于 dp[i - 1][j - 1] ,，所以 i和 j的遍歷順序肯定是從小到大（自底向上）的。另外，由于當 i和 j 取值為 0 的時候，dp[i][j] = 0，而 dp 數(shù)組本身初始化就是為空字符串，所以，直接讓 i 和 j 從 1 開始遍歷。遍歷的結(jié)束應(yīng)該是字符串的長度為 len(text1)和 len(text2)。

5. 最終返回結(jié)果

由于 dp[i][j] 的含義是 text1[0:i-1] 和 text2[0:j-1] 的最長公共子序列。我們最終希望求的是 text1 和 text2 的最長公共子序列。所以需要返回的結(jié)果是 i = len(text1) 并且 j = len(text2) 時的 dp[len(text1)][len(text2)]。

代碼實現(xiàn)

給出代碼實現(xiàn)基本檔案

基本數(shù)據(jù)結(jié)構(gòu)：字符串
輔助數(shù)據(jù)結(jié)構(gòu)：無
算法：動態(tài)規(guī)劃
技巧：無

其中數(shù)據(jù)結(jié)構(gòu)、算法和技巧分別來自：

10 個數(shù)據(jù)結(jié)構(gòu)：數(shù)組、鏈表、棧、隊列、散列表、二叉樹、堆、跳表、圖、Trie 樹
10 個算法：遞歸、排序、二分查找、搜索、哈希算法、貪心算法、分治算法、回溯算法、動態(tài)規(guī)劃、字符串匹配算法
技巧：雙指針、滑動窗口、中心擴散

當然包括但不限于以上

import java.util.*;


public class Solution {
    /**
     * 代碼中的類名、方法名、參數(shù)名已經(jīng)指定，請勿修改，直接返回方法規(guī)定的值即可
     *
     * longest common subsequence
     * @param s1 string字符串 the string
     * @param s2 string字符串 the string
     * @return string字符串
     */
    public String LCS (String s1, String s2) {
        // 0 入?yún)⑿ｒ?/span>
        if (s1 == null || s1.length() == 0 || s2 == null ||
                s2.length() == 0) return "-1";
        // 1 狀態(tài)定義及初始化
        int ls1 = s1.length();
        int ls2 = s2.length();
        // 長度為ls1和長度為ls2的最長公共子序列是dp
        String[][] dp = new String[ls1 + 1][ls2 + 1];

        // 2 初始化狀態(tài)值，當初始化狀態(tài)時，公共子序列為空字符串
        for (int i = 0; i <= ls1; i++) {
            // j為0表示一個長度不為0的s1和一個長度永遠為0的字符串公共子序列一定是空字符串
            dp[i][0] = "";
        }
        for (int j = 0; j <= ls2; j++) {
            // i為0表示一個長度不為0的s1和一個長度永遠為0的字符串公共子序列一定是空字符串
            dp[0][j] = "";
        }

        // 3 自底向上遍歷
        for (int i = 1; i <= ls1; i++) {
            for (int j = 1; j <= ls2; j++) {
                // 4 狀態(tài)轉(zhuǎn)移方程
                if (s1.charAt(i - 1) == s2.charAt(j - 1)) {
                    // 如果s1和s2的字符相等，dp[1][1]表示dp[0][0]+a=a(自底向上)
                    dp[i][j] = dp[i - 1][j - 1] + s1.charAt(i - 1);
                } else {
                    // 如果s1和s2的字符不相等，取dp[i - 1][j]和dp[i][j - 1]較長的字符作為dp[i][j]
                    dp[i][j] = dp[i - 1][j].length() > dp[i][j - 1].length() ? dp[i - 1][j] :
                               dp[i][j - 1];
                }
            }
        }
        // 5 返回的是兩個完整s1和s2的公共子序列
        return dp[ls1][ls2] == "" ? "-1" : dp[ls1][ls2];
    }
}

復(fù)雜度分析

時間復(fù)雜度：O(n^2 )，構(gòu)造輔助數(shù)組dp與b，兩層循環(huán)，遞歸是有方向的遞歸，因此只是相當于遍歷了二維數(shù)組
空間復(fù)雜度：O(n^2 )，輔助二維數(shù)組dp與遞歸棧的空間最大為O(n^2 )

編輯距離【HARD】

終于又來到一道看了很久的高頻題目這里

題干

搞定了一系列的簡單題，來個編輯距離練練手
【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

解題思路

原題解地址，解決兩個字符串的動態(tài)規(guī)劃問題，一般都是用兩個指針 i, j 分別指向兩個字符串的最后，然后一步步往前移動，縮小問題的規(guī)模

設(shè)兩個字符串分別為 rad 和 apple，為了把 s1 變成 s2，算法會這樣進行
【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

暴力遞歸

base case 是 i 走完 s1 或 j 走完 s2，可以直接返回另一個字符串剩下的長度。對于每對兒字符 s1[i] 和 s2[j]，可以有四種操作：

if s1[i] == s2[j]:
    啥都別做（skip）
    i, j 同時向前移動
else:
    三選一：
        插入（insert）
        刪除（delete）
        替換（replace）

有這個框架，問題就已經(jīng)解決了。讀者也許會問，這個「三選一」到底該怎么選擇呢？很簡單，全試一遍，哪個操作最后得到的編輯距離最小，就選誰

int minDistance(String s1, String s2) {
    int m = s1.length(), n = s2.length();
    // i，j 初始化指向最后一個索引
    return dp(s1, m - 1, s2, n - 1);
}

// 定義：返回 s1[0..i] 和 s2[0..j] 的最小編輯距離
int dp(String s1, int i, String s2, int j) {
    // base case
    if (i == -1) return j + 1;
    if (j == -1) return i + 1;

    if (s1.charAt(i) == s2.charAt(j)) {
        return dp(s1, i - 1, s2, j - 1); // 啥都不做
    }
    return min(
        dp(s1, i, s2, j - 1) + 1,    // 插入
        dp(s1, i - 1, s2, j) + 1,    // 刪除
        dp(s1, i - 1, s2, j - 1) + 1 // 替換
    );
}

int min(int a, int b, int c) {
    return Math.min(a, Math.min(b, c));
}

情況一：什么都不做

if s1[i] == s2[j]:
    return dp(s1, i - 1, s2, j - 1); # 啥都不做
# 解釋：
# 本來就相等，不需要任何操作
# s1[0..i] 和 s2[0..j] 的最小編輯距離等于
# s1[0..i-1] 和 s2[0..j-1] 的最小編輯距離
# 也就是說 dp(i, j) 等于 dp(i-1, j-1)

如果 s1[i] != s2[j]，就要對三個操作遞歸了

情況二：插入操作

dp(s1, i, s2, j - 1) + 1,    # 插入
# 解釋：
# 我直接在 s1[i] 插入一個和 s2[j] 一樣的字符
# 那么 s2[j] 就被匹配了，前移 j，繼續(xù)跟 i 對比
# 別忘了操作數(shù)加一

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式
插入操作

情況三：刪除操作

dp(s1, i - 1, s2, j) + 1,    # 刪除
# 解釋：
# 我直接把 s[i] 這個字符刪掉
# 前移 i，繼續(xù)跟 j 對比
# 操作數(shù)加一

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

情況四：替換操作

dp(s1, i - 1, s2, j - 1) + 1 # 替換
# 解釋：
# 我直接把 s1[i] 替換成 s2[j]，這樣它倆就匹配了
# 同時前移 i，j 繼續(xù)對比
# 操作數(shù)加一

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式
a字符被替換為p字符

int dp(i, j) {
    dp(i - 1, j - 1); // #1
    dp(i, j - 1);     // #2
    dp(i - 1, j);     // #3
}

對于子問題 dp(i-1, j-1)，如何通過原問題 dp(i, j) 得到呢？有不止一條路徑，比如 dp(i, j) -> #1 和 dp(i, j) -> #2 -> #3。一旦發(fā)現(xiàn)一條重復(fù)路徑，就說明存在巨量重復(fù)路徑，也就是重疊子問題

動態(tài)規(guī)劃

接下來用DP table來優(yōu)化一下，降低重復(fù)子問題，首先明確 dp 數(shù)組的含義，dp 數(shù)組是一個二維數(shù)組，長這樣
【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式
有了之前遞歸解法的鋪墊，應(yīng)該很容易理解。dp[..][0] 和 dp[0][..] 對應(yīng) base case，dp[i][j] 的含義和之前的 dp 函數(shù)類似

替換操作：word1的0~i-1位置與word2的0~j-1位置的字符都相同,只是當前位置的字符不匹配,進行替換操作后兩者變得相同dp[i-1][j-1] 表示需要進行替換操作才能轉(zhuǎn)到dp[i][j]，所以此時dp[i][j]=dp[i-1][j-1]+1(這個加1代表執(zhí)行替換操作)
刪除操作: 若此時word1的0~i-1位置與word2的0~j位置已經(jīng)匹配了,此時多出了word1的i位置字符,應(yīng)把它刪除掉,才能使此時word1的0~i(這個i是執(zhí)行了刪除操作后新的i)和word2的0~j位置匹配,因此此時dp[i][j]=dp[i-1][j]+1(這個加1代表執(zhí)行刪除操作)
插入操作:若此時word1的0~i位置只是和word2的0~j-1位置匹配，此時只需要在原來的i位置后面插入一個和word2的j位置相同的字符使得此時的word1的0~i(這個i是執(zhí)行了插入操作后新的i)和word2的0~j匹配得上,所以此時dp[i][j]=dp[i][j-1]+1(這個加1代表執(zhí)行插入操作)

有了之前遞歸解法的鋪墊，應(yīng)該很容易理解。dp[..][0] 和 dp[0][..] 對應(yīng) base case，dp[i][j] 的含義和之前的 dp 函數(shù)類似

int dp(String s1, int i, String s2, int j)
// 返回 s1[0..i] 和 s2[0..j] 的最小編輯距離

dp 函數(shù)的 base case 是 i, j 等于 -1，而數(shù)組索引至少是 0，所以 dp 數(shù)組會偏移一位

dp[i-1][j-1]
// 存儲 s1[0..i] 和 s2[0..j] 的最小編輯距離

既然 dp 數(shù)組和遞歸 dp 函數(shù)含義一樣，也就可以直接套用之前的思路寫代碼，唯一不同的是，DP table 是自底向上求解，遞歸解法是自頂向下求解

int minDistance(String s1, String s2) {
    int m = s1.length(), n = s2.length();
    // 定義：s1[0..i] 和 s2[0..j] 的最小編輯距離是 dp[i+1][j+1]
    int[][] dp = new int[m + 1][n + 1];
    // base case 
    for (int i = 1; i <= m; i++)
        dp[i][0] = i;
    for (int j = 1; j <= n; j++)
        dp[0][j] = j;
    // 自底向上求解
    for (int i = 1; i <= m; i++) {
        for (int j = 1; j <= n; j++) {
            if (s1.charAt(i-1) == s2.charAt(j-1)) {
                dp[i][j] = dp[i - 1][j - 1];
            } else {
                dp[i][j] = min(
                    dp[i - 1][j] + 1,
                    dp[i][j - 1] + 1,
                    dp[i - 1][j - 1] + 1
                );
            }
        }
    }
    // 儲存著整個 s1 和 s2 的最小編輯距離
    return dp[m][n];
}

int min(int a, int b, int c) {
    return Math.min(a, Math.min(b, c));
}

代碼實現(xiàn)

給出代碼實現(xiàn)基本檔案

基本數(shù)據(jù)結(jié)構(gòu)：數(shù)組
輔助數(shù)據(jù)結(jié)構(gòu)：無
算法：動態(tài)規(guī)劃
技巧：無

其中數(shù)據(jù)結(jié)構(gòu)、算法和技巧分別來自：

10 個數(shù)據(jù)結(jié)構(gòu)：數(shù)組、鏈表、棧、隊列、散列表、二叉樹、堆、跳表、圖、Trie 樹
10 個算法：遞歸、排序、二分查找、搜索、哈希算法、貪心算法、分治算法、回溯算法、動態(tài)規(guī)劃、字符串匹配算法
技巧：雙指針、滑動窗口、中心擴散

當然包括但不限于以上

import java.util.*;
// 注意類名必須為 Main, 不要有任何 package xxx 信息
class Solution
{
    // 編輯距離，返回兩個字符串操作的最小距離
    public int minDistance(String word1, String word2)
    {
        // 1 入?yún)⑿ｒ?/span>
        if(word1.length() < 1 && word2.length() < 1)
        {
            return 0;
        }
        // 2 定義行列長度，word1作為豎，word2作為行
        int m = word1.length();
        int n = word2.length();

        // 定義：s1[0..i] 和 s2[0..j] 的最小編輯距離是 dp[i+1][j+1]
        int[][] dp = new int[m + 1][n + 1];

        // 4 初始化base case
        for(int i = 1; i <= m; i++)
        {
            dp[i][0] = i;
        }
        for(int j = 1; j <= n; j++)
        {
            dp[0][j] = j;
        }
        
        // 5 狀態(tài)轉(zhuǎn)移方程:自底向上求解，從頭開始比較，i=0和j=0的位置初始化為基本操作數(shù)
        for(int i = 1; i <= m; i++)
        {
            for(int j = 1; j <= n; j++)
            {
                if(word1.charAt(i-1) == word2.charAt(j-1))
                {
                    dp[i][j] = dp[i - 1][j - 1];
                }else
                {
                    dp[i][j] = minCompare(dp[i - 1][j] + 1, dp[i][j - 1] + 1, dp[i - 1][j - 1] + 1);
                }
            }
        }

        return dp[m][n];
    }
    
    private int minCompare(int a, int b, int c)
    {
        return Math.min(a, Math.min(b, c));
    }
}

【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列,# 字符串,算法,代理模式

第一行，是 word1 為空，變成 word2 最少步數(shù)，就是插入操作
第一列，是 word2 為空，word1要變?yōu)閣ord2(也就是空)需要的最少步數(shù)，就是刪除操作

(一)、當word1[i]==word2[j]時,由于遍歷到了i和j,說明word1的0~i-1和word2的0~j-1的匹配結(jié)果已經(jīng)生成,
由于當前兩個字符相同,因此無需做任何操作,dp[i][j]=dp[i-1][j-1]

(二)、當word1[i]!=word2[j]時,可以進行的操作有3個:
      ① 替換操作:可能word1的0~i-1位置與word2的0~j-1位置的字符都相同,
           只是當前位置的字符不匹配,進行替換操作后兩者變得相同,
           所以此時dp[i][j]=dp[i-1][j-1]+1(這個加1代表執(zhí)行替換操作)
      ②刪除操作:若此時word1的0~i-1位置與word2的0~j位置已經(jīng)匹配了,
         此時多出了word1的i位置字符,應(yīng)把它刪除掉,才能使此時word1的0~i(這個i是執(zhí)行了刪除操作后新的i)
         和word2的0~j位置匹配,因此此時dp[i][j]=dp[i-1][j]+1(這個加1代表執(zhí)行刪除操作)
      ③插入操作:若此時word1的0~i位置只是和word2的0~j-1位置匹配,
          此時只需要在原來的i位置后面插入一個和word2的j位置相同的字符使得
          此時的word1的0~i(這個i是執(zhí)行了插入操作后新的i)和word2的0~j匹配得上,
          所以此時dp[i][j]=dp[i][j-1]+1(這個加1代表執(zhí)行插入操作)
      ④由于題目所要求的是要最少的操作數(shù):所以當word1[i] != word2[j] 時,
          需要在這三個操作中選取一個最小的值賦格當前的dp[i][j]
(三)總結(jié):狀態(tài)方程為:
if(word1[i] == word2[j]):
      dp[i][j] = dp[i-1][j-1]
else:
       min(dp[i-1][j-1],dp[i-1][j],dp[i][j-1])+1


PS:大佬的代碼中word1.charAt(i-1)==word2.charAt(j-1)的原因是:
     初始化DP Table時dp[i][0]和dp[0][j]已經(jīng)填寫完成,所以接下來填表需要從1開始,
     但是字符的比較需要從0開始,因此才這樣子寫

復(fù)雜度分析

時間復(fù)雜度：O(N^2)，這里 N 是數(shù)組的長度，我們寫了兩個 for 循環(huán)，每個 for 循環(huán)的時間復(fù)雜度都是線性的；
空間復(fù)雜度：O(N)，要使用和輸入數(shù)組長度相等的狀態(tài)數(shù)組，因此空間復(fù)雜度是 O(N)。文章來源地址http://www.zghlxwxcb.cn/news/detail-700099.html

到了這里，關(guān)于【算法訓(xùn)練-字符串三】最長公共子串、最長公共子序列的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

字符串---第一部分序列、字串；上升，公共
第一部分最長上升子序列，最長上升子串，最長公共子序列，最長公共子串--dp 第二部分 KMP，trie，雙指針第三部分待定動態(tài)規(guī)劃：審題，狀態(tài)確定，狀態(tài)轉(zhuǎn)移，邊界條件線性DP 最長上升子序列 403 線性DP 最長上升子序列【動態(tài)規(guī)劃】_嗶哩嗶哩_bilibili 給定一個無序整數(shù)數(shù)組
2024年02月07日
瀏覽(26)
動態(tài)規(guī)劃學(xué)習(xí)——最長回文子序列，讓字符串變成回文串的最小插入次數(shù)
1.題目給你一個字符串? s ?，找出其中最長的回文子序列，并返回該序列的長度。子序列定義為：不改變剩余字符順序的情況下，刪除某些字符或者不刪除任何字符形成的一個序列。示例 1：示例 2：提示： 1 = s.length = 1000 s ?僅由小寫英文字母組成 2.題目接口 ?3.解題思路
2024年02月04日
瀏覽(17)
【JavaScript數(shù)據(jù)結(jié)構(gòu)與算法】字符串類（計算二進制子串）
個人簡介 ?? 個人主頁：前端雜貨鋪 ???♂? 學(xué)習(xí)方向：主攻前端方向，也會涉及到服務(wù)端（Node.js） ?? 個人狀態(tài)：在校大學(xué)生一枚，已拿多個前端 offer（秋招） ?? 未來打算：為中國的工業(yè)軟件事業(yè)效力 n 年 ?? 推薦學(xué)習(xí)：??前端面試寶典 ??Vue2 ??Vue3 ??Vue2/3項目
2024年02月05日
瀏覽(102)
【算法題】2745. 構(gòu)造最長的新字符串
給你三個整數(shù) x ，y 和 z 。這三個整數(shù)表示你有 x 個 “AA” 字符串，y 個 “BB” 字符串，和 z 個 “AB” 字符串。你需要選擇這些字符串中的部分字符串（可以全部選擇也可以一個都不選擇），將它們按順序連接得到一個新的字符串。新字符串不能包含子字符串 “AAA” 或者
2024年02月12日
瀏覽(17)
數(shù)據(jù)結(jié)構(gòu)與算法之字符串: Leetcode 696. 計數(shù)二進制子串 (Typescript版)
計數(shù)二進制子串 https://leetcode.cn/problems/count-binary-substrings/ 描述給定一個字符串 s，統(tǒng)計并返回具有相同數(shù)量 0 和 1 的非空（連續(xù)）子字符串的數(shù)量，并且這些子字符串中的所有 0 和所有 1 都是成組連續(xù)的。重復(fù)出現(xiàn)（不同位置）的子串也要統(tǒng)計它們出現(xiàn)的次數(shù)。示例 1：示
2024年02月01日
瀏覽(96)
劍指offer(C++)-JZ48：最長不含重復(fù)字符的子字符串(算法-動態(tài)規(guī)劃)
作者：翟天保Steven 版權(quán)聲明：著作權(quán)歸作者所有，商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán)，非商業(yè)轉(zhuǎn)載請注明出處題目描述：請從字符串中找出一個最長的不包含重復(fù)字符的子字符串，計算該最長子字符串的長度。數(shù)據(jù)范圍: ?s.length≤40000?s.length≤40000 示例：輸入：返回值：說明
2024年02月06日
瀏覽(25)
【算法】算法學(xué)習(xí)七：動態(tài)規(guī)劃 | 背包問題 | 最長公共子串（含源代碼）
背包問題是一種經(jīng)典的組合優(yōu)化問題，通常有兩個版本：0-1背包問題和無限背包問題。 0-1背包問題是指給定一個背包容量和一組物品，每個物品有自己的重量和價值，要求在不超過背包容量的情況下，選擇一些物品放入背包，使得物品的總價值最大化。每個物品只能選擇放入
2024年02月09日
瀏覽(17)
c 取字符串中的子串
strcpy(S.ch,ch1)?賦值函數(shù)；字符串沒特殊處理，就是從0開始的 %s輸出字符串，%c輸出字符
2024年02月07日
瀏覽(22)
算法刷題｜647.回文子串、516.最長回文子序列
題目：給你一個字符串 s ，請你統(tǒng)計并返回這個字符串中回文子串的數(shù)目。回文字符串是正著讀和倒過來讀一樣的字符串。子字符串是字符串中的由連續(xù)字符組成的一個序列。具有不同開始位置或結(jié)束位置的子串，即使是由相同的字符組成，也會被視作不同的子串。 d
2024年02月17日
瀏覽(54)
算法：動態(tài)規(guī)劃——最長公共子序列
動態(tài)規(guī)劃算法與分治法類似，其基本思想也是將待求解問題分解成若干個子問題，先求解子問題，然后從這些子問題的解得到原問題的解。與分治法不同的是，適合于用動態(tài)規(guī)劃法求解的問題，經(jīng)分解得到的子問題往往不是互相獨立的。若用分治法解這類問題，則分解得到的
2023年04月27日
瀏覽(22)