动态规划（2）判断子序列

技术2022-07-11 131

动态规划（2）判断子序列

题目

给定字符串 s 和 t ，判断 s 是否为 t 的子序列。你可以认为 s 和 t 中仅包含英文小写字母。字符串 t 可能会很长（长度 ~= 500,000），而 s 是个短字符串（长度 <=100）。字符串的一个子序列是原始字符串删除一些（也可以不删除）字符而不改变剩余字符相对位置形成的新字符串。（例如，"ace"是"abcde"的一个子序列，而"aec"不是）。

示例 1: s = “abc”, t = “ahbgdc” 返回 true.

示例 2: s = “axc”, t = “ahbgdc” 返回 false.

后续挑战 : 如果有大量输入的 S，称作S1, S2, … , Sk 其中 k >= 10亿，你需要依次检查它们是否为 T 的子序列。在这种情况下，你会怎样改变代码？

解题思路

逻辑分析：

1. 子问题在该问题中，子问题为s字符串中的每个字符与t串的匹配关系，即可划分为n = len(s)个子问题。

2. 转移方程遍历s字符串，在t字符串中寻找相应的字符，当寻找到了一个s中的字符时即意味着解决了一个子问题，当所有s字符串中的所有字符都找到了的时候（即完成寻找时，寻找的次数小于等于t字符串的长度），可以认为s字符串为t字符串的子串。

代码

class Solution: def isSubsequence(self, s: str, t: str) -> bool: nums = 0 for i in range(len(s)): ch = s[i]; while(nums < len(t) and t[nums] != ch): nums += 1 nums += 1 if(nums <= len(t)): return True else: return False

拓展（后续挑战）

逻辑分析：当存在大量的数据时，如果仍按照上述策略则会耗费大量的时间，所以需要我们考虑如何进行优化，而优化的方向是用空间换取时间。在这里子问题和转移方程没有变化，变化的是寻找的方式。

数据少通过遍历t字符串来依次寻找s字符串中的字符。

数据多在这种情况下，我们需要在匹配前对 t 做预处理，利用一个二维数组记录每个位置的下一个要匹配的字符的位置，这里的字符是’a’ ~ ‘z’，所以这个数组的大小是 dp[26][n]，n 为 t 的长度。那么每处理一个子串只需要扫描一遍 s即可，因为在数组的帮助下我们对 t是“跳跃”扫描的。

代码

class Solution { public boolean isSubsequence(String s, String t) { // 预处理 t = " " + t; // 开头加一个空字符作为匹配入口 int n = t.length(); int[][] dp = new int[26][n]; // 记录每个位置的下一个ch的位置 for (char ch = 0; ch < 26; ch++) { int p = -1; for (int i = n - 1; i >= 0; i--) { // 从后往前记录dp dp[ch][i] = p; if (t.charAt(i) == ch + 'a') p = i; } } // 匹配 int i = 0; for (char ch : s.toCharArray()) { // 跳跃遍历 i = dp[ch - 'a'][i]; if (i == -1) return false; } return true; } }

（注：后续挑战参考@lil-p朋友的思路）

Processed: 0.020, SQL: 9