给定字符串 s 和 t ,判断 s 是否为 t 的子序列。 你可以认为 s 和 t 中仅包含英文小写字母。字符串 t 可能会很长(长度 ~= 500,000),而 s 是个短字符串(长度 <=100)。 字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列,而"aec"不是)。
示例 1: s = “abc”, t = “ahbgdc” 返回 true.
示例 2: s = “axc”, t = “ahbgdc” 返回 false.
后续挑战 : 如果有大量输入的 S,称作S1, S2, … , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?
逻辑分析:
1. 子问题 在该问题中,子问题为s字符串中的每个字符与t串的匹配关系,即可划分为n = len(s)个子问题。
2. 转移方程 遍历s字符串,在t字符串中寻找相应的字符,当寻找到了一个s中的字符时即意味着解决了一个子问题,当所有s字符串中的所有字符都找到了的时候(即完成寻找时,寻找的次数小于等于t字符串的长度),可以认为s字符串为t字符串的子串。
逻辑分析:当存在大量的数据时,如果仍按照上述策略则会耗费大量的时间,所以需要我们考虑如何进行优化,而优化的方向是用空间换取时间。 在这里子问题和转移方程没有变化,变化的是寻找的方式。
数据少 通过遍历t字符串来依次寻找s字符串中的字符。
数据多 在这种情况下,我们需要在匹配前对 t 做预处理,利用一个二维数组记录每个位置的下一个要匹配的字符的位置,这里的字符是’a’ ~ ‘z’,所以这个数组的大小是 dp[26][n],n 为 t 的长度。那么每处理一个子串只需要扫描一遍 s即可,因为在数组的帮助下我们对 t是“跳跃”扫描的。
(注:后续挑战参考@lil-p朋友的思路)