LeetCode 筆記 - 5. Longest Palindromic Substring
題目在此 5. Longest Palindromic Substring
給定一個字串,找出最長迴文子字串
解題思維
這題無論用暴力硬掃或者 dynamic programming 都可以
不過複雜度都是 O(n²)
(根據 Longest Palindromic Subsequence | DP-12)
這題推薦使用 Manacher’s Algorithm
可以利用迴文的特性,將複雜度降到 O(n)
Time complexity: O(n)
Manacher’s Algorithm
這個神奇的演算法是一位叫 Manacher 的人在 1975 年發明的 (太神啦!為什麼每篇教學文都要講到 1975 年
接下來讓我們一步步的把 Manacher’s Algorithm 建立起來
前置動作
首先這個演算法需要對字串做一些前處理
這主要是為了可以讓 奇數 與 偶數 長度的迴文判斷都變成同一個邏輯 (奇數)1
padding_string = f"^_{'_'.join(string)}_$"
例如1
2
3
4
5
6
7
8s0 = "lloll"
s1 = "llooll"
padding0 = "^_l_l_o_l_l_$"
padding1 = "^_l_l_o_o_l_l_$"
result0 = '_l_l_o_l_l_' # 11
result1 = '_l_l_o_o_l_l_' # 13
計算迴文半徑
接下來我們需要一個 list 來存放資料
每一個 index 存放的資料是 以 index 為中心,可以找到最大的迴文字串半徑
舉例1
2
3
4s0 = "lloll"
padding0 = "^_l_l_o_l_l_$"
# PLS_radius = 0012105012100
看,是不是很神奇
中心擴展演算法
在這裡就是很直觀的判斷上下界
接著前後 (中心 - 半徑) 與 (中心 + 半徑) 兩個字元比對
最終得到結果1
2
3
4
5
6
7
8
9
10
11PLS_radius = [0] * padding_length
for center_index in range(padding_length):
LPS_result = 0
for i in range(LPS_result, padding_length):
if center_index - i < 0 or center_index + i >= padding_length:
break
if padding_string[center_index - i] != padding_string[center_index + i]:
break
LPS_result = i
PLS_radius[center_index] = LPS_result
其實到這裡,就已經可以找到我們要的答案
但如果就只是單純的使用中心擴展演算法
就只是個 O(n²) 的演算法而已
接下來 Manacher’s Algorithm 的威力才正要開始
利用迴文特性加速
在這裡我們需要先了解一個概念
那就是在一個迴文字串裡,如果出現一個子迴文,那另一邊也會出現 一樣長度 的子迴文
見圖中橘色區塊
center_index 是目前正在檢查的 index
這時候我們會利用涵蓋最多右邊資訊的最右邊的迴文字串中心來計算出 mirror
查看 mirror 的位置最長迴文字串長度
進而得知 PLS_radius[center_index] 至少會多少起跳
好,這時候可能會有三種情況
第一種
就是橘色部分沒有超過靠右邊的迴文字串的範圍
這個判斷我們可以透過比對 mirror - rightmost_left_index 與 PLS_radius[mirror] 得知
也就是說 mirror - rightmost_left_index > PLS_radius[mirror]
所以 PLS_radius[center_index] = PLS_radius[mirror]
第二種
橘色部部分邊界剛好等於靠右邊的迴文字串的範圍
也就是說 mirror - rightmost_left_index = PLS_radius[mirror]
所以 PLS_radius[center_index] = PLS_radius[mirror]
第三種
橘色部部分邊界超過靠右邊的迴文字串的範圍
也就是說 mirror - rightmost_left_index < PLS_radius[mirror]
我們可以在圖中看到右邊的橘色超出了一點
但對右邊的橘色迴文字串來說,那超出的一點是未知的狀態
所以 PLS_radius[center_index] = mirror - rightmost_left_index
比對完畢
接下來中心擴展演算法,就可以直接從剛剛三種方法判斷來的長度再接下去比對了
如此一來你會發現中心擴展演算法因為使用了過去的長度與迴文的特性
進而實現了 O(n) 的時間複雜度
太神啦!
程式碼
1 | class Solution: |
擴充中心演算法1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23class Solution:
def longestPalindrome(self, s: str) -> str:
if len(s) <= 1:
return s
def expand_from_center(left, right):
while left >= 0 and right < len(s) and s[left] == s[right]:
left -= 1
right += 1
return s[left + 1:right]
max_str = s[0]
for i in range(len(s) - 1):
odd = expand_from_center(i, i)
even = expand_from_center(i, i + 1)
if len(odd) > len(max_str):
max_str = odd
if len(even) > len(max_str):
max_str = even
return max_str