python實現求最長子串長度_ZenDei技術網路在線

python實現求最長子串長度

-Advertisement-

給定一個字元串，求它最長的迴文子串長度，例如輸入字元串'35534321'，它的最長迴文子串是'3553'，所以返回4。最容易想到的辦法是枚舉出所有的子串，然後一一判斷是否為迴文串，返回最長的迴文子串長度。不用我說，枚舉實現的耗時是我們無法忍受的。那麼有沒有高效查找迴文子串的方法呢？答案當然是肯定 ...

給定一個字元串，求它最長的迴文子串長度，例如輸入字元串'35534321'，它的最長迴文子串是'3553'，所以返回4。

最容易想到的辦法是枚舉出所有的子串，然後一一判斷是否為迴文串，返回最長的迴文子串長度。不用我說，枚舉實現的耗時是我們無法忍受的。那麼有沒有高效查找迴文子串的方法呢？答案當然是肯定的，那就是中心擴展法，選擇一個元素作為中心，然後向外發散的尋找以該元素為圓心的最大迴文子串。但是又出現了新的問題，迴文子串的長度即可能是基數，也可能好是偶數，對於長度為偶數的迴文子串來說是不存在中心元素的。那是否有一種辦法能將奇偶長度的子串歸為一類，統一使用中心擴展法呢？它就是manacher演算法，在原字元串中插入特殊字元，例如插入#後原字元串變成'#3#5#5#3#4#3#2#1#'。現在我們對新字元串使用中心擴展發即可，中心擴展法得到的半徑就是子串的長度。

現在實現思路已經明確了，先轉化字元串'35534321' ----> '#3#5#5#3#4#3#2#1#'，然後求出以每個元素為中心的最長迴文子串的長度。以下給出python實現:

#!/usr/bin/python
# -*- coding: utf-8 -*-

def max_substr(string):
    s_list = [s for s in string]
    string = '#' + '#'.join(s_list) + '#'
    max_length = 0
    length = len(string)
    for index in range(0, length):
        r_length = get_length(string, index)
        if max_length < r_length:
            max_length = r_length
    return max_length

def get_length(string, index):
    # 迴圈求出index為中心的最長迴文字串
    length = 0
    r_ = len(string)
    for i in range(1,index+1):
        if index+i < r_ and string[index-i] == string[index+i]:
            length += 1
        else:
            break
    return length

if __name__ == "__main__":
    result = max_substr("35534321")
    print result

功能已經實現了，經過測試也沒有bug，但是我們靜下心來想一想，目前的解法是否還有優化空間呢？根據目前的解法，我們求出了‘35534321‘中每個元素中心的最大迴文子串。當遍歷到'4'時，我們已經知道目前最長的迴文子串的長度max_length是4，這是我們求出了以4為中心的最長迴文子串長度是3，它比max_length要小，所以我們不更新max_length。換句話說，我們計算以4為中心的最長迴文字串長度是做了無用功。這就是我們要優化的地方，既然某個元素的最長的迴文子串長度並沒有超過max_length，我們就沒有必要計算它的最長迴文子串，在遍歷一個新的元素時，我們要優先判斷以它為中心的迴文子串的長度是否能超越max_length，如果不能超過，就繼續遍歷下一個元素。以下是優化後的實現：

#!/usr/bin/python
# -*- coding: utf-8 -*-

def max_substr(string):
    s_list = [s for s in string]
    string = '#' + '#'.join(s_list) + '#'
    max_length = 0
    length = len(string)
    for index in range(0, length):
        r_length = get_length2(string, index, max_length)
        if max_length < r_length:
            max_length = r_length
    return max_length

def get_length2(string, index, max_length):
    # 基於已知的最長字串求最長字串
    # 1.中心+最大半徑超出字元串範圍, return
    r_ = len(string)
    if index + max_length > r_:
        return max_length

    # 2.無法超越最大半徑, return
    l_string = string[index - max_length + 1 : index + 1]
    r_string = string[index : index + max_length]
    if l_string != r_string[::-1]:
        return max_length

    # 3.計算新的最大半徑
    result = max_length
    for i in range(max_length, r_):
        if index-i >= 0 and index+i < r_ and string[index-i] == string[index+i]:
            result += 1
        else:
            break
    return result - 1

if __name__ == "__main__":
    result = max_substr("35534321")
    print result

那麼速度到底提升了多少呢，以字元串1000個‘1’為例，優化前的演算法執行時間為0.239018201828，優化後為0.0180191993713，速度提升了10倍左右

/usr/bin/python /Users/hakuippei/PycharmProjects/untitled/the_method_of_programming.py
0.239018201828
0.0180191993713

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

html 5 dialog標簽：定義特殊術語或短語

html5中<dialog>標簽作用是定義特殊術語或短語，這裡主機吧詳細介紹下<dialog>標簽用法、<dialog>標簽屬性以及<dialog>標簽應用實例。 <dialog>標簽用法：用於定義對話框或視窗。 <dialog>標簽屬性： H5 : 表示HTML5 中的新屬性。 <dialog> ...
vue-router 組件復用問題

組件系統是Vue的一個重要組成部分，它可以將一個複雜的頁面抽象分解成許多小型、獨立、可復用的組件，通過組合組件來組成應用程式，結合``vue-router``的路由功能將各個組件映射到相應的路由上，通過路由的變化來告訴Vue要在哪裡渲染他們，實現各個組件、各個頁面之間的跳轉導航。 ...
ES6-18：class類及其繼承

JavaScript作為一個動態語言，很大程度上的詬病就是缺少了面向對象的類這個概念，ES5傳統的方法是通過構造函數來實現類的特性；ES6引入了類這一概念，將這個概念作為對象的模板，通過關鍵字可以定義類；本質上ES6中引入的類是一個語法糖，其大部分功能ES5均可實現； JavaScript語 ...
vue從入門到進階：指令與事件（二）

一.插值 v-once 通過使用 v-once 指令，你也能執行一次性地插值，當數據改變時，插值處的內容不會更新。但請留心這會影響到該節點上所有的數據綁定： v-html 雙大括弧會將數據解釋為普通文本，而非 HTML 代碼。為了輸出真正的 HTML，你需要使用 v-html 指令：這個 span ...
14、ABPZero系列教程之拼多多賣家工具新建微信公眾號模塊

說是模塊，其實在MVC中就是區域，新建一個區域專門管理整個微信功能。 Web項目新建區域在Web項目Areas目錄下新建一個區域，名稱為“Weixin",如下圖：接著打開web.config，修改如下代碼：文件路徑：D:\abp version\aspnet-zero-3.4.0\aspnet ...
Python的中文編碼問題

字元串是Python中最常用的數據類型，而且很多時候你會用到一些不屬於標準ASCII字元集的字元，這時候代碼就很可能拋出UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in position 10: ordinal not in ra ...
[譯] 12步輕鬆搞定python裝飾器

呵呵！作為一名教python的老師，我發現學生們基本上一開始很難搞定python的裝飾器，也許因為裝飾器確實很難懂。搞定裝飾器需要你瞭解一些函數式編程的概念，當然還有理解在python中定義和調用函數相關語法的一些特點。我沒法讓裝飾器變得簡單，但是通過一步步的剖析，我也許能夠讓你在理解裝飾器的時候 ...
也談 Python 的中文編碼處理

轉載自：http://in355hz.iteye.com/blog/1860787 最近業務中需要用 Python 寫一些腳本。儘管腳本的交互只是命令行 + 日誌輸出，但是為了讓界面友好些，我還是決定用中文輸出日誌信息。很快，我就遇到了異常： Python代碼 UnicodeEncodeError ...