20190221-文件操作

来源:https://www.cnblogs.com/hyj691001/archive/2019/02/21/10415427.html
-Advertisement-
Play Games

假定一個全英文的文件,讀取該文件,請統計多少個不重覆的單詞,並且在另外一個文件中寫上結果每個單詞出現的次數,以及一共有多少個不重覆的單詞分別為哪些 註意:文件中可能包含特殊符號 Step1:打開文件,可使用方法如下: 方法1:fp = open(file,'r',encoding ='utf-8') ...


假定一個全英文的文件,讀取該文件,請統計多少個不重覆的單詞,並且在另外一個文件中寫上結果每個單詞出現的次數,以及一共有多少個不重覆的單詞分別為哪些

 

註意:文件中可能包含特殊符號

Step1:打開文件,可使用方法如下:

  方法1:fp = open(file,'r',encoding ='utf-8')

  方法2:with open(file,'r',encoding ='utf-8') as fp:

Step2:讀取文件,基於該題的需求,我們按行讀取,並對每行進行處理如下:

  1.讀取每一行,將每一行中的特殊字元替換為空白

  2.將替換後的字元加到一個content裡面(content最終用來存儲文件裡面的所有被去掉特殊字元的單詞結果)

Step3:統計每個單詞的出現次數:

  1.統計結果使用字典存儲格式如下{單詞:出現次數}

  2.出現次數為1的單詞即為不重覆的單詞

Step4:將每個單詞的出現次數寫到一個新的文件中

  1.遍歷step產生的字典,將Key:value寫入新的文件

代碼如下:

def count_file_content(file_dir):
    result =''#存儲所有被處理了特殊字元的文件內容
    word_count_result={}#存儲單詞出現次數
    import string
    with open(file_dir,'r',encoding ='utf-8') as fp:
        for line in fp:
            s = line.strip()
            for i in string.punctuation:
                s = s.replace(i,' ')
            result +=s
#獲取不包含特殊字元的文件內容
    word_list = result.split()
    for item in word_list:
       # print(item)
        if item in word_count_result.keys():
            word_count_result[item]+=1
        else:
            word_count_result[item]=1
#獲取每個單詞出現次數
    count =0
    non_duplicateword=[]
    #統計不重覆單詞的個數
    for k,w in word_count_result.items():
        if w ==1:
            count+=1
            non_duplicateword.append(k)
#non_duplicateword存儲的所有僅出現一次的單詞,count 為僅出現一次的單詞總數
    with open(file_dir+'result.txt','w',encoding ='utf-8') as fp1:
        fp1.write('一共'+str(count)+'個不重覆的單詞\n')
        for k,w in word_count_result.items():
            fp1.write(k+"單詞出現"+str(w)+"次\n")
#將結果寫入另一個文件中

 

 

 

 

  

    

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • wxPython框架雖然成熟穩定,但是相對最近更火的PyQt框架來說,還是顯得古老了一些,控制項風格不符合現代審美觀,因此痞子衡決定學習一下PyQt的用法,感受下PyQt做出來的界面效果到底如何。根據wxPython學習經驗,當然首先要從PyQt的可視化GUI構建工具Qt Designer開始下手,因... ...
  • 本文通過講解如何解析application.properties屬性,介紹了幾個註解的運用@Value @ConfigurationProperties @EnableConfigurationProperties @Autowired @ConditionalOnProperty ...
  • 一個項目里只能有一個main函數, 如果出現 error:LNK2005 的錯誤,那麼需要檢查你是不是有兩個源代碼文件中都定義了main函數。 例如: 如果在a.cpp中定義了main函數,在b.cpp中也定義main函數,編譯執行就會報 error:LNK2005 的錯誤。 ...
  • 一、 lucene簡介 1. Lucene Lucene是apache下的一個開源的全文檢索引擎工具包。它為軟體開發人員提供一個簡單易用的工具包(類庫),以方便的在目標系統中實現全文檢索的功能。 官網: http://lucene.apache.org/ 2. 全文檢索 全文檢索是指電腦索引程式通 ...
  • 前面介紹了Lambda表達式的用法,從實踐中發現它確實極大地方便了開發者,然而不管是匿名內部類還是Lambda表達式,所舉的例子都離不開各類數組的排序方法,倘使Lambda表達式僅能用於sort方法,無疑限制了它的應用範圍。那麼除了sort方法,還有哪些場景能夠將Lambda表達式派上用場呢?既然匿 ...
  • 類可以允許其他類或者函數訪問他的非公有成員,方法是令其他類或者函數成為他的友元(friend)。 友元的聲明: 友元聲明只能出現在類的內部,但是在類內出現的具體位置不限;由於友元不是類的成員,所以不受所在區域訪問控制級別的約束。 友元的聲明並非傳統意義上的聲明,所以為了能夠正確的調用該友元函數,還須 ...
  • 輸出結果: ...
  • 題意 "題目鏈接" Sol 神仙題Orz 首先不難看出如果我們從$a_i$向$i$連一條邊,我們會得到以$0$為根的樹(因為每個點一定都有一個入度,出現環說明無解),同時在進行排列的時候需要保證父親節點一定在孩子節點之前出現 接下來考慮直接貪心。對於某些權值很小的點,我們需要讓其儘早出現,同時又要滿 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 本文介紹一款使用 C# 與 WPF 開發的音頻播放器,其界面簡潔大方,操作體驗流暢。該播放器支持多種音頻格式(如 MP4、WMA、OGG、FLAC 等),並具備標記、實時歌詞顯示等功能。 另外,還支持換膚及多語言(中英文)切換。核心音頻處理採用 FFmpeg 組件,獲得了廣泛認可,目前 Git ...
  • OAuth2.0授權驗證-gitee授權碼模式 本文主要介紹如何筆者自己是如何使用gitee提供的OAuth2.0協議完成授權驗證並登錄到自己的系統,完整模式如圖 1、創建應用 打開gitee個人中心->第三方應用->創建應用 創建應用後在我的應用界面,查看已創建應用的Client ID和Clien ...
  • 解決了這個問題:《winForm下,fastReport.net 從.net framework 升級到.net5遇到的錯誤“Operation is not supported on this platform.”》 本文內容轉載自:https://www.fcnsoft.com/Home/Sho ...
  • 國內文章 WPF 從裸 Win 32 的 WM_Pointer 消息獲取觸摸點繪製筆跡 https://www.cnblogs.com/lindexi/p/18390983 本文將告訴大家如何在 WPF 裡面,接收裸 Win 32 的 WM_Pointer 消息,從消息裡面獲取觸摸點信息,使用觸摸點 ...
  • 前言 給大家推薦一個專為新零售快消行業打造了一套高效的進銷存管理系統。 系統不僅具備強大的庫存管理功能,還集成了高性能的輕量級 POS 解決方案,確保頁面載入速度極快,提供良好的用戶體驗。 項目介紹 Dorisoy.POS 是一款基於 .NET 7 和 Angular 4 開發的新零售快消進銷存管理 ...
  • ABP CLI常用的代碼分享 一、確保環境配置正確 安裝.NET CLI: ABP CLI是基於.NET Core或.NET 5/6/7等更高版本構建的,因此首先需要在你的開發環境中安裝.NET CLI。這可以通過訪問Microsoft官網下載並安裝相應版本的.NET SDK來實現。 安裝ABP ...
  • 問題 問題是這樣的:第三方的webapi,需要先調用登陸介面獲取Cookie,訪問其它介面時攜帶Cookie信息。 但使用HttpClient類調用登陸介面,返回的Headers中沒有找到Cookie信息。 分析 首先,使用Postman測試該登陸介面,正常返回Cookie信息,說明是HttpCli ...
  • 國內文章 關於.NET在中國為什麼工資低的分析 https://www.cnblogs.com/thinkingmore/p/18406244 .NET在中國開發者的薪資偏低,主要因市場需求、技術棧選擇和企業文化等因素所致。歷史上,.NET曾因微軟的閉源策略發展受限,儘管後來推出了跨平臺的.NET ...
  • 在WPF開發應用中,動畫不僅可以引起用戶的註意與興趣,而且還使軟體更加便於使用。前面幾篇文章講解了畫筆(Brush),形狀(Shape),幾何圖形(Geometry),變換(Transform)等相關內容,今天繼續講解動畫相關內容和知識點,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 什麼是委托? 委托可以說是把一個方法代入另一個方法執行,相當於指向函數的指針;事件就相當於保存委托的數組; 1.實例化委托的方式: 方式1:通過new創建實例: public delegate void ShowDelegate(); 或者 public delegate string ShowDe ...