Python統計字元出現次數(Counter包)以及txt文件寫入

来源:https://www.cnblogs.com/qi-yuan-008/archive/2019/10/16/11688911.html
-Advertisement-
Play Games

1. 統計字元(可以在jieba分詞之後使用) 2. 多次覆蓋,迴圈寫入文件 比如,迴圈兩次的結果是: 3. 一次性寫入文件,中間不會覆蓋和多次寫入;但是如果重覆運行代碼,則會覆蓋之前的全部內容,一次性重新寫入所有新內容 ...


# -*- coding: utf-8 -*-
#spyder (python 3.7)

1. 統計字元(可以在jieba分詞之後使用)

from collections import Counter
from operator import itemgetter

# txt_list可以寫成函數參數進行導入
txt_list = ['千古','人間','人間','','','','哈哈哈','人才','千古','千古']
c = Counter()
for x in txt_list:
    if len(x) >= 1:
        if x == '\r\n' or x == '\n' or x == ' ':
            continue
        else:
            c[x] += 1
print('常用詞頻統計結果: \n')
for (k, v) in c.most_common(4): #列印排名前四位
    print('%s%s %s  %d' % ('  ' * (3 ), k, '*' * 3, v))

# 按照詞頻數從大到小列印
d = sorted(c.items(),key=itemgetter(1),reverse = True)
for ss,tt in d:
    out_words=ss + '\t' + str(tt)
    print(out_words)

2. 多次覆蓋,迴圈寫入文件

#寫入文件,多次寫入,後一次覆蓋前一次,但是out_words本身是在疊加的
#即:第一次寫入的是:千古\t3\n;第二次寫入的是:千古\t3\n龍\t3\n,覆蓋上一次的數據;
#第三次是:千古\t3\n龍\t3\n人間\t2\n,繼續覆蓋上一次的數據
out_words = ''
for ss,tt in d:
    out_words=out_words + ss + '\t' + str(tt) + '\n'
    with open(r".\sss.txt", "w",encoding='utf-8') as f:
        f.write(out_words+'\n')

比如,迴圈兩次的結果是:

 3. 一次性寫入文件,中間不會覆蓋和多次寫入;但是如果重覆運行代碼,則會覆蓋之前的全部內容,一次性重新寫入所有新內容

out_words = ''
for ss,tt in d:
    out_words=out_words + ss + '\t' + str(tt) + '\n'
with open(r".\ttt.txt", "w",encoding='utf-8') as f:
        f.write(out_words+'\n')


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 單行結果集映射: 介面中方法返回值定義為Map類型,sql語句的resultType屬性設置為map即可。這種情況預設把列名作為key,列中的值作為value。 也就是說用map<Strirng,Object>接收,一個map集合對應查詢結果所封裝的一個對象(一行數據對應一個對象) 多行結果集映射: ...
  • 題目來源:https://www.luogu.org/problem/P1003 題目描述 為了準備一個獨特的頒獎典禮,組織者在會場的一片矩形區域(可看做是平面直角坐標系的第一象限)鋪上一些矩形地毯。一共有 nn 張地毯,編號從 11 到nn。現在將這些地毯按照編號從小到大的順序平行於坐標軸先後鋪設 ...
  • 微信搜索公眾號:Python極客社區。 每天分享不一樣的Python乾貨 PyCharm 是一種 Python IDE,可以幫助程式員節約時間,提高生產效率。那麼具體如何使用呢?本文從 PyCharm 安裝到插件、外部工具、專業版功能等進行了一一介紹,希望能夠幫助到大家。 "☞ 分享:最全最新的Py ...
  • 近日在YouTube視頻上看到關於vector中emplace_back與push_back區別的介紹,深感自己在現代C++中還是有不少遺漏的知識點,遂寫了段代碼,嘗試比較兩者的差別。 示例代碼 運行結果 結論 emplace_back方法可以不調用拷貝構造函數,所以理論上它應該比push_back ...
  • 在 "上篇文章" 中,我們簡單介紹了EurekaServer自動裝配及啟動流程解析,本篇文章則繼續研究EurekaClient的相關代碼 老規矩,先看 文件,其中引入了一個配置類 上方兩個註解則是這個配置類是否能夠開啟的條件,這裡就不再展開,直接看它引入的配置類吧 1. 細心的讀者可能會發現這裡又註 ...
  • import xlrdimport matplotlib.pyplot as plt bok = xlrd.open_workbook(r'test.xls') sht = bok.sheets()[0] row1 = sht.row_values(0) X=sht.col_values(0 , s ...
  • 使用Thymeleaf的屬性來設置HTML屬性。 (1)使用th:attr屬性可以修改原來HTML節點的屬性; (2)th:attr屬性可以同時設置多個屬性; (3)每一個HTML屬性都有對應的Thymeleaf屬性,如th:attr="value='值'"可換為th:value="值" (... ...
  • pycharm中.py文件模板應用方法: 設置->文件和代碼模板->文件->Python Script->右側輸入模板內容->應用->確定註釋: #開頭為單行註釋(快捷鍵為CTRL+/),成對的'''中間的為多行註釋多行代碼連接符:\ print("hello world") 等於print("he ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...