Python統計字元出現次數(Counter包)以及txt文件寫入

-Advertisement-

1. 統計字元(可以在jieba分詞之後使用) 2. 多次覆蓋，迴圈寫入文件比如，迴圈兩次的結果是： 3. 一次性寫入文件，中間不會覆蓋和多次寫入；但是如果重覆運行代碼，則會覆蓋之前的全部內容，一次性重新寫入所有新內容 ...

# -*- coding: utf-8 -*-
#spyder (python 3.7)

1. 統計字元(可以在jieba分詞之後使用)

from collections import Counter
from operator import itemgetter

# txt_list可以寫成函數參數進行導入
txt_list = ['千古','人間','人間','龍','龍','龍','哈哈哈','人才','千古','千古']
c = Counter()
for x in txt_list:
    if len(x) >= 1:
        if x == '\r\n' or x == '\n' or x == ' ':
            continue
        else:
            c[x] += 1
print('常用詞頻統計結果: \n')
for (k, v) in c.most_common(4): #列印排名前四位
    print('%s%s %s  %d' % ('  ' * (3 ), k, '*' * 3, v))

# 按照詞頻數從大到小列印
d = sorted(c.items(),key=itemgetter(1),reverse = True)
for ss,tt in d:
    out_words=ss + '\t' + str(tt)
    print(out_words)

2. 多次覆蓋，迴圈寫入文件

#寫入文件，多次寫入，後一次覆蓋前一次，但是out_words本身是在疊加的
#即：第一次寫入的是：千古\t3\n;第二次寫入的是：千古\t3\n龍\t3\n，覆蓋上一次的數據;
#第三次是：千古\t3\n龍\t3\n人間\t2\n，繼續覆蓋上一次的數據
out_words = ''
for ss,tt in d:
    out_words=out_words + ss + '\t' + str(tt) + '\n'
    with open(r".\sss.txt", "w",encoding='utf-8') as f:
        f.write(out_words+'\n')

比如，迴圈兩次的結果是：

3. 一次性寫入文件，中間不會覆蓋和多次寫入；但是如果重覆運行代碼，則會覆蓋之前的全部內容，一次性重新寫入所有新內容

out_words = ''
for ss,tt in d:
    out_words=out_words + ss + '\t' + str(tt) + '\n'
with open(r".\ttt.txt", "w",encoding='utf-8') as f:
        f.write(out_words+'\n')

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

mybatis中處理結果集映射

單行結果集映射：介面中方法返回值定義為Map類型，sql語句的resultType屬性設置為map即可。這種情況預設把列名作為key,列中的值作為value。也就是說用map<Strirng,Object>接收，一個map集合對應查詢結果所封裝的一個對象（一行數據對應一個對象）多行結果集映射： ...
鋪地毯（取最上層的地毯）

題目來源：https://www.luogu.org/problem/P1003 題目描述為了準備一個獨特的頒獎典禮，組織者在會場的一片矩形區域（可看做是平面直角坐標系的第一象限）鋪上一些矩形地毯。一共有 nn 張地毯，編號從 11 到nn。現在將這些地毯按照編號從小到大的順序平行於坐標軸先後鋪設 ...
一份超級完整的PyCharm圖解教程

微信搜索公眾號：Python極客社區。每天分享不一樣的Python乾貨 PyCharm 是一種 Python IDE，可以幫助程式員節約時間，提高生產效率。那麼具體如何使用呢？本文從 PyCharm 安裝到插件、外部工具、專業版功能等進行了一一介紹，希望能夠幫助到大家。 "☞ 分享：最全最新的Py ...
編程雜談——使用emplace_back取代push_back

近日在YouTube視頻上看到關於vector中emplace_back與push_back區別的介紹，深感自己在現代C++中還是有不少遺漏的知識點，遂寫了段代碼，嘗試比較兩者的差別。示例代碼運行結果結論 emplace_back方法可以不調用拷貝構造函數，所以理論上它應該比push_back ...
EurekaClient自動裝配及啟動流程解析

在 "上篇文章" 中,我們簡單介紹了EurekaServer自動裝配及啟動流程解析，本篇文章則繼續研究EurekaClient的相關代碼老規矩，先看文件，其中引入了一個配置類上方兩個註解則是這個配置類是否能夠開啟的條件，這裡就不再展開，直接看它引入的配置類吧 1. 細心的讀者可能會發現這裡又註 ...
從excel 導入數據繪製散點圖

import xlrdimport matplotlib.pyplot as plt bok = xlrd.open_workbook(r'test.xls') sht = bok.sheets()[0] row1 = sht.row_values(0) X=sht.col_values(0 , s ...
Thymeleaf常用語法：HTML屬性設置

使用Thymeleaf的屬性來設置HTML屬性。（1）使用th:attr屬性可以修改原來HTML節點的屬性；（2）th:attr屬性可以同時設置多個屬性；（3）每一個HTML屬性都有對應的Thymeleaf屬性，如th:attr="value='值'"可換為th:value="值" （... ...
2019-10-16 python學習第一天

pycharm中.py文件模板應用方法: 設置->文件和代碼模板->文件->Python Script->右側輸入模板內容->應用->確定註釋: #開頭為單行註釋（快捷鍵為CTRL+/）,成對的'''中間的為多行註釋多行代碼連接符:\ print("hello world") 等於print("he ...