前言 本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。 Step1:基礎數據準備(通過爬蟲獲取到),以下是從第一期03年雙色球開獎號到今天的所有數據整理,截止目前一共2549期,balls.txt 文件內容如下 : 備註:想要現成 ...
前言
本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。
Step1:基礎數據準備(通過爬蟲獲取到),以下是從第一期03年雙色球開獎號到今天的所有數據整理,截止目前一共2549期,balls.txt 文件內容如下 :
備註:想要現成數據的可以給我發郵件喲~
Step2: 分析數據特征和數據處理方式選擇,直接上代碼如下:
#導入Counter from collections import Counter def readfile(): red_lists=[] blue_lists=[] #打開文件並獲取文件句柄 with open("./balls.txt", "r",encoding='utf-8') as fp: #開始讀取文件並返回一個list list1=fp.readlines() #遍歷整個文件內容 for i in range(len(list1)): #替換掉\n的字元再按空格分隔 list2=str(list1[i]).replace("\n","").split(" ") for j in range(len(list2)): if j==6: #藍球放入到blue_lists 列表中 blue_lists.append(list2[j]) else: #紅球放入到red_lists 列表中 red_lists.append(list2[j]) #Counter可以快速便捷的對某些對象做一些統計操作,這裡是對列表裡面的數據進行出現次數統計,返回一個tuple red_count=Counter(red_lists) blue_count=Counter(blue_lists) #most_common可以用來統計列表或字元串中最常出現的元素並做排序,並返回一個list k = red_count.most_common(len(red_count)) #輸出出現頻率最高的六個紅球 print("the red ball:",k[:6]) l = blue_count.most_common(len(blue_count)) #輸出出現頻率最高的六個藍球 print("the blue ball:",l[:6]) if __name__=="__main__": readfile()
Step3:執行結果如下:
Step4:執行結果驗證:
從官網獲取的數據進行對比,一致性校驗通過。
總結:python在數據處理方面有著非常強大的優勢,其實早先用過Panda庫也可以非常出色的完成雙色球的數據統計,大家有興趣的可以實驗一下。
加企鵝群695185429即可免費獲取,資料全在群文件里。資料可以領取包括不限於Python實戰演練、PDF電子文檔、面試集錦、學習資料等