簡單的用Python採集股票數據,保存表格後分析歷史數據

来源:https://www.cnblogs.com/hahaa/archive/2023/11/23/17852589.html
-Advertisement-
Play Games

前言 位元組跳動如果上市,那麼鐘老闆將成為我國第一個世界首富 趁著現在還沒上市,咱們提前學習一下用Python分析股票歷史數據,抱住粗大腿坐等起飛~ 好了話不多說,我們直接開始正文 準備工作 環境使用 Python 3.10 解釋器 Pycharm 編輯器 模塊使用 requests —> 數據請求模 ...


前言

位元組跳動如果上市,那麼鐘老闆將成為我國第一個世界首富


趁著現在還沒上市,咱們提前學習一下用Python分析股票歷史數據,抱住粗大腿坐等起飛~

好了話不多說,我們直接開始正文

準備工作

環境使用

  • Python 3.10 解釋器
  • Pycharm 編輯器

模塊使用

  • requests —> 數據請求模塊
  • csv -> 保存csv表格
  • pandas -> 可以實現保存Excel表格文件

requestspandas是第三方模塊,需要手動安裝,直接pip install 加上模塊名字即可。

案例實現流程

數據來源分析

  1. 明確需求: 明確採集的網站以及數據內容
    - 網址: 雪球網
    - 數據: 股票數據
  2. 抓包分析: 分析 股票數據, 可以請求那個網址能夠得到
    - 打開開發者工具: F12 / 右鍵點擊檢查選擇 network (網路)
    - 點擊第二頁數據
    數據包: https://stock.xueqiu.com/v5/stock/screener/quote/list.json?page=2&size=30&order=desc&order_by=amount&exchange=CN&market=CN&type=sha
    請求網址:
    請求方式:
    請求頭:

代碼實現步驟

  1. 發送請求 -> 模擬瀏覽器對於url發送請求
  2. 獲取數據 -> 獲取伺服器返迴響應數據 <整個數據>
  3. 解析數據 -> 提取我們需要數據
  4. 保存數據 -> 保存表格文件 < csv / Excel > 中

代碼解析

保存表格文件

  1. csv -> csv模塊
  2. Excel -> pandas模塊
# 創建文件對象
f = open('股票.csv', mode='w', encoding='utf-8', newline='')
# fieldnames 欄位名 表頭一行數據 <前面保存字典的鍵>
csv_writer= csv.DictWriter(f, fieldnames=[
    '股票代碼',
    '股票名稱',
    '當前價',
    '漲跌額',
    '漲跌幅',
    '年初至今',
    '成交量',
    '成交額',
    '換手率',
    '市盈率(TTM)',
    '股息率',
    '市值',
])
# 寫入表頭
csv_writer.writeheader()
# 創建一個空列表
content_list = []
# 源碼領取摳裙:815624229

 

 

發送請求

模擬瀏覽器對於url發送請求

  • 模擬瀏覽器: headers 請求頭
    • 從瀏覽器開發者工具中直接複製
    • 字典數據類型, 構建完整鍵值對形式
  • 請求網址:
    從瀏覽器開發者工具中直接複製
  • 發送請求:
    需要requests模塊 -> pip install requests

<Response [200]> 響應對象 表示請求成功

# 模擬瀏覽器
headers = {
    'Cookie': 's=av17ye9exq; xq_a_token=cf755d099237875c767cae1769959cee5a1fb37c; xq_r_token=e073320f4256c0234a620b59c446e458455626d9; xq_id_token=eyJ0eXAiOiJKV1QiLCJhbGciOiJSUzI1NiJ9.eyJ1aWQiOi0xLCJpc3MiOiJ1YyIsImV4cCI6MTcwMTk5NTg4MCwiY3RtIjoxNzAwNTYzOTE3MDU2LCJjaWQiOiJkOWQwbjRBWnVwIn0.EbAa9h0fB9H_sH415f3x8r2CQiKmPbXZMnuKCy401scB1lMQKOffws6WTwPD2UzFWnntYxIQYSJpX509VUYYgCQkZ_bYtLbtYd5PfxLhWx7coauYA4d3x5aZolzB3eP5IthaYAb0Kbj3MPK8LVRBhABpRGr4wajISuABFNezroM_-5dpiOYK7Rk0UXtU2Qhrzxi1BVCgFUhPP-oR_vKenBw5tLzSqa6aO7CukgI7JVb-6LiymuBquE8FE-de8Vs3evai0fvtjiqryrH3EWM3nmDQIayigHRrYo595bD32kUPP4swHF5U2fwbLHTntIRAm9LsXn8sVf-6sUdgHoYZGg; cookiesu=931700563933974; u=931700563933974; device_id=5da9e0ae658f9fcd3d89078312131fb7; Hm_lvt_1db88642e346389874251b5a1eded6e3=1700563934; Hm_lpvt_1db88642e346389874251b5a1eded6e3=1700563934',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36'
}
for page in range(1, 58):
    print(f'==============正在採集第{page}頁數據內容==============')
    # 請求網址
    url = f'https://stock.xueqiu.com/v5/stock/screener/quote/list.json?page={page}&size=30&order=desc&order_by=amount&exchange=CN&market=CN&type=sha'
    # 發送請求
    response = requests.get(url=url, headers=headers)

 

獲取數據

獲取伺服器返迴響應數據 <整個數據>

  • response.text 獲取響應文本數據 <字元串>
  • response.json() 獲取響應json數據 <json數據 大部分情況字典數據>
  • response.content 獲取響應二進位數據 <保存圖片/視頻/音頻/特定格式文件的時候>

解析數據

提取我們需要數據
解決數據方法根據獲取數據來選擇的:
字典取值方法 -> 鍵值對取值 (根據冒號左邊的內容[鍵], 提取冒號右邊的內容[值])

json_data = response.json()  # 返回json字典數據
# for迴圈遍歷
for index in json_data['data']['list'][1:]:
    # 提取數據保存到字典裡面, 方便後續保存表格文件
    dit = {
        '股票代碼': index['symbol'],
        '股票名稱': index['name'],
        '當前價': index['current'],
        '漲跌額': index['chg'],
        '漲跌幅': index['percent'],
        '年初至今': index['current_year_percent'],
        '成交量': index['volume'],
        '成交額': index['amount'],
        '換手率': index['turnover_rate'],
        '市盈率(TTM)': index['pe_ttm'],
        '股息率': index['dividend_yield'],
        '市值': index['market_capital'],
    }
    # 保存數據
    csv_writer.writerow(dit)
    # 把字典添加到空列表裡面
    content_list.append(dit)
    print(dit)

 

效果展示

獲取到數據保存到表格後

 

採集數據和可視化分析部分的代碼我都打包好了,下方源碼中自取。

 

可視化分析

import pandas as pd         # 做表格數據處理模塊 第三方的
from pyecharts.charts import Bar    # 可視化模塊 第三方模塊
from pyecharts import options as opts   # 可視化模塊裡面的設置模塊(圖表樣式)
 
# 1. 讀取數據
# 源碼領取+摳裙 815624229
df = pd.read_csv('股票.csv')
x = list(df['股票名稱'].values)
y = list(df['成交量'].values)
 
c = (
    Bar()
    .add_xaxis(x[:10])
    .add_yaxis("成交額", y[:10])
    .set_global_opts(
        xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),
        title_opts=opts.TitleOpts(title="Bar-旋轉X軸標簽", subtitle="解決標簽名字過長的問題"),
    )
    .render("成交量圖表.html")
)

 

好了,今天的分享就到這結束了,下次見。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近在一個大屏項目遇到一個需求:用戶可以通過一個按鈕,觸發頁面部分模塊全屏。通過以下API可以實現: Element.requestFullscreen()方法用於發出非同步請求使元素進入全屏模式。 且全屏狀態變化會觸發以下事件: fullscreenchange 事件會在瀏覽器進入或退出全屏模式後立 ...
  • 1、需求 使用Vue + Element UI 實現在列表的操作欄新增一個複製按鈕,複製當前行的數據可以打開新增彈窗後亦可以跳轉到新增頁面,本文實現為跳轉到新增頁面。 2、實現 1)列表頁 index.vue <el-table> <!-- 其他列 --> <el-table-column labe ...
  • ES6中的...(展開)語法是一種可以將數組或對象展開為函數參數或數組字面量的語法。它通常用於函數調用或數組字面量的展開。 在函數調用中,...可以將一個數組展開為函數的參數列表。例如: js複製代碼 function sum(a, b, c) { return a + b + c; } const ...
  • React實現視覺差效果緩動輪播 效果如下(圖片幀率低看起來有點卡頓,看個大概就行): 分享一下思路: 1.正常引入一個輪播組件(站在巨人肩膀省時省力),去除指示點、引導箭頭等不需要的元素,有些組件支持配置,不支持就手動覆蓋CSS樣式了 2.找到組件中用於顯示展示當前圖片的類名 3.添加transf ...
  • Node.js 是一個基於 Chrome V8 引擎的 JavaScript 運行環境,使用了一個事件驅動、非阻塞式 I/O 模型,讓 JavaScript 運行在服務端的開發平臺。 ...
  • 一、Vue3結構分析 1、Vue2與Vue3的對比 對TypeScript支持不友好(所有屬性都放在了this對象上,難以推倒組件的數據類型) 大量的API掛載在Vue對象的原型上,難以實現TreeShaking。 架構層面對跨平臺dom渲染開發支持不友好,vue3允許自定義渲染器,擴展能力強。 C ...
  • UDP 分片 與 丟包,UDP 真的比 TCP 高效嗎?UDP(用戶數據報協議)和TCP(傳輸控制協議)在很多方面都有顯著的區別。總體來說,TCP更適合需要可靠傳輸的應用,例如網頁瀏覽、電子郵件等,而UDP則更適合對速度有高要求,但對數據完整性要求較低的應用,例如實時視頻流或游戲。在多數網路環境下, ...
  • 十五、聯合體(union) 1、union語法 ​ 聯合體和結構體都是自定義數據類型 ,通過union可以創建一個聯合體,union中的成員變數共用記憶體(即記憶體中有重疊的部分),因此union的數據類型大小由其最大的成員變數決定。 //聯合體union語法 union 聯合體名稱 { 變數類型 變數 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...