python抓取NBA現役球員基本信息數據併進行分析

来源:http://www.cnblogs.com/buddyquan/archive/2017/02/18/6412157.html
-Advertisement-
Play Games

鏈接:http://china.nba.com/playerindex/ 所需獲取JSON數據頁面鏈接:http://china.nba.com/static/data/league/playerlist.json 數據來源:NBA中國官網 庫: requests 用於解析頁面文本數據 pandas ...


鏈接:http://china.nba.com/playerindex/

所需獲取JSON數據頁面鏈接:http://china.nba.com/static/data/league/playerlist.json

數據來源:NBA中國官網

庫:

requests 用於解析頁面文本數據

pandas   用於處理數據

時間:

2017/2/17 (因為為現役球員,故需註明時間節點)

開工:

 

 得到了數據,這下就好辦了

先上簡單粗暴夠用的代碼

 import requests
 2 import pandas as pd
 3 user_agent = 'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)'
 4 headers = {'User-Agent':user_agent}
 5 url='http://china.nba.com/static/data/league/playerlist.json'
 6 #解析網頁
 7 r=requests.get(url,headers=headers).json() 
 8 num=int(len(r['payload']['players']))-1 #得到列表r['payload']['players']的長度
 9 p1_cols=[] #用來存放p1數組的列
10 p2_cols=[] #用來存放p2數組的列
11 #遍歷其中一個['playerProfile'],['teamProfile'] 得到各自列名,添加到p1_cols和p2_cols列表中
12 for x in r['payload']['players'][0]['playerProfile']:
13     p1_cols.append(x)
14 for y in r['payload']['players'][0]['teamProfile']:
15     p2_cols.append(y)
16 p1=pd.DataFrame(columns=p1_cols) #初始化一個DataFrame p1 用來存放playerProfile下的數據
17 p2=pd.DataFrame(columns=p2_cols) #初始化一個DataFrame p1 用來存放playerProfile下的數據
18  #遍歷一次得到一個球員的信息,分別添加到DataFrame數組中
19 for z in range(num):
20     player=pd.DataFrame([r['payload']['players'][z]['playerProfile']])
21     team=pd.DataFrame([r['payload']['players'][z]['teamProfile']])
22     p1=p1.append(player,ignore_index=True)
23     p2=p2.append(team,ignore_index=True)
24 p3=pd.merge(p1,p2,left_index=True,right_index=True) #數據合併
25 p3.to_csv('f://NBA//nba_player.csv',index=False)

 只能說簡單粗暴,25行代碼搞定,恩,不過數據已經拿到手。

接下來查看一下

數據量不大,也可以用EXCEL來'偷窺'

 拿到數據,總得稍微把玩一下,才對得起這堆數據,不然和撩到了步行街標準9分妹子就分手有什麼區別呢?

瞭解下基本的數據情況

截止全明星賽前有449名現役球員

那麼各球隊球員數量具體是多少呢?

老詹的騎士還差個控位,湖人在為明年做準備

 很想瞭解下NBA球員國籍'country'的情況

 也就是說449名現役大名單球員里,有340名美國佬咯,螺旋穩

其中,

亞洲帥哥2枚,喬治亞的Zaza Pachulia 和 以色列的Omri Casspi 撐場

非洲在大帝的領導下,率將領14名出征,NBA官網上28卡國籍是剛果。

 歐洲55人;大洋洲8人(澳大利亞7人,紐西蘭1人);南美12人;還有4人,暫且未知(NBA資料庫未補充)

 

 接下來,看一下現役球員中,每一屆球員的情況

 98屆的 Vince Carter,Paul Pierce,Dirk Nowitzki  

99屆的Manu Ginobili,Jason Terry,Metta World Peace   

00屆的Jamal Crawford,Mike Miller

01屆的Tyson Chandler,Pau Gasol,Richard Jefferson,Joe Johnson,Tony Parker,Zach Randolph

02屆的Matt Barnes,Mike Dunleavy,Udonis Haslem,Nene,Luis Scola

終有一天他們會離去,就像去年夏天的Tim,Bryant 和 Kevin

還是那句話,老兵不死,只是凋零。

03白金一代也只有12人在戰鬥了,當安東尼頂替樂福進入16/17/全明星賽時,老詹說自己不再是年齡最大的那位了,當時的你又在想啥呢?

這裡我們需要再看一項數據,就是NBA現役球員的NBA平均職業生涯年齡是多少呢?

現役球員平均職業年齡為4.76年。

新生代球員配上新時代的體系及打法,NBA也是越來越好看,越來越激烈。每一位成功的球員都是為那個時代而生的。

 

下麵,我們看一個很有意思的數據

現役NBA球員,最受歡迎的號碼前5是哪幾個號碼呢?

只能說,666。原來5號,8號這麼受歡迎。

 還有,我們平時看NBA,主播評論員都是只說美國人的lastName,所以有時候一個隊有幾個湯普森或者約翰遜,滿臉茫然

 朋友,我會告訴你,共有7個約翰遜,統統來自美國。東部4個約翰遜,西部3個約翰遜。

熱火VS快船比賽解說可能就是,約翰遜外線傳球給約翰遜被殺出來的約翰遜搶斷成功,掩耳不及迅雷之勢傳給快下的約翰遜,輕鬆扣籃得手。

 那球員的位置分佈怎麼樣呢?小球時代,自我感覺整個聯盟後場球員會遙遙領先前場球員,一起來看看,果不其然。

今天就聊到這裡吧

還有許多有趣的欄位,有待開發。無兄弟,不籃球,期待與大伙一起為了我們興趣,一起討論交流,

I am a JRS,We are family ,他強任他強。

 小白一枚,能力有限,做的不好的地方,尤其是邏輯與思維上的東西,需要大神們看到了多多指教和斧正buddyquan。

小白博客:https://home.cnblogs.com/u/buddyquan/ QQ:1749061919 小白爬蟲求帶
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 導航 閱讀本文之前,您也可以到Asp.Net Web API 2 系列導航進行查看 http://www.cnblogs.com/aehyok/p/3446289.html。 本文主要來講解以下內容: 〇、前言 Ⅰ、Using[FromUri] Ⅱ、Using[FromBody] Ⅲ、Type Co ...
  • 本文的主要內容是通過兩種方式實現簡單郵件的接收,一種方式是通過C語言實現,另一種是通過C#實現的, 兩種方式在實現上有許多的不同之處,但是本質上都是一樣的. 一,C語言實現方式 C語言接收郵件的步驟: 1.創建TCP連接 埠:預設110 2.連接到Pop3伺服器 伺服器名稱:例如"pop3.163 ...
  • 浪漫的周末從cnblogs開始。話說,今天和往常的周末一樣,韓君躲在被窩裡用手機翻閱著園子里的珠璣。一篇《應用XML作為資料庫的快速開發框架》的文章在韓君腦子裡激起了一波球形閃電。想想上周中剛好完成的一個WinCE小項目,這波久久不能平息。韓君做了一個比馬兄更艱難的決定,秒速穿戴衣褲後,開始了那第N ...
  • EF Core 1.0 Database First http://www.cnblogs.com/linezero/p/EFCoreDBFirst.html ASP.NET Core 開發 - Entity Framework (EF) Core,ASP.NET Core 操作資料庫。 Entit ...
  • 今後爭取每兩天能更新一次。平日的誘惑太多,雙休只顧玩了,進度有點慢。 接上一講的,類型的安全性,留下了點小尾巴——比較對象的相等性。 C#有四種比較相等的方式:除了“==”運算符外,System.Object定義了3中方法:ReferenceEqual()方法和兩種Equals(); 1.首先是“= ...
  • 前言 之前對於用SelfHost來手動實現Web API的宿主模式,似乎不是太深入,所以本篇文章我們一起來討論關於利用HttpClient來訪問Web API上的資源來進行探討以及註意相關事項,希望此文對你也有收穫。 來自XML或Json Content的簡單參數 當Web API方法中接受如Str ...
  • 註:下載本文提到的完整代碼示例請訪問:How to authorization Angular 2 app with asp.net core web api 在ASP.NET Core中使用Angular2,以及與Angular2的Token base身份認證 Angular2是對Angular1 ...
  • 本文版權歸博客園和作者吳雙本人共同所有,轉載和爬蟲請註明原文地址 www.cnblogs.com/tdws 相信瞭解了MS Identity認證體系的一定知道UserManager的作用,他是整個體系中的調度者,他定義了一套用戶行為來幫助我們管理用戶信息,角色信息,處理密碼等。而其實現則在UserS ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...