python抓取NBA現役球員基本信息數據併進行分析

来源:http://www.cnblogs.com/buddyquan/archive/2017/02/18/6412157.html
-Advertisement-
Play Games

鏈接:http://china.nba.com/playerindex/ 所需獲取JSON數據頁面鏈接:http://china.nba.com/static/data/league/playerlist.json 數據來源:NBA中國官網 庫: requests 用於解析頁面文本數據 pandas ...


鏈接:http://china.nba.com/playerindex/

所需獲取JSON數據頁面鏈接:http://china.nba.com/static/data/league/playerlist.json

數據來源:NBA中國官網

庫:

requests 用於解析頁面文本數據

pandas   用於處理數據

時間:

2017/2/17 (因為為現役球員,故需註明時間節點)

開工:

 

 得到了數據,這下就好辦了

先上簡單粗暴夠用的代碼

 import requests
 2 import pandas as pd
 3 user_agent = 'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)'
 4 headers = {'User-Agent':user_agent}
 5 url='http://china.nba.com/static/data/league/playerlist.json'
 6 #解析網頁
 7 r=requests.get(url,headers=headers).json() 
 8 num=int(len(r['payload']['players']))-1 #得到列表r['payload']['players']的長度
 9 p1_cols=[] #用來存放p1數組的列
10 p2_cols=[] #用來存放p2數組的列
11 #遍歷其中一個['playerProfile'],['teamProfile'] 得到各自列名,添加到p1_cols和p2_cols列表中
12 for x in r['payload']['players'][0]['playerProfile']:
13     p1_cols.append(x)
14 for y in r['payload']['players'][0]['teamProfile']:
15     p2_cols.append(y)
16 p1=pd.DataFrame(columns=p1_cols) #初始化一個DataFrame p1 用來存放playerProfile下的數據
17 p2=pd.DataFrame(columns=p2_cols) #初始化一個DataFrame p1 用來存放playerProfile下的數據
18  #遍歷一次得到一個球員的信息,分別添加到DataFrame數組中
19 for z in range(num):
20     player=pd.DataFrame([r['payload']['players'][z]['playerProfile']])
21     team=pd.DataFrame([r['payload']['players'][z]['teamProfile']])
22     p1=p1.append(player,ignore_index=True)
23     p2=p2.append(team,ignore_index=True)
24 p3=pd.merge(p1,p2,left_index=True,right_index=True) #數據合併
25 p3.to_csv('f://NBA//nba_player.csv',index=False)

 只能說簡單粗暴,25行代碼搞定,恩,不過數據已經拿到手。

接下來查看一下

數據量不大,也可以用EXCEL來'偷窺'

 拿到數據,總得稍微把玩一下,才對得起這堆數據,不然和撩到了步行街標準9分妹子就分手有什麼區別呢?

瞭解下基本的數據情況

截止全明星賽前有449名現役球員

那麼各球隊球員數量具體是多少呢?

老詹的騎士還差個控位,湖人在為明年做準備

 很想瞭解下NBA球員國籍'country'的情況

 也就是說449名現役大名單球員里,有340名美國佬咯,螺旋穩

其中,

亞洲帥哥2枚,喬治亞的Zaza Pachulia 和 以色列的Omri Casspi 撐場

非洲在大帝的領導下,率將領14名出征,NBA官網上28卡國籍是剛果。

 歐洲55人;大洋洲8人(澳大利亞7人,紐西蘭1人);南美12人;還有4人,暫且未知(NBA資料庫未補充)

 

 接下來,看一下現役球員中,每一屆球員的情況

 98屆的 Vince Carter,Paul Pierce,Dirk Nowitzki  

99屆的Manu Ginobili,Jason Terry,Metta World Peace   

00屆的Jamal Crawford,Mike Miller

01屆的Tyson Chandler,Pau Gasol,Richard Jefferson,Joe Johnson,Tony Parker,Zach Randolph

02屆的Matt Barnes,Mike Dunleavy,Udonis Haslem,Nene,Luis Scola

終有一天他們會離去,就像去年夏天的Tim,Bryant 和 Kevin

還是那句話,老兵不死,只是凋零。

03白金一代也只有12人在戰鬥了,當安東尼頂替樂福進入16/17/全明星賽時,老詹說自己不再是年齡最大的那位了,當時的你又在想啥呢?

這裡我們需要再看一項數據,就是NBA現役球員的NBA平均職業生涯年齡是多少呢?

現役球員平均職業年齡為4.76年。

新生代球員配上新時代的體系及打法,NBA也是越來越好看,越來越激烈。每一位成功的球員都是為那個時代而生的。

 

下麵,我們看一個很有意思的數據

現役NBA球員,最受歡迎的號碼前5是哪幾個號碼呢?

只能說,666。原來5號,8號這麼受歡迎。

 還有,我們平時看NBA,主播評論員都是只說美國人的lastName,所以有時候一個隊有幾個湯普森或者約翰遜,滿臉茫然

 朋友,我會告訴你,共有7個約翰遜,統統來自美國。東部4個約翰遜,西部3個約翰遜。

熱火VS快船比賽解說可能就是,約翰遜外線傳球給約翰遜被殺出來的約翰遜搶斷成功,掩耳不及迅雷之勢傳給快下的約翰遜,輕鬆扣籃得手。

 那球員的位置分佈怎麼樣呢?小球時代,自我感覺整個聯盟後場球員會遙遙領先前場球員,一起來看看,果不其然。

今天就聊到這裡吧

還有許多有趣的欄位,有待開發。無兄弟,不籃球,期待與大伙一起為了我們興趣,一起討論交流,

I am a JRS,We are family ,他強任他強。

 小白一枚,能力有限,做的不好的地方,尤其是邏輯與思維上的東西,需要大神們看到了多多指教和斧正buddyquan。

小白博客:https://home.cnblogs.com/u/buddyquan/ QQ:1749061919 小白爬蟲求帶
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 導航 閱讀本文之前,您也可以到Asp.Net Web API 2 系列導航進行查看 http://www.cnblogs.com/aehyok/p/3446289.html。 本文主要來講解以下內容: 〇、前言 Ⅰ、Using[FromUri] Ⅱ、Using[FromBody] Ⅲ、Type Co ...
  • 本文的主要內容是通過兩種方式實現簡單郵件的接收,一種方式是通過C語言實現,另一種是通過C#實現的, 兩種方式在實現上有許多的不同之處,但是本質上都是一樣的. 一,C語言實現方式 C語言接收郵件的步驟: 1.創建TCP連接 埠:預設110 2.連接到Pop3伺服器 伺服器名稱:例如"pop3.163 ...
  • 浪漫的周末從cnblogs開始。話說,今天和往常的周末一樣,韓君躲在被窩裡用手機翻閱著園子里的珠璣。一篇《應用XML作為資料庫的快速開發框架》的文章在韓君腦子裡激起了一波球形閃電。想想上周中剛好完成的一個WinCE小項目,這波久久不能平息。韓君做了一個比馬兄更艱難的決定,秒速穿戴衣褲後,開始了那第N ...
  • EF Core 1.0 Database First http://www.cnblogs.com/linezero/p/EFCoreDBFirst.html ASP.NET Core 開發 - Entity Framework (EF) Core,ASP.NET Core 操作資料庫。 Entit ...
  • 今後爭取每兩天能更新一次。平日的誘惑太多,雙休只顧玩了,進度有點慢。 接上一講的,類型的安全性,留下了點小尾巴——比較對象的相等性。 C#有四種比較相等的方式:除了“==”運算符外,System.Object定義了3中方法:ReferenceEqual()方法和兩種Equals(); 1.首先是“= ...
  • 前言 之前對於用SelfHost來手動實現Web API的宿主模式,似乎不是太深入,所以本篇文章我們一起來討論關於利用HttpClient來訪問Web API上的資源來進行探討以及註意相關事項,希望此文對你也有收穫。 來自XML或Json Content的簡單參數 當Web API方法中接受如Str ...
  • 註:下載本文提到的完整代碼示例請訪問:How to authorization Angular 2 app with asp.net core web api 在ASP.NET Core中使用Angular2,以及與Angular2的Token base身份認證 Angular2是對Angular1 ...
  • 本文版權歸博客園和作者吳雙本人共同所有,轉載和爬蟲請註明原文地址 www.cnblogs.com/tdws 相信瞭解了MS Identity認證體系的一定知道UserManager的作用,他是整個體系中的調度者,他定義了一套用戶行為來幫助我們管理用戶信息,角色信息,處理密碼等。而其實現則在UserS ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...