8步成為數據科學家

来源:https://www.cnblogs.com/shuzhiwuyu/archive/2019/04/03/10649342.html
-Advertisement-
Play Games

這是國外數據科學學習平臺DataCamp成員寫的一篇圖文《8步成為數據科學家》。我們具體來看下有哪些學習內容和學習資源。 ...


 

文章發佈於公號【數智物語】 (ID:decision_engine),關註公號不錯過每一篇乾貨。

 

 

 

轉自 |  猴子聊人物(公眾號ID:houziliaorenwu)

作者 |  猴子

 

 

這是國外數據科學學習平臺DataCamp成員寫的一篇圖文《8步成為數據科學家》。我們具體來看下有哪些學習內容和學習資源。

這裡說的8步,不是你用8周就可以完成,而是一種學習的方法。這些步驟雖然沒有那麼簡單,但是都是可操作,可實踐的。只要你投入時間去學習,相信時間的積累力量,就可以掌握這些知識。

 

首先,什麼是大數據科學家? 

 

數據科學家是一個跨學科人才,是比軟體工程師更擅長統計學,比統計學家更擅長軟體工程的人。需要掌握的知識有數學統計,編程能力,機器學習,研究能力等。

 

 

目前,數據科學家大部分是本科或者碩士學歷(本科37%,碩士31%)。但是不要擔心,從調查數據來看,有5%高中畢業的人也成為了數據科學家。這足以證明,只要你努力去提供自己,英雄是不問出處的。

 

 

01第1步:學好統計、數學和機器學習

 

下麵給出了學習這些知識的資源。如果感覺這些資源學起來太難,可以從《赤裸裸的統計學》、《深入淺出統計學》這兩本書入門。

 

5.jpg

 

02第2步:學會編程

 

掌握電腦科學的基礎知識,學會系統開發的整個過程(end-to-end development),因為你做的東西會成為其他系統的一部分。

 

選擇一種數據分析的編程語言,例如開源軟體的R , Python語言等,或者商業軟體的SAS, SPSS等。

 

在學習過程中可以用DataCamp, tryR, Codecademy或Google Class進行互動式學習。

 

 

03第3步:理解資料庫

 

在大部分的實際數據分析項目中,數據大部分是存儲在資料庫中的,所以你得學會資料庫的操作,如關係資料庫MySQL,非關係型資料庫MongoDB等。

 

 

04第4步:學會數據預處理、可視化和報表製作

 

1. 數據預處理:在數據分析師的工作中,有多達60%的時間都花在了實際分析前數據的準備上。數據預處理的目標是為了把數據改變成我們喜歡的樣子,以便於後期的分析處理。這就好比,現在很多女孩照相喜歡用美圖秀秀,眼睛不大,那我就用美圖秀秀把眼睛變大。變成自己喜歡的樣子。

 

 

數據預處理可自學Coursera中《Getting and Cleaning Data》的 課程(作者:John Hopkins)。也可以用工具DataWrangler、R語言的data.table和dply包。

 

2. 數據可視化:數據可視化是將數據分析的結果顯示出來,便於展示。實用工具有ggvis, D3, vega。

 

3. 數據報表:作為數據分析的最後一步,是將數據分析和結果製作成易於理解的報告。實用工具有Tableau, Spotfire和R Markdown。

 

 

05第5步:提升到大數據級別

 

當你開始處理海量規模的數據時,絕大多數的數據科學家要解決的問題,都無法在單機上完成,需要用分散式處理大數據集,使用的工具有Hadoop,Apache Spark。

 

 

06第6步:多實踐,與數據科學家大牛多交流

 

幸好是互聯網時代,我們可以通過網路認識大牛,並從他們分享的知識內容中學到更多經驗知識。當然,你也可以通過參加比賽,做小項目獲得更多的實踐經驗。

 

 

07第7步:實習、實戰、或找份工作

 

判別自己是不是一個真正的數據科學家的最佳途徑,就是用你新學的知識迎難而上,進入數據分析的工作領域。

 

 

08第8步:通過專業社區學到更多

 

數據分析的網站有:DataTau, Kdnuggets, fivethirtyeight, datascience101, r-bloggers。

 

可以看這些數據科學大牛的博客:Hilary Mason, David Smith, Nate Silver, dj patil。

 

可以從quandl上獲取數據。

 

 

以上就是成為數據科學家的8步,你在哪一步呢?

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、創建用戶: 2、增刪改查授權 3、存儲過程授權 4、禁止對錶授權 5、回收許可權 ...
  • 在日常執行mysql語句的過程中,都是客戶端進程向伺服器進程發送一段文本(MySQL語句),伺服器進程處理後再向客戶端進程發送一段文本(處理結果). 看似很簡單,其實不然,這內容有很多東西是需要註意的.下麵借用兩張圖來說明,其實兩張圖表示的意思都是一樣. 上面的圖對於中間的解析和優化不是很透徹,下麵 ...
  • mysql遍歷節點的所有子節點 DELIMITER // CREATE FUNCTION `getChildrenList`(rootId INT) RETURNS VARCHAR(500) BEGIN DECLARE sTemp VARCHAR(500); DECLARE sTempChd VAR... ...
  • mysql創建存儲過程 mysql 存儲過程有參數輸入拼接 mysql存儲過程含輸入參數的拼接的分頁 ...
  • 本文適合初學JAVA,要用到MySQL開發的學習者。 第一步、下載MySQL 1. 百度mysql,找到官網,點擊進入。 2. 進入官網,點擊DOWNLOADS,在DOWNLOADS菜單欄中點擊Community,接著在左側菜單欄中找到MySQL Community Server, 點擊進入。 3. ...
  • 以下命令均在mysql命令行下執行。1. 修改表名稱有2種方法,mysql命令行,沒有區分大小寫,方法1:mysql>ALTER TABLE 表名l RENAME TO 表名2; 方法2:mysql>rename table 表名1 to 表名2; 2. 修改表中的欄位預設值,mysql>ALTER ...
  • 1、mysqladmin語句: # 查看mysql版本 mysqladmin version # 更改root用戶密碼 mysqladmin -u root -p原密碼 password '新密碼' # 查看資料庫是否可用 mysqladmin -uroot -p ping # 創建資料庫 mysq ...
  • 很久沒有使用命令行操作Mysql,百度搜羅,重新整理,加強記憶,便於查詢。 以下命令均在win7,64位操作系統下,cmd命令行操作; 一、創建1個Mysql 資料庫 二、刪除1個Mysql資料庫 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...