大數據為大家整理了Ofer Mendelevitch自己的觀點。 Mendelevitch認為無論是Java程式員還是業務分析師都有機會成為數據科學家,以下是他對不同人群給出的具體建議: Java程式員 作為Java開發者,你對軟體工程的規則已經瞭然於心,第一步需要瞭解機器學習的各種演算法:現在有哪些 ...
大數據為大家整理了Ofer Mendelevitch自己的觀點。 Mendelevitch認為無論是Java程式員還是業務分析師都有機會成為數據科學家,以下是他對不同人群給出的具體建議: Java程式員 作為Java開發者,你對軟體工程的規則已經瞭然於心,第一步需要瞭解機器學習的各種演算法:現在有哪些演算法,都能解決哪些問題以及如何實現。另外還需要學習使用R和Matlab等建模工具,此外WEKA、Vowpal Wabbit和OpenNLP等庫也為大多數常見演算法提供了經過驗證的實現方法。 如果你還不太熟悉Hadoop,也可以選擇加米谷大數據帶你入行!
很多初學者,對大數據的概念都是模糊不清的,大數據是什麼,能做什麼,學的時候,該按照什麼線路去學習,學完往哪方面發展,想深入瞭解,推薦一個大數據學習群 142974151每天晚上20:10都有一節【免費的】大數據直播課程,專註大數據分析方法,大數據編程,大數據倉庫,大數據案例,人工智慧,數據挖掘都是純乾貨分享,給大家分享目前國內最完整的大數據高端實戰實用學習流程體系。
Python程式員 如果你是Python程式員,對軟體開發和腳本編寫一定很熟悉,也許已經在使用很多數據科學中常見的庫例如NumPy和SciPy。 Python對數據科學應用的支持很好,尤其是NumPy/Scipy, Pandas, Scikit-learn, IPython等用於探索性分析的庫,在處理大型數據集方面,多學些Hadoop及其與Python的流式集成。 統計學從業者 如果你有統計學或者機器學習的背景,對於R、Matlab和SAS等工具一定非常熟悉,對於很多機器學習演算法都有很成熟的實現方法。但是,這些工具通常被用於做數據勘探和模型開發,很少單獨用來開發產品級的數據產品。顯然,熟悉一門現代編程語言,例如Java是你的首要任務。 業務分析師 如果你的背景是SQL,那麼說明你已經跟數據打交道很多年了,你很清楚如何通過數據獲取業務分析結果。Hive能讓你以你熟悉的SQL語言訪問Hadoop上的大數據集,因此是你步入大數據殿堂的首選。 總結 通向大數據之路不可能一帆風順,你必須學習很多新規則和最少一門編程語言,更重要的是還要積累實戰經驗)。這些都需要時間、精力以及金錢投入,但最終你會發現一切都物超所值