大數據學習資源彙總

来源:http://www.cnblogs.com/dunitian/archive/2016/05/05/5461280.html
-Advertisement-
Play Games

當前,整個互聯網正在從IT時代向DT時代演進,大數據技術也正在助力企業和公眾敲開DT世界大門。當今“大數據”一詞的重點其實已經不僅在於數據規模的定義,它更代表著信息技術發展進入了一個新的時代,代表著爆炸性的數據信息給傳統的計算技術和信息技術帶來的技術挑戰和困難,代表著大數據處理所需的新的技術和方法, ...


當前,整個互聯網正在從IT時代向DT時代演進,大數據技術也正在助力企業和公眾敲開DT世界大門。當今“大數據”一詞的重點其實已經不僅在於數據規模的定義,它更代表著信息技術發展進入了一個新的時代,代表著爆炸性的數據信息給傳統的計算技術和信息技術帶來的技術挑戰和困難,代表著大數據處理所需的新的技術和方法,也代表著大數據分析和應用所帶來的新發明、新服務和新的發展機遇。

為了幫助大家更好深入瞭解大數據,雲棲社區組織翻譯了GitHub Awesome Big Data資源,供大家參考。本資源類型主要包括:大數據框架、論文等實用資源集合

 

資源列表:

 

  •   關係資料庫管理系統(RDBMS
  •   框架
  •   分散式編程
  •   分散式文件系統
  •   文件數據模型
  •   Key -Map 數據模型
  •   -值數據模型
  •   圖形數據模型
  •   NewSQL資料庫
  •   列式資料庫
  •   時間序列資料庫
  •   SQL處理
  •   數據攝取
  •   服務編程
  •   調度
  •   機器學習
  •   基準測試
  •   安全性
  •   系統部署
  •   應用程式
  •   搜索引擎與框架
  •   MySQL的分支和演化
  •   PostgreSQL的分支和演化
  •   Memcached的分支和演化
  •   嵌入式資料庫
  •   商業智能
  •   數據可視化
  •   物聯網和感測器
  •   文章
  •   論文
  •   視頻

 

關係資料庫管理系統RDBMS

 

  •  SQLServer世界最有活力的資料庫;  
  •   MySQL:世界最流行的開源資料庫;
  •   PostgreSQL:世界最先進的開源資料庫;
  •   Oracle 資料庫:對象-關係型資料庫管理系統。

 

框架

 

  •   Apache Hadoop:分散式處理架構,結合了 MapReduce(並行處理)、YARN(作業調度)和HDFS(分散式文件系統);
  •   Tigon:高吞吐量實時流處理框架。

 

分散式編程

 

  •   AddThis Hydra :最初在AddThis上開發的分散式數據處理和存儲系統;
  •   AMPLab SIMR:用在Hadoop MapReduce v1上運行Spark
  •   Apache Beam:為統一的模型以及一套用於定義和執行數據處理工作流的特定SDK語言;
  •   Apache Crunch:一個簡單的Java API,用於執行在普通的MapReduce實現時比較單調的連接、數據聚合等任務;
  •   Apache DataFu:由LinkedIn開發的針對Hadoop and Pig的用戶定義的函數集合;
  •   Apache Flink:具有高性能的執行時間和自動程式優化;
  •   Apache Gora:記憶體中的數據模型和持久性框架;
  •   Apache HamaBSP(整體同步並行)計算框架;
  •   Apache MapReduce :在集群上使用並行、分散式演算法處理大數據集的編程模型;
  •   Apache Pig Hadoop中,用於處理數據分析程式的高級查詢語言;
  •   Apache REEF :用來簡化和統一低層大數據系統的保留性評估執行框架;
  •   Apache S4 S4中流處理與實現的框架;
  •   Apache Spark :記憶體集群計算框架;
  •   Apache Spark Streaming :流處理框架,同時是Spark的一部分;
  •   Apache Storm Twitter流處理框架,也可用於YARN
  •   Apache Samza :基於KafkaYARN的流處理框架;
  •   Apache Tez :基於YARN,用於執行任務中的複雜DAG(有向無環圖);
  •   Apache Twill :基於YARN的抽象概念,用於減少開發分散式應用程式的複雜度;
  •   Cascalog:數據處理和查詢庫;
  •   Cheetah :在MapReduce之上的高性能、自定義數據倉庫;
  •   Concurrent Cascading :在Hadoop上的數據管理/分析框架;
  •   Damballa Parkour :用於ClojureMapReduce庫;
  •   Datasalt Pangool :可選擇的MapReduce範例;
  •   DataTorrent StrAM :為實時引擎,用於以儘可能暢通的方式、最小的開支和對性能最小的影響,實現分散式、非同步、實時的記憶體大數據計算;
  •   Facebook Corona :為Hadoop做優化處理,從而消除單點故障;
  •   Facebook Peregrine MapReduce框架;
  •   Facebook Scuba :分散式記憶體數據存儲;
  •   Google Dataflow :創建數據管道,以幫助其分析框架;
  •   Netflix PigPen :為MapReduce,用於編譯成Apache Pig
  •   Nokia Disco :由Nokia開發的MapReduc獲取、轉換和分析數據;
  •   Google MapReduce MapReduce框架;
  •   Google MillWheel :容錯流處理框架; 
  •   JAQL :用於處理結構化、半結構化和非結構化數據工作的聲明性編程語言;
  •   Kite :為一組庫、工具、實例和文檔集,用於使在Hadoop的生態系統上建立系統更加容易;
  •   Metamarkets Druid :用於大數據集的實時e框架;
  •   Onyx :分散式雲計算;
  •   Pinterest Pinlater :非同步任務執行系統;
  •   Pydoop :用於HadoopPython MapReduceHDFS API
  •   Rackerlabs Blueflood :多租戶分散式測度處理系統;
  •   Stratosphere :通用集群計算框架;
  •   Streamdrill :用於計算基於不同時間視窗的事件流的活動,並找到最活躍的一個;
  •   Tuktu :易於使用的用於分批處理和流計算的平臺,通過Scala AkkaPlay所建;
  •   
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ...
  • 最近在研究Xamarin的東西,做到ListView遇到了一些瓶頸,像在數據龐大的情況下,該怎麼針對ListView中的數據分組呢? 基於能力有限的問題,暫時寫了一個只可以實現功能的臨時解決方案,畢竟,樣式和易用性啊還是有點。。。 廢話不多說,直接上代碼吧 首先我寫了一個簡單的ListView和一個 ...
  • 因公司業務需要,需要做一個微信公眾號里的圖片上傳功能,主要用到的技術就是 img轉base64 上到伺服器 話不多說, 貼代碼 先看前端顯示出來的東西 OK 圖片不重要,看代碼 再看js代碼 再看伺服器端代碼 至此, 大家應該能看明白這個微信內置瀏覽器的上傳方法了~ 希望和我一樣的朋友, 繼續加油, ...
  • 上一章講解了利用CKEditor實現了一個簡單的列表功能的查詢,CKEditor編輯器是由js實現的,js是一門非常強大的語法,但是要用它實現Vs開發工具那樣強大編輯器的功能,估計不可能,這就使得CKEditor實現簡單增刪改查還可以,如果要實現複雜功能和樣式展示效果會很難,所以我利用vs開發工具的 ...
  • OData是一個非常靈活的RESTful API,如果要做出強大的查詢API,那麼OData就強烈推薦了。http://www.odata.org/ OData的特點就是可以根據傳入參數動態生成Entity Framework的查詢,最終實現動態的SQL的查詢。但是在項目有時我們並沒有採用Entit ...
  • 使用IQueryable 使用IEnumerable IQueryable介面與IEnumberable介面的區別: IEnumerable<T> 泛型類在調用自己的SKip 和 Take 等擴展方法之前數據就已經載入在本地記憶體里了,而IQueryable<T> 是將Skip ,take 這些方法表 ...
  • 在webform中的devexpress aspxsplitter中套用了jquery-easyui的 tabs id=tt <div id="tt" class="easyui-tabs" data-options="tools:'#tab-tools'" style="width:100%;he ...
  • 參考:http://www.cnblogs.com/chengxiaohui/articles/2092001.html 在EF4(.NET 4)中,我們有了全新的API:ObjectContext.ExecuteStoreCommand(...)和 ObjectContext.ExecuteSto ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...