Alluxio原理和應用場景隨筆

来源:https://www.cnblogs.com/cccchhhh/archive/2018/10/31/9886610.html
-Advertisement-
Play Games

Alluxio的基本特性:透明數據緩存機制;抽象數據訪問API;和適用應用場景分析,主要包括複雜系統設計解耦和計算存儲分離應用場景的性能加速。 ...


    上周末有幸參加了Alluxio(之前也叫Tachyon),七牛雲和示說網舉辦的Alluxio上海Meetup,之前我並沒有在真實應用場景中使用過Alluxio,對其適用的應用場景一直報懷疑態度。自信聆聽其創始人的演講之後,感覺這個項目還挺有意思,對Alluxio簡單總結一下:

  • DAL(數據訪問層)

Alluxio DAL

    Alluxio提供了各種文件訪問API,包括相容HDFS的API,Alluxio特有的數據訪問API,Rest API和FUSE API,特別是FUSE API,支持POSIX標準的文件訪問介面,讓很多單機版的程式(如TensorFlow),可以享受大數據和雲端的數據存取。不過它並不支持隨機的文件寫訪問,想想也合理,畢竟底層文件存儲系統可能是HDFS或者S3;

  • 統一數據訪問

    依然如上圖,Alluxio底層的存儲系統可以是亞馬遜的S3,Google的存儲,阿裡雲OSS,也可以是HDFS,甚至是單機的SAS,NFS。讓這些文件系統都可以無縫與現有的大數據平臺(通過HDFS Compatible API),或者單機版軟體(通過FUSE API)完全相容。

  • 透明的文件緩存抽象

    高效訪問數據的時候,如何做好文件緩存,其實對應應用程式開發者而言,有時候出於性能的考慮是非常重要的,Alluxio提供了透明的緩存方案,讓記憶體(DRAM),本地快速存儲器(SSD),本地慢速存儲器(HDD)以及雲端存儲(HDFS/OSS/S3)等,形成一個層次化的緩存機制,讓熱的數據儘可能接近快速訪問設備,這個對於深度學習和其它反覆迭代訪問數據的模型而言,性能的提升就不言而喻了。

 

那麼Alluxio的主要應用場景有哪些呢?

  1. 基於SAS平臺單機應用,想無縫擴容,可以考慮用Alluxio的FUSE API,底層用HDFS或者其它雲端存儲。
  2. 基於HDFS的分散式應用,想訪問單機或者NFS的設備上的文件,可以考慮用HDFS Compatiable API。
  3. 反覆迭代讀取遠端(比如雲端,跨數據中心,跨集群,也可以是超大HDFS集群中加速某個應用的數據訪問)數據,可以部署Alluxio

Alluxio應用場景在傳統的小型集群中可能碰不太到,但是越來越多的應用都是混合雲的情況,特別是數據和計算分離的場景,異構的數據存儲帶來的系統耦合,都可以通過Alluxio來解耦,不過目前Alluxio也有自身的一些問題,多個副本可能同時存在多個Alluxio個節點上,造成了事實上的數據緩存浪費,2.0版本中可能會有所更新。

不過最有意思的,來自與Alluxio初創成員講分散式系統設計中的坑,不完全是針對Alluxio的,而是開發Alluxio類似這種大型分散式系統,肯能碰到的經驗和收穫,包括netty的資源泄露問題,jvm的問題等等,更多細節可以看看示說網Alluxio 2.0 Overview分享。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、ftp安裝 1、安裝vsftpd 命令:yum -y install vsftpd 2、修改ftp配置文件 命令:vim /etc/vsftpd/vsftpd.conf 3、按i進入insert模式後,按以下要求修改 anonymous_enable=YES 改為anonymous_enable ...
  • 一、自述 最近剛剛接觸linux,因為我設置密碼比較隨性,把自己做系統的時候設置的root密碼給forget,每當系統崩潰,重新把虛擬機備份還原後,就面臨無法登陸的尷尬情況,只得重置root密碼,好了,開始記錄我的linux學習歷程—— 二、過程 首先,我們開機,出現如下引導界面,按e,進入內核編輯 ...
  • 雖然我對路由器沒什麼興趣,但是緊跟潮流還是有必要的,現在因為網路閉關鎖國政策,很多人都想自己搭配一臺私人的伺服器,不想被商業公司左右數據安全。我感覺這個是一個商機,建議大家可以朝這個方向發展。這裡最關鍵的一步,其實就是私人智能路由器,俗稱軟路由的搭建。這裡我記錄個人學習LEDE軟路由的經驗,和大家分... ...
  • 工具/原料 win7旗艦版系統 筆記本一臺 WIN7下怎麼安裝iis教程: 點擊開始→控制面板,然後再點擊程式和功能,勿點擊卸載程式,否則到不了目標系統界面。 然後在程式和功能下麵,點擊打開和關閉windows功能。 進入Windows功能視窗,然後看到internet信息服務選項,然後按照圖中設置 ...
  • 1. 首先去官方網站下載壓縮文件:https://dev.mysql.com/downloads/mysql/ 2. 解壓下載的文件。 3. 將解壓的所有文件放在一個文件夾里(最好是C:\Program Files\MySQL\里(Mysql文件夾是自己創建的),其他位置也可以,我安裝在D盤上,下為... ...
  • 實驗機器: Kali虛擬機一臺(192.168.163.133) Windows XP虛擬機一臺(192.168.163.130) 如何用Kali虛擬機一步一步“黑掉”這個windowsXP虛擬機呢? 用到的軟體: SLmail程式(存在緩衝區溢出漏洞) ImmunityDebugger(調試工具) ...
  • linux的資料比較零散,經常是好不容易查到了,然後幾秒鐘就忘了,然後就怎麼都找不到了。看來學這個不能偷懶,必須要隨時隨地把資料給記錄下來。這就是這篇博文的意義。Xfce 一個圖形桌面環境。debian 一個linux發行版。引導提示符,按tab編輯命令行:desktop=xfceX Window ... ...
  • 下麵是我們在使用AlwaysOn過程中遇到的一個切換案例。這個案例發生在2014年8月,雖然時間相對久遠了,但是對我們學習理解AlwaysOn的FailOver原理和過程還是很有幫助的。本次FailOver的觸發原因是系統I/O問題。大家需要理解,操作系統I/O出現了問題不一定立即觸發SQL Ser ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...