當微軟發佈第一個SQL Server並行數據倉庫R2時(SQL ServerParallel Data Warehouse,即PDW),已正式將產品的名稱修改為分析服務平臺(APS),但在一些非正式場合,仍然保留了PDW的叫法 目錄: APS簡介 APS特性 NEC一體機 戴爾資料庫一體機 小結 A ...
當微軟發佈第一個SQL Server並行數據倉庫R2時(SQL ServerParallel Data Warehouse,即PDW),已正式將產品的名稱修改為分析服務平臺(APS),但在一些非正式場合,仍然保留了PDW的叫法
目錄:
- APS簡介
- APS特性
- NEC一體機
- 戴爾資料庫一體機
- 小結
APS簡介
- 2014年4月推出了APS(Analytics Platform System),也稱為PDW(ParallelData Warehouse);
- 微軟分析平臺系統APS是一個集成了結構化和非結構化數據的數據倉庫平臺
- 有戴爾、惠普、Quanta(廣達)、NEC提供了基於APS的一體機,而微軟是客戶獲得硬體和軟體支持唯一聯繫方。因此,作為一個數據倉庫設備,APS提供了單位存儲空間最低價格的用戶可用存儲(壓縮後)
- APS一體機是一個針對現代數據倉庫需求的高性能和可擴展的並行處理設備。
- APS一體機上集成了SQLServer PDW軟體(SQL Server專門為了在APS中運行的大規模並行處理版本)和一個可選的HDInsightHadoop 平臺(基於HDP的Windows版微軟Hadoop產品)
- APS的大數據功能及其包含的PolyBase支持使用標準的SQL查詢去訪問Hadoop數據和加入關係型數據,而不需要將數據預載入到數據倉庫中
- 這種在傳統數據倉庫和大數據部署環境之間實現的無縫整合使APS成為一個主流的企業級大數據平臺
APS特性
- 它是一個大規模並行處理設備?(指aps的一體機),可以並行和分佈的方式去處理高度併發和複雜度的查詢
- SQL Server PDW運行在APS設備之內,它使用記憶體內可更新的行存儲索引去改進了數據載入和查詢響應時間,最多比傳統數據倉庫系統高50倍
- APS在軟體中內置了可靠、可擴展和高性能的存儲特性,它們降低了硬體成本——而且它內置了支持容錯的硬體冗餘性
- APS提供了記憶體內可更新的欄位存儲索引,支持高達15倍的數據壓縮率,最高可以節省70%的存儲需求。
- APS是一個基於機架的系統,因此不會過多購買容量,一開始可以只使用四分之一的機架,它支持修改設備容量大小,然後將來在需要時可以使用傳統SQL Server系統橫向擴展的相同工具來擴展它的大小。
NEC一體機
- NEC與微軟合作推出了強大的SQLServer PCle SSD一體機,它支持大規模線上事務處理(OLTP)和商業智能(BI)負載。
- 它搭配NEC Express 5800可擴展的企業級伺服器系列,包含一個4U伺服器,最多支持四個英特爾的Xeon E7處理器,一共有24個物理內核。
- 伺服器還帶有16個可用的PCI-Express 3.0 I/O插槽和64個可用的DDR3記憶體插槽。
- NEC資料庫一體機不僅提供了高性能的數據處理,還預裝了HGST FlashMAX II PCIe快閃記憶體。FlashMAX II是一個多層的快閃記憶體單元,這意味著每一個記憶體單元都能夠存儲多個比特位信息,同時集成了為快閃記憶體優化的硬體RAID原理。通過FlashMAX II設備,伺服器可容納8.8TB的快閃記憶體存儲並提供8.2GBps的邏輯掃描速率。
- 依照在SQL Server FastTrack Data Warehouse(FTDW)參考體系架構的概述,NEC一體機是按照最佳實踐配置進行構建的,FTDW定義了一個針對硬體吞吐量最大化SQL Server數據處理的核心平衡架構,NEC一體機使用FTDW配置來平衡CPU內核與I/O通道和存儲順序I/O的能力
戴爾資料庫一體機
- 戴爾的資料庫一體機也集成了來自Fusion-io的快閃記憶體技術。
- 與NEC有所不同,戴爾一體機不是圍繞著一個特定的平臺構建的。相反,其重點是在企業級應用上,包括了廣泛的資料庫產品支持:MySQL,Sybase,Oracle資料庫,SAP HANA,MongoDB,Apache Cassandra,當然也包括SQL Server 2014+
- 戴爾一體機使用了DellPowerEdge R720 2U機架伺服器,能夠支持12TB快閃記憶體、40GB帶寬和2.5每秒百萬的IOPS。快閃記憶體是通過Fusion io Memory設備提供並且使用自適應閃回(Adaptive FlashBack)保護數據。與許多依賴存儲配置的RAID快閃記憶體設備不同,自適應閃回的數據處理粒度已經提升到了數據塊級別,它簡化了管理並保證了業務連續性。
- 當結合了Fusion-io快閃記憶體時,PowerEdge伺服器能夠顯著的提高數據負載的性能,同時減少延遲和I/O瓶頸。戴爾一體機可以作為一個獨立產品,也可以提供包括光纖通道和無線帶寬技術的高可用產品使用
小結
- APS一體機是針對能夠支持PB級別大數據處理的產品,它專門針對BI和MPP數據分析負載,能夠計算進行分散式處理與並行操作,同時可以將非結構化數據融入到架構中。
- 如果SQL Server一體機在你的考量範圍內,那麼根據不同的需求會為你提供多種選項。記住,這是一個快速變化的市場,在進行SQL Server一體機採購之前一定要事先做足功課。它們有很多優勢,但相應的價格也很高,你一定不想採購之後才發現它並不適合你的需求