大數據存儲技術基礎

来源:https://www.cnblogs.com/v2019/archive/2020/03/12/12470217.html
-Advertisement-
Play Games

一、緒論 1.存儲的本質 信息跨越空間的傳遞——通訊 信息跨越時間的傳遞——存儲 通訊:利用具有跨越空間特性的物理現象 聲音、光、電 存儲:利用具有時間穩態的物理現象 物理穩態、磁穩態、半導體穩態 什麼是存儲? 存儲: ·它是數據臨時或長期駐留的物理媒介;·它是保證數據完整安全存放的方式或行為。 計 ...


一、緒論

1.存儲的本質

信息跨越空間的傳遞——通訊 

信息跨越時間的傳遞——存儲

通訊:利用具有跨越空間特性的物理現象 ---聲音、光、電

存儲:利用具有時間穩態的物理現象 ---物理穩態、磁穩態、半導體穩態

什麼是存儲?

存儲:

·它是數據臨時或長期駐留的物理媒介;
·它是保證數據完整安全存放的方式或行為。

電腦存儲系統:

指電腦中由存放程式和數據的各種存儲設備(介質)、控制部件與介面及管理信息調度的設備(硬體)和演算法(軟體)所組成的系統。

存儲的主要指標:

容量:可以存下多少東西

速度:讀寫帶寬、讀寫次數/秒(IOPS)

持久性:數據能夠保存多久 大小:體積是多少

方便性:是否方便移動和攜帶

功耗:消耗能耗高低

性價比:單位價格下主要指標如何,例如速度 、容量等指標; 

1.1存儲介質的發展歷程

(1)存儲的歷史

象形文字、石刻楔形文字、竹簡、紙質印刷

現在進入“磁器時代”,大部分數據都是用硬碟保存,磁碟稱為當今世界數據存儲的主流技術

存儲器設備:電腦系統中的記憶設備,用來存放程 序和數據

 (2)存儲器的發展

存儲器類別:打孔紙卡、穿孔紙帶、威廉管、磁鼓、汞延遲線、超聲波存儲器、鐵電存儲磁芯、相變存儲、可擦除可編程只讀存儲器、Flash、磁阻式隨機存取記憶體

磁芯存儲器:核心使用微小的磁環(環),核心通過線程來寫入和讀取信息。 每個核心代表一點信息。 磁芯可以以兩種不同的方式(順時針或逆時針)磁化,存儲在磁芯中的位為零或一,取決於磁芯的磁化方向。 佈線被佈置成允許單個芯被設置為1或0,並且通過向所選擇的導線發送適當的電流脈衝來改變其磁化。 讀取內核的過程會導致內核重置為零,從而將其擦除。 這稱為破壞性讀數。 在不進行讀寫操作時,即使關閉電源,內核也會保持最後的值。 這使它們成為非易失性的。

 1955-1975:磁芯存儲器統治了電腦隨機存儲器(RAM)

1964年:靜態隨機存取存儲器(SRAM)

1969年:英特爾公司開發了第一個256位靜態RAM

1966年:IBM公司發明瞭動態隨機存取記憶體(DRAM)

各代DDR的主要改進:

1.SDRAM:(同步動態隨機存儲器)

Synchronous Dynamic Random Access Memory,一個時鐘 周期內只傳輸一次數據,它是在時鐘的上升期進行數據傳輸;

Memory工作需要同步時鐘,內部的命令的發送與數據的傳 輸都以它為基準;

動態是指存儲陣列需要不斷的刷新來保證數據不丟失; 

2.DDR:Double Data Rate SDRAM

一個時鐘周期內傳輸兩次數據,它能夠在時鐘的上升期和 下降期各傳輸一次數據,稱為雙倍速率SDRAM ;

更先進的同步電路,使指定地址、數據的輸送和輸出主要 步驟既獨立執行,又保持與CPU完全同步;

 

 

 

 

 3.DDR2:

在同等核心頻率下,DDR2的實際工作頻率是DDR的兩倍。這得益於 DDR2記憶體擁有兩倍於標準DDR記憶體的4BIT預讀取能力 ;

在採用更低發熱量、更低功耗的情況下,DDR2可以獲得更快的頻率 提升,突破標準DDR的400MHZ限制 ;

DDR2記憶體通常採用FBGA晶元封裝形式,功耗和發熱量更小。

4.DDR3:

突髮長度(Burst Length,BL)。DDR3增加了一個4bit Burst Chop(突發突變)模式;

新增重置(Reset)功能,當Reset命令有效時,DDR3記憶體將停止所 有操作,並切換至少量活動狀態,以節約電力 ;

定址時序(Timing),DDR2的CL(CAS Latency)範圍一般在2~5 之間,而DDR3則在5~11之間。  

5.DDR4:

相比DDR3大的區別有三點:16bit預取機制(DDR3為8bit),同樣內核頻率下理論速度是DDR3的兩倍;更可靠的傳輸規範,數據可 靠性進一步提升;工作電壓降為1.2V,更節能。

相變存儲

在1969年Charles Sie的論文中提出這項存儲技術 ;

三星公司成為第一個成為開發出PCRAM的公司, 美光公司則已經生產出容量為1Gb的晶元;

相變記憶體具有高速存取和非易失的特性

磁阻式隨機存取記憶體MRAM 

1989年:磁阻式隨機存取記憶體MRAM (MagnetoresistiveRandom Access Memory)

MRAM接近靜態隨機存儲器(SRAM)的高速讀 取寫入能力,以及動態隨機存儲器(DRAM)的 高集成度 

IBM在上世紀八九十年代最早開始研發,但其商業 化的步伐依然沒有取得進展,目前仍處於研發階段

(3)輔存儲器的變遷

磁帶、 磁碟、軟盤、 光碟、固態盤

快閃記憶體的主要優點:非易失、體積小、重量輕、低能耗、無雜訊、抗震動

我們平時用的固態硬碟(SSD)就是flash組成的磁碟陣列。

 

 

(2018年3月,100TB固態硬碟上 市:Nimbus Data公司的 ExaDriveDC100系列固態硬碟) 

 

註:記憶體條一般是用DRAM技術做成的,而Cache一般是用SRAM做成的

1.2 硬體存儲介面技術的發展

 

 

 

匯流排技術:

 

 

 System Bus :連接CPU 和Memory ;

Local (I/O) Bus :從外部設備搬運數據 ;

Bus 指標: 

  BUS width measured in bits ;

  Bus speed measured in MHz ;

  Throughput measured in MB/S;

 

連接協議

1.存儲匯流排介面:IDE/ATA 

 

· IDE:Integrated Device Electronics
  · ATA指令集(Advanced Technology Attachment:1986 年)
  · CalledPATA:並行的ATA80芯數據線

·上世紀90年代最流行的現代硬碟介面之一

·最大:133 Mbps,低價格上的好性能

·Desktop 和laptop系統

·Inexpensive 存儲鏈接interconnect

 

2.SCSI:Small Computer System Interface

SCSI:伺服器最流行的硬碟介面,1986標準化

  ·高速數據傳輸、帶寬大、熱插拔:320MB/S;連接設備8-16個

  ·支持多個數據的同時訪問

較IDE/ATA價格昂貴

並行模式SCSI

主用在“高端計算” 環境中

 

 

 

3.存儲匯流排介面:SATA/ATA 

 

SATA協議:Serial串列ATA(IDE:並行ATA)
  ·ATA指令集,串列線路傳輸數據,2000年
  ·傳輸率高、可靠性強、針腳少(6-8)
  ·目前最高速率600MB/S
  ·桌面系統和伺服器,稍貴的存儲鏈接:相對IDE

SAS(Serial Attached SCSI):串列模式SCSI介面
  ·3.0 Gbps-6Gbps
  ·高端伺服器

4.Internal DAS Connectivity Examples

主機外連存儲設備的構件Components

 

 

 

 

 

 

FibreChannel:光纖通道FC

 

 

外部存儲介面SCSI與FC比較

FibreChannel:可支持SCSI 指令集  

  高帶寬:2-8Gbps

  傳輸距離遠:長達150m ~ 50km

  確定性低延遲:微秒級端到端 延遲;

  低誤碼率:小於10-12 ;

  抗干擾能力強:對電磁干擾有 天然的免疫力

  Dual-ported drives

SCSI :

  320MB/S

  有限的距離

  有限的設備數目: 大8-16

  Usually limited to single initiator

  Single-ported drives

 

Fibre Channel Connectivity

 

 

Bus 技術-PCI

PCI:Peripheral Component Interconnect(外設 部件互連)

  電腦內的局部並行匯流排標準

  廣泛用於當前高檔微機和攜帶型微機。主要用於連接顯示 卡、網卡、音效卡。主板帶有多數量的插槽類型

  高速鏈接微處理器和外部設備

  即插即用功能

  32/64 bit;133 MB/sec

Bus 技術-PCIe 

PCI Express: Evolved from PCI and PCI-X™ architectures 

  高速串列替換協議for PCI and PCI-X;

  高8GB/s總 線帶寬

  PCI Express鏈路是兩個設備之間(PCI Express埠) 的點對點通信通道

  Implements packet based protocol for information transfer

  在物理層面上,一條鏈路由一條或多條通道組成,包含1 個到32個通道,更精確地包括1,2,4,8,12,16或32個通道 

    •例如,低速外設(例如802.11 Wi-Fi卡)使用單通道(×1) 鏈路,而圖形適配器通常使用更寬更快的16通道鏈路。

PCI vs PCIe的速度比較

 

 SCSI協議結構

 

 

 

1.3 存儲系統基本結構形式

存儲系統:

  1)存儲資源組合:提供大容量、高性能、低價格、 高可用、高安全的存儲系統為目的

    ·•存儲資源單元:寄存器、SRAM、DRAM、Flash、硬碟、磁 帶、光碟 

  2)各種層次和規模的組合:大/快/便宜的存儲器 

    經典的組合---Cache和VM(虛擬記憶體)

       •Cache-:SRAM與DRAM的組合

       •VM:DRAM 與DISK的組合(看起來又大又快又便宜 的存儲器)

存儲層次–速度和開銷:

 

 

 

 磁碟陣列 

集成大量廉價的小型磁碟存儲器構造出磁碟陣列: 

    “分塊”、“交叉存取”以及冗餘容錯等技術

    容量大、可靠性高、性能高

(個人認為磁碟陣列一般都要附加一個陣列控制器 例如RAID Controller)

 

直接附加存儲Direct  Access Storage

  以伺服器為中心:存儲設備通過匯流排(SCIS線等) 直接連接到主機上,受控於主機

    ·存儲設備內部利用SCSI匯流排通道或FC通道、IDE介面連接多個磁碟,實現RAID技術,形成一個磁碟陣列,從而解決了數據容錯、大存儲空間的問題

  優點:簡單、便宜、易於安裝部署管理

 

 

 

存儲的邏輯捲和文件系統概念

1.塊設備

  (1)以Block為基本讀寫單位的設備

     •磁碟:“Block”指Sector

     •快閃記憶體:“Block”指Page或Subpage

     •RAID:“Block”指Stride

  (2)鍵盤、滑鼠不是塊設備,它們以位元組流的形式讀寫

  (3)網卡不是塊設備,但通過網卡連接的iSCSI存儲設備是塊設備 

2.物理捲(Physical Volume) 

  將一個塊設備劃分成幾個部分,每部分稱作一個物理捲(也稱“分區”)

  物理捲的引入使大容量塊設備的管理更容易

  每個物理捲被劃分成許多大小一致的Physical Extents(物理塊)

3.捲組(Volume Group)

  大量的物理捲組成一個存儲池,叫捲組

    •捲組可包含多個塊設備上的物理捲

    •一個塊設備上的物理捲可處於多個捲組中

  捲組的引入為可伸縮的存儲空間管理提供基礎 

4.邏輯捲(Logical Volume) 

  捲組包含多個物理捲,每個物理捲包含大量Physical Extents,邏輯捲管理器從這些Physical Extents拿出一部分組成邏輯捲

     •邏輯捲由大量Logical Extents組成

     •邏輯捲的每個Logical Extent對應物理捲的一個Physical Extent

     •同一邏輯捲的Logical Extents可來自不同的物理捲,同一物理捲的 Physical Extents可處於不同的邏輯捲中

  每個邏輯捲上安裝一個文件系統,邏輯捲通過增加和減少Logical Extent調整大小,導致文件系統的容量是可伸縮的

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 原因:由於其他原因,或者odoo內部服務自動停止掉,需要一個腳本來監測狀態,自動啟動。 步驟: 1、在任意目錄下新建shell腳本odoodaemon.sh 1 #!/bin/sh 2 # ckconfig: 2345 20 81 3 4 while true; 5 do 6 processExis ...
  • 1、文件操作 打開文件: Open()系統調用 讀寫文件: 文件指針 刪除文件 :同時刪除目錄項的文件記錄條目 2、管理打開文件 1、系統打開文件表 每個open都會返回一個打開文件表的指針( 文件描述符,打開文件表的索引 )、所有文件操作都圍繞這個指針,打開一個文件 ,則搜索目錄,將文件信息cop ...
  • 磁碟結構: 磁碟也和記憶體一樣分塊,並且塊大小和記憶體塊大小相同,方便數據交換。 一、文件物理結構 1、連續分配 文件連續分配在磁碟的塊上,查找效率最高,磁頭移動最快,但是產生碎片最多,不容易擴展。 下麵用Python實現以下 連續分配 的邏輯 2、鏈接分配 (1) 顯式鏈接(支持隨機訪問) 文件目錄表 ...
  • 隨著疫情的好轉,現在求職高峰期已經悄悄來臨了。有些朋友可能在找工作的時候想要去外企,但是很多人卻對外企又一無所知。所以本文就給大家科普一下我在外企的一些實際感受,希望能給找工作的朋友一些幫助。 在電視或電影里,外企給人的感覺就是一種非常體面的工作,大家西裝革履,在一個豪華的辦公室里工作,跟著老外同事 ...
  • 一、軟體安裝方法1)APT方式a.普通安裝:apt-get install softname1 softname2 …;b.修複安裝:apt-get -f install softname1 softname2... ;(-f Atemp to correct broken dependencies ...
  • 本文主要介紹 ElasticSearch 搜索相關的知識,首先會介紹下 URI Search 和 Request Body Search,同時也會學習什麼是搜索的相關性,如何衡量相關性。 Search API 我們可以把 ES 的 Search API 分為兩大類,第一類是 URI Search , ...
  • 今天發現監控的一個SQL Server資料庫實例的CPU有些異常,如下所示,系統消耗的CPU(O/S CPU Utilization)和資料庫實例消耗的CPU(Instance CPU Utilization)有較大出入,登錄伺服器檢查,發現Database Mail Engine進程消耗了20%作... ...
  • linux安裝Oracle11G 本教程使用的環境是: 1H2C2G Centos7 64位 檢查硬體環境 記憶體要求 1GB(最好是2GB),交換記憶體大於物理記憶體的1.5倍,硬碟空間大於16GB。 下麵是通過root用戶操作 如果交換記憶體比較小,我們文件作為swap分區來增加swap大小 修改下各種 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...