資料備援產品專題
(91/09/18 10:09:05)

精實新聞 2002-09-18 10:09:05 記者 徐玉君 報導

資料備援產品的產生
資料備援產品的運用而生,主要是因應硬碟機效能無法追上CPU與記憶體技術的日新月異,為了彌補當中的差距所提出的替代方案,稱之為RAID(Redundant Array of Independence Disk),中文翻譯為「容錯式獨立磁碟陣列」。其主要概念即是把多顆獨立的硬碟組合起來形成一個硬碟組,以提供比單顆更安全或更高性能的技術。而依加速、備份、容錯等不同的功能,磁碟陣列的等級分為從RAID 0到RAID 5。

何謂RAID?
RAID就是將數顆實體硬碟(Physial)串接或併接以組成一個大的虛擬硬碟(或稱邏輯硬碟,Logical/Virtral),並可依需要利用同一位元檢核的技術,提供資料容錯功能,由於RAID將資料切割成許多區塊,因此寫入或是讀取資料時,對多顆硬碟同時進行存取﹔實體硬碟的數目越多,存取的速度越快,RAID的出現,使得硬碟在執行速度與性能上大為提高,且RAID的好處包括:提昇資料讀取效能、提昇資料保存的安全性、使用者可依需求,設定不同等級的RAID,運用上極具彈性、支援熱抽換(Hot Swap)和熱備援(Hot Spare)並具備自動資料重建的能力。

而磁碟陣列控制器(Controller)是整個系統的核心,從外觀上來看與主機板或是繪圖卡沒有太大差別,RAID Controller以PCB為載體,並將CPU、ASIC、I/O Chip、Flash Ram、Dram、Sram等元件置於其上,再搭配硬碟、電源供應器與機殼所組成,與主機連接的介面為內接式及外接式兩種,內接式的磁碟陣列控制卡直接插入主機板上的PCI或是SCSI插槽,連到磁碟機後直接放在機殼內﹔外接式的磁碟陣列控制器則是安裝在磁碟櫃中,輸出端連接磁碟櫃內的磁碟機,輸入端則接到主機的介面卡。

RAID分五種等級
依據儲存資料方式的不同,RAID支援的等級也包括從RAID Level 0到RAID Level 5等五種。
RAID Level 0:由兩顆以上的硬碟組成,只是單純以提高資料存取速度為目的。
RAID Level 1:又稱為磁碟鏡像(Disk Mirroring),是一種以安全性為主要考量的應用。當然為了兼具速度及安全性,也發展出RAID Level 0+1。
RAID Level 3/RAID Level 4:係由三顆以上硬碟組成,同位元檢查資料放在第一顆硬碟,通常稱為同位碟(Parity Disk),在寫入資料前,控制器先將資料分割為數個區段,並計算出同位檢核位元或位元組,以提供資料容錯效果,主要應用在繪圖或是影像處理等需要進行大量讀寫的工作,RAID Level 3與RAID Level 4大部份的特性相同,只是計算區段單位不同,RAID Level 3以bit或是byte為計算單位,RAID Level 4則是以block為計算單位。

RAID Level 5:稱為「輪轉同位型陣列」(Rotating Parity Array),RAID Level 5具備了備援(Spare)的概念,除了均是將資料切割後再寫入硬碟,但是在檢查碼資料儲存的方式不同,只要有任一硬碟損壞時,控制器會從每一顆存有檢查碼的硬碟自動重建故障硬碟上的資料,將資料寫回硬碟中。

由於磁碟陣列控制器產品並不是一個消費性市場,所以不像PC相關產品有通用的工業標準,「量身訂作」的元件才能將效能發揮到極限,RAID 0至RAID 5中的演算法則是和BIOS一併寫入Flash,演算法的設計,關係到資料儲存與備份的能力,也是廠商間技術水準的比較指標。

整體而言,CPU掌握資料的運算,RAID的演算法則是以韌體的方式寫入Flash,因此,CPU、ASIC、Flash三者的配合攸關整體控制器的表現,廠商的軟體功力決定了演算法的設計,廠商若欲在RAID領域發展,元件的整合能力是成敗的關鍵。

RAID對個人來說功能已綽綽有餘,但對於企業用戶而言,複雜的檔案管理需求,已經不是RAID可以滿足,因此針對企業用戶設計的儲存系統也運而生。依照資料儲存媒體的特性及存取資料的效率而言,備援系統可分為Off-Line、Near-Line、On-Line三種。

Off-Line又稱異地備援:主要透過兩種方式進行備份,一是將資料存在磁帶機後,將磁帶存放到安全的地方,另一種則是透過光纖通道(或其他寬頻網路)連接到遠端的機房儲存資料。
Near-Line:利用光碟機、光碟櫃或是Mo機等常用的儲存設備,儲存非即時需求的資料,操作難度低、建構成本低、維護也容易。
On-Line:則是利用RAID,在利用電腦或伺服器的同時,提供即時的檔案備份,當電腦或是硬碟損壞時,可以利用另一顆磁碟將資料還原。

若就伺服器主機與儲存系統間資料存取通道的種類,又可區分為DAS(Direct Attached Storage,直接附加儲存裝置)、NAS(Network Attathed Storage,網路附加儲存裝置)、SAN(Storage Area Network,儲存區域網路)三種。

DAS:是最早被企業應用的儲存裝置,儲存設備透過SCSI介面連接負責存取的伺服器,提供較IDE介面更快的存取效能,用戶端再透過伺服器存取資料。不過,DAS的資料庫採取分散式架構,也就是儲存設備和用戶端無法同步進行資料備份,當需要備份大量檔案時,會吃掉網路頻寬及伺服器資源,進而影響系統運作效率。

基於DAS在擴充性與資料集中性有所缺陷,因此出現了NAS及SAN的概念產品。

NAS:是獨立於網路上的儲存裝置,使用時只要設好IP即可。不過仍限制於網路頻寬的要求,由於資料存取同時需要網路頻寬,使用者若需處理區域網路內的大量資料,運作效能上仍會受到影響。不過由於NAS最主要的概念就是網路上共享資源儲存,NAS即是一個專門負責儲存的機器,其中包含了簡易運算單元和記憶單元,內建的作業系統與軟體提供檔案管理的功能,透過Web-Base的介面IP設定好,即可在區域網路上即插即用。使用者只要透過瀏覽器,皆可透過統一的介面對NAS進行設定與監控,NAS跨平台的作業能力,降低為適應不同平台而增構伺服器的成本,而原有的伺服器可以專職進行儲存以外的功能,使伺服器發揮應有的效能。

再加上NSA走的是Windows或是Linux的作業平台,又是架構在TCP/IP的基礎上,國內廠商對相關技術的著墨也較多,進入的門檻也相對較低。

而SAN:利用交換器、光纖通道(Fibre Channel)與伺服器相互連結,基本概念在於將各儲存媒體結合成一個獨立網路,由於資料存取在不同的網路上進行,因此區域網路內的資源不會互相干擾,光纖通道的傳輸速率可高達100MB/s,最大延伸距離可達10公里,伺服器與儲存系統可放在不同的地方,可連接多台且跨平台的伺服器,加上不需利用到企業內部網路,因此可以保有網路頻寬效能。而目前SAN的連接方式有集中式與分散式兩種,集中式是將多台伺服器連到一台儲存設備,分散式是多台伺服器連接到多台儲存設備。

不過建構SAN時,光纖通道的規格並無統一的業界標準,不像NAS利用發展成熟的TCP/IP,因此,不同系統供應商的產品相容性上有待克服。加上SAN的建構成本十分昂貴,包括具光纖通道功能的PCI介面卡、光纖集線器、光纖交換器等,這些設備動輒數百萬元到數千萬元不等,對於預算有限的使用者而言,無非築起一道難以跨越的門檻。

因此,NAS成為國內廠商較具跨入門檻的產品市場,該項產品目前分為低階、中階、高階三類,主要以市場區隔、產品功能作為區分的標準。

低階產品:入門級的NAS將兩個以上的IDE硬碟組成RAIE 0或是RAID 1,提供基本資料備份或是加速存取功能,入門的產品主要瞄準SOHO市場或是人力財力有限的中小型企業,通常這兩類用戶較缺乏MIS及IT的技術與人力,嵌入式的設計可以省卻額外維護成本,入門級的產品也是目前國內廠商最有機會的市場。
中階產品:最多可連接7顆IDE或是SCSI的硬碟,並可組成RAID 0與RAID 5,提供更完整的資料保護,由於中階NAS具備熱插拔的功能,所以可視需要使用外接式或是內建式的儲存媒體進行備份。
高階產品:高階NAS最大可擴充至100顆SCSI或是FC(Fibre Channel)硬碟,擴充性較中低階NAS為佳,但是儲存管理軟體操作相當複雜,也需要專業人員進行維護,目前EMC、Net Appliance等國際大廠是高階NAS主要供應商。


 
 
•相關產業:  通訊服務接取設備區域網路系統整合無塵室工程