Tehnologia RAID. Vezi ce este „RAID” în alte dicționare. Istoria și dezvoltarea RAID

27.03.2020 Știri

(+) : Are fiabilitate ridicată - funcționează atâta timp cât funcționează cel puțin un disc din matrice. Probabilitatea de defectare a două discuri simultan este egală cu produsul probabilităților de defecțiune a fiecărui disc. În practică, dacă unul dintre discuri eșuează, trebuie luate măsuri imediate pentru a restabili redundanța. Pentru a face acest lucru, este recomandat să utilizați discuri de rezervă cu orice nivel RAID (cu excepția zero). Avantajul acestei abordări este menținerea disponibilității constante.

(-) : Dezavantajul este că trebuie să plătiți costul a două hard disk, obținând capacitatea utilizabilă de doar unul hard disk.

RAID 1+0 și RAID 0+1

Oglindă pe multe discuri - RAID 1+0 sau RAID 0+1. RAID 10 (RAID 1+0) se referă la opțiunea când două sau mai multe RAID 1 sunt combinate în RAID 0. RAID 0+1 poate însemna două opțiuni:

RAID 2

Matricele de acest tip se bazează pe utilizarea codului Hamming. Discurile sunt împărțite în două grupuri: pentru date și pentru codurile de corectare a erorilor, iar dacă datele sunt stocate pe discuri, atunci discurile sunt necesare pentru a stoca codurile de corecție. Datele sunt distribuite pe discuri destinate stocării informațiilor, în același mod ca în RAID 0, adică. sunt împărțite în blocuri mici în funcție de numărul de discuri. Discurile rămase stochează coduri de corectare a erorilor, care pot fi folosite pentru a restaura informații în cazul în care orice hard disk se defectează. Metoda Hamming a fost folosită de mult timp în memoria ECC și permite corectarea din mers a erorilor individuale și detectarea erorilor duble.

Demnitate RAID 2 este o îmbunătățire a vitezei operațiunilor pe disc în comparație cu performanța unui singur disc.

Dezavantaj Matricea RAID 2 este că numărul minim de discuri la care are sens să-l folosești este de 7. În acest caz, este nevoie de o structură aproape dublă față de numărul de discuri (pentru n=3 datele vor fi stocate pe 4 discuri) , deci acest tip de matrice nu este larg răspândit . Dacă există aproximativ 30-60 de discuri, atunci depășirea este de 11-19%.


RAID 3

Într-o matrice RAID 3 de discuri, datele sunt împărțite în bucăți de dimensiuni mai mici decât sectorul (divizate în octeți) sau blocuri și distribuite pe discuri. Un alt disc este folosit pentru a stoca blocuri de paritate. RAID 2 a folosit un disc în acest scop, dar majoritatea informațiilor de pe discurile de control au fost folosite pentru corectarea erorilor din mers, în timp ce majoritatea utilizatorilor sunt mulțumiți de simpla restaurare a informațiilor în cazul unei defecțiuni a discului, ceea ce este suficientă informație. pentru a se potrivi pe un hard disk dedicat.

Diferențele dintre RAID 3 și RAID 2: incapacitatea de a corecta erorile din mers și mai puțină redundanță.

Avantaje:

  • de mare viteză citirea și scrierea datelor;
  • Numărul minim de discuri pentru a crea o matrice este de trei.

Defecte:

  • o matrice de acest tip este bună numai pentru lucrul cu o singură sarcină cu fișiere mari, deoarece timpul de acces la un sector individual, împărțit pe discuri, este egal cu maximul intervalelor de acces la sectoarele fiecărui disc. Pentru blocurile mici, timpul de acces este mult mai mare decât timpul de citire.
  • există o sarcină mare pe discul de control și, ca urmare, fiabilitatea acestuia scade semnificativ în comparație cu discurile care stochează date.


RAID 4

RAID 4 este similar cu RAID 3, dar diferă prin faptul că datele sunt împărțite mai degrabă în blocuri decât în ​​octeți. Astfel, a fost posibil să se depășească parțial problema vitezei scăzute de transfer de date a volumelor mici. Scrierea este lentă datorită faptului că paritatea pentru bloc este generată în timpul înregistrării și scrisă pe un singur disc. Printre sistemele de stocare utilizate pe scară largă, RAID-4 este utilizat pe dispozitivele de stocare de la NetApp (NetApp FAS), unde deficiențele sale sunt eliminate cu succes datorită funcționării discurilor în regim specialînregistrare de grup, determinată de cea utilizată pe dispozitivele interne Sistemul de fișiere WAFL.

RAID 5

Principalul dezavantaj al nivelurilor RAID 2 până la 4 este incapacitatea de a efectua operațiuni de scriere paralelă, deoarece un disc de control separat este folosit pentru a stoca informațiile de paritate. RAID 5 nu are acest dezavantaj. Blocurile de date și sumele de control sunt scrise ciclic pe toate discurile matricei; nu există nicio asimetrie în configurația discului. Sumele de control înseamnă rezultatul unei operații XOR (exclusive sau). Xor are o caracteristică care este utilizată în RAID 5, care face posibilă înlocuirea oricărui operand cu rezultatul și, folosind algoritmul xor, obțineți operandul lipsă ca rezultat. De exemplu: a xor b = c(Unde A, b, c- trei discuri ale matricei raid), în caz că A refuză, îl putem obține punându-l la locul lui c iar după cheltuire xorîntre cȘi b: c xor b = a. Acest lucru se aplică indiferent de numărul de operanzi: a xor b xor c xor d = e. Dacă refuză c Apoi e ii ia locul si detinerea xor ca urmare obținem c: a xor b xor e xor d = c. Această metodă oferă în esență versiunea 5 de toleranță la erori. Pentru a stoca rezultatul xor, este necesar doar 1 disc, a cărui dimensiune este egală cu dimensiunea oricărui alt disc din raid.

(+) : RAID5 a devenit larg răspândit, în primul rând datorită rentabilității sale. Capacitatea unei matrice de discuri RAID5 este calculată folosind formula (n-1)*hddsize, unde n este numărul de discuri din matrice, iar hddsize este dimensiunea celui mai mic disc. De exemplu, pentru o matrice de 4 discuri de 80 gigaocteți, volumul total va fi (4 - 1) * 80 = 240 gigaocteți. Scrierea informațiilor pe un volum RAID 5 necesită resurse suplimentare și performanța scade, deoarece sunt necesare calcule și operațiuni de scriere suplimentare, dar la citire (comparativ cu un hard disk separat), există un câștig, deoarece fluxurile de date de pe mai multe discuri din matrice pot fi prelucrate in paralel.

(-) : Performanța RAID 5 este considerabil mai scăzută, mai ales la operațiuni precum Random Write, în care performanța scade cu 10-25% din performanța RAID 0 (sau RAID 10), deoarece necesită mai multe operațiuni de disc (fiecare scrierea pe server). operația este înlocuită pe controlerul RAID cu trei - o operație de citire și două operații de scriere). Dezavantajele RAID 5 apar atunci când unul dintre discuri eșuează - întregul volum intră în modul critic (degradează), toate operațiunile de scriere și citire sunt însoțite de manipulări suplimentare, iar performanța scade brusc. În acest caz, nivelul de fiabilitate este redus la fiabilitatea RAID-0 cu numărul corespunzător de discuri (adică de n ori mai mic decât fiabilitatea unui singur disc). Dacă, înainte ca matricea să fie complet restaurată, apare o eroare sau apare o eroare de citire irecuperabilă pe cel puțin încă un disc, atunci matricea este distrusă și datele de pe acesta nu pot fi restaurate folosind metode convenționale. De asemenea, trebuie luat în considerare faptul că procesul de Reconstrucție RAID (recuperare a datelor RAID prin redundanță) după o defecțiune a discului provoacă o încărcare intensă de citire de pe discuri timp de multe ore în mod continuu, ceea ce poate cauza defecțiunea oricăruia dintre discurile rămase în perioada cea mai puțin protejată de funcționare RAID, precum și identificarea erorilor de citire nedetectate anterior în matricele de date reci (date care nu sunt accesate atunci când munca regulata matrice, date arhivate și inactive), ceea ce crește riscul de eșec în timpul recuperării datelor. Suma minima numărul de discuri utilizate este de trei.

RAID 5EE

Notă: Nu este acceptat pe toate controlerele RAID level-5EE este similar cu RAID-5E, dar mai eficient disc de rezervăși timp de recuperare mai scurt. Similar cu nivelul RAID-5E, acest nivel de matrice RAID creează rânduri de date și sume de verificare pe toate unitățile din matrice. RAID-5EE oferă securitate și performanță îmbunătățite. Când utilizați RAID nivel-5E, capacitatea unui volum logic este limitată de capacitatea a două hard disk-uri fizice ale matricei (unul pentru control, unul de rezervă). Discul de rezervă face parte dintr-o matrice RAID de nivel 5EE. Cu toate acestea, spre deosebire de RAID level-5E, care utilizează spațiu liber nepartiționat pentru rezervă, RAID level-5EE inserează blocuri de sumă de control în discul de rezervă, așa cum se arată în exemplul următor. Acest lucru vă permite să reconstruiți datele mai rapid dacă un disc fizic eșuează. Cu această configurație, nu o veți putea folosi cu alte matrice. Dacă aveți nevoie de o unitate de rezervă pentru o altă matrice, ar trebui să aveți un alt hard disk de rezervă. RAID nivel-5E necesită minim patru unități și, în funcție de nivelul firmware-ului și capacitatea acestora, acceptă de la 8 la 16 unități. RAID level-5E are firmware specific. Notă: Pentru nivelul RAID-5EE, puteți utiliza un singur volum logic în matrice.

Avantaje:

  • 100% protecție a datelor
  • Capacitate mare de disc fizic în comparație cu RAID-1 sau RAID -1E
  • Performanță mai mare în comparație cu RAID-5
  • Recuperare RAID mai rapidă în comparație cu RAID-5E

Defecte:

  • Mai mult performanta scazuta decât în ​​RAID-1 sau RAID-1E
  • Acceptă un singur volum logic per matrice
  • Imposibilitate partajarea disc de rezervă cu alte matrice
  • Nu toate controlerele sunt acceptate

RAID 6

RAID 6 este similar cu RAID 5, dar are un grad mai mare de fiabilitate - capacitatea a 2 discuri este alocată pentru sume de control, 2 sume sunt calculate folosind algoritmi diferiți. Necesită un controler RAID mai puternic. Asigură funcționarea după defecțiunea simultană a două discuri - protecție împotriva defecțiunilor multiple. Pentru a organiza o matrice, sunt necesare minim 4 discuri. De obicei, utilizarea RAID-6 cauzează o scădere cu aproximativ 10-15% a performanței grupului de discuri în comparație cu indicatori RAID-5 similari, care este cauzată de o cantitate mare de procesare pentru controler (necesitatea de a calcula o secundă suma de control, și citiți și rescrieți mai multe blocuri de disc pe măsură ce fiecare bloc este scris).

RAID 7

RAID 7 - înregistrat marcă de la Storage Computer Corporation, nu este un nivel RAID separat. Structura matricei este următoarea: datele sunt stocate pe discuri, un disc este folosit pentru a stoca blocuri de paritate. Scrierea pe discuri este stocată în cache folosind memorie cu acces aleator, matricea în sine necesită un UPS obligatoriu; În cazul unei pene de curent, se produce coruperea datelor.

RAID 10

Diagrama arhitecturii RAID 10

RAID 10 este o matrice oglindită în care datele sunt scrise secvenţial pe mai multe discuri, ca în RAID 0. Această arhitectură este o matrice RAID 0, ale cărei segmente sunt matrice RAID 1 în loc de discuri individuale. Prin urmare, o matrice de acest nivel trebuie să conțină cel puțin 4 discuri. RAID 10 combină toleranța ridicată la erori și performanța.

Controlerele actuale folosesc acest mod în mod implicit pentru RAID 1+0. Adică, un disc este cel principal, al doilea este o oglindă, datele sunt citite de pe ele una câte una. Acum putem presupune că RAID 10 și RAID 1+0 sunt doar nume diferite pentru aceeași metodă de oglindire a discului. Afirmația că RAID 10 este cea mai fiabilă opțiune pentru stocarea datelor este eronată, deoarece, în ciuda faptului că pentru acest nivel RAID este posibil să se mențină integritatea datelor dacă jumătate dintre discuri eșuează, are loc distrugerea ireversibilă a matricei dacă deja două eșuează. discuri dacă sunt în aceeași pereche de oglinzi.

Niveluri combinate

Pe lângă nivelurile de bază RAID 0 - RAID 5 descrise în standard, există niveluri combinate RAID 1+0, RAID 3+0, RAID 5+0, RAID 1+5, care sunt interpretate diferit de diferiți producători.

  • RAID 1+0 este o combinație oglindireȘi alternanţă(Vezi deasupra).
  • RAID 5+0 este alternanţă volume de nivelul 5.
  • RAID 1+5 - RAID 5 din oglindită aburi.

Nivelurile combinate moștenesc atât avantajele, cât și dezavantajele „părinților” lor: aspectul alternanţă la nivelul RAID 5+0 nu adaugă nicio fiabilitate, dar are un efect pozitiv asupra performanței. Nivelul RAID 1+5 este probabil foarte fiabil, dar nu cel mai rapid și, în plus, extrem de neeconomic: capacitatea utilă a volumului este mai mică de jumătate din capacitatea totală a discurilor...

Este demn de remarcat faptul că și numărul de hard disk-uri din matrice combinată se va schimba. De exemplu, pentru RAID 5+0 se folosesc hard disk-uri 6 sau 8, pentru RAID 1+0 - 4, 6 sau 8.

Compararea nivelurilor standard

Nivel Numărul de discuri Capacitate efectivă* toleranta la greseli Avantaje Defecte
0 de la 2 S*N Nu cea mai înaltă performanță fiabilitate foarte scăzută
1 2 S 1 disc fiabilitate
1E de la 3 S*N/2 1 disc** securitate ridicată a datelor și performanță bună cost dublu al spațiului pe disc
10 sau 01 de la 4, chiar S*N/2 1 disc*** cea mai înaltă performanță și cea mai mare fiabilitate cost dublu al spațiului pe disc
5 de la 3 la 16 S*(N - 1) 1 disc economic, fiabilitate ridicată, performanță bună performanță sub RAID 0
50 de la 6, chiar S*(N - 2) 2 discuri** fiabilitate și performanță ridicate cost ridicat și dificultate de întreținere
5E de la 4 S*(N - 2) 1 disc rentabil, fiabilitate ridicată, viteză mai mare decât RAID 5
5EE de la 4 S*(N - 2) 1 disc reconstrucție rapidă a datelor după un eșec, rentabilă, fiabilitate ridicată, viteză mai mare decât RAID 5 performanța este mai mică decât RAID 0 și 1, unitatea de rezervă este inactivă și nu este verificată
6 de la 4 S*(N - 2) 2 discuri economic, cea mai mare fiabilitate performanță sub RAID 5
60 de la 8, chiar S*(N - 2) 2 discuri fiabilitate ridicată, volum mare de date
61 de la 8, chiar S * (N - 2) / 2 2 discuri** fiabilitate foarte mare cost ridicat și complexitate de organizare

* N este numărul de discuri din matrice, S este capacitatea celui mai mic disc. ** Informațiile nu se vor pierde dacă toate discurile dintr-o oglindă eșuează. *** Informațiile nu se vor pierde dacă două discuri din oglinzi diferite eșuează.

Matrix RAID

Matrix RAID este o tehnologie implementată de Intel în chipset-urile sale începând cu ICH6R. Strict vorbind, această tehnologie nu este un nou nivel RAID (analogicul său există în controlerele RAID hardware nivel inalt), permite, folosind un număr mic de discuri, să se organizeze simultan una sau mai multe matrice ale nivelurilor RAID 1, RAID 0 și RAID 5. Acest lucru permite, pentru bani relativ puțini, să ofere fiabilitate sporită pentru unele date și viteză mare. de acces și producție pentru alții.

Caracteristici suplimentare ale controlerelor RAID

Multe controlere RAID sunt echipate cu un set de caracteristici suplimentare:

  • „Hot Swap”
  • „Hot Spare”
  • Verificarea stabilității.

Software (engleză) software) RAID

Pentru a implementa RAID, puteți utiliza nu numai componente hardware, ci și componente software (drivere). De exemplu, în sistemele bazate pe nucleul Linux, există module speciale de nucleu și puteți gestiona dispozitivele RAID folosind utilitarul mdadm. Software-ul RAID are avantajele și dezavantajele sale. Pe de o parte, nu costă nimic (spre deosebire de controlerele RAID hardware, care costă 250 USD sau mai mult). Pe de altă parte, software-ul RAID utilizează resurse CPU și, în perioadele de sarcină maximă a sistemului de disc, procesorul își poate cheltui o parte semnificativă din puterea de a întreține dispozitivele RAID.

Nucleul Linux 2.6.28 (ultimul lansat în 2008) acceptă software-ul RAID de următoarele niveluri: 0, 1, 4, 5, 6, 10. Implementarea vă permite să creați RAID pe partiții separate de disc, care este similar cu Matrix RAID descris mai sus. Este acceptată pornirea din RAID.

Dezvoltarea în continuare a ideii RAID

Ideea matricelor RAID este de a combina discuri, fiecare dintre acestea fiind considerat un set de sectoare și, ca urmare, driverul sistemului de fișiere „vede” ca și cum un singur disc și funcționează cu el, fără a-i acorda atenție. structura interna. Cu toate acestea, se pot obține îmbunătățiri semnificative ale performanței și fiabilității. sistem de discuri, dacă driverul sistemului de fișiere „știe” că funcționează nu cu un singur disc, ci cu un set de discuri.

Mai mult, dacă oricare dintre discurile din RAID-0 este distrusă, toate informațiile din matrice se vor pierde. Dar dacă driverul sistemului de fișiere plasează fiecare fișier pe un singur disc și structura directoarelor este organizată corect, atunci dacă oricare dintre discuri este distrus, se vor pierde numai fișierele aflate pe acel disc; iar fișierele aflate în întregime pe discurile păstrate vor rămâne accesibile.

Angajat al corporației Date Y-E, care este cel mai mare producător din lume de unități de dischetă USB, Daniel Olson, ca experiment, a creat o matrice RAID de patru

Hard disk-urile joacă un rol important într-un computer. Este stocat pe ele diverse informatii utilizator, sistemul de operare este lansat de la ei etc. Hard disk-urile nu durează pentru totdeauna și au o anumită marjă de siguranță. Și, de asemenea, toată lumea HDD are propriile sale caracteristici distinctive.

Cel mai probabil, ați auzit vreodată de comun hard disk-uri puteți face așa-numitele matrice raid. Acest lucru este necesar pentru a îmbunătăți performanța unităților, precum și pentru a asigura fiabilitatea stocării informațiilor. În plus, astfel de matrice pot avea propriile numere (0, 1, 2, 3, 4 etc.). În acest articol vă vom spune despre matricele RAID.

RAID este o colecție de hard disk-uri sau matrice de discuri. După cum am spus deja, o astfel de matrice asigură stocarea fiabilă a datelor și, de asemenea, crește viteza de citire sau scriere a informațiilor. Există diverse configurații de matrice RAID, care sunt marcate cu numerele 1, 2, 3, 4 etc. și diferă în funcțiile pe care le îndeplinesc. Folosind astfel de matrice cu configurația 0, veți obține îmbunătățiri semnificative de performanță. O singură matrice RAID garantează siguranța completă a datelor dvs., deoarece dacă una dintre unități se defectează, informațiile vor fi localizate pe al doilea hard disk.

De fapt, matrice RAID– acesta este 2 sau al n-lea număr de hard disk-uri conectate placa de baza, care susține capacitatea de a crea raiduri. Programatic, puteți selecta configurația raid, adică specificați cum ar trebui să funcționeze aceleași discuri. Pentru a face acest lucru, va trebui să specificați setările din BIOS.

Pentru a instala matricea, avem nevoie de o placa de baza care suporta tehnologia raid, 2 identice (complet din toate punctele de vedere) hard disk-uri, pe care o conectăm la placa de bază. În BIOS trebuie să setați parametrul Configurare SATA: RAID. Când computerul pornește, apăsați combinația de taste CTR-I,și deja acolo configuram RAID. Și după aceea, instalăm Windows ca de obicei.

Merită să acordați atenție faptului că, dacă creați sau ștergeți un raid, atunci toate informațiile care se află pe unități sunt șterse. Prin urmare, mai întâi trebuie să faceți o copie a acestuia.

Să ne uităm la configurațiile RAID despre care am vorbit deja. Există mai multe dintre ele: RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6 etc.

RAID-0 (striping), cunoscut și sub numele de matrice de nivel zero sau „matrice nulă”. Acest nivel crește viteza de lucru cu discuri cu un ordin de mărime, dar nu oferă toleranță suplimentară la erori. De fapt, această configurație este o matrice raid pur formal, deoarece cu această configurație nu există redundanță. Înregistrarea într-un astfel de pachet are loc în blocuri, scrise alternativ diferite discuri matrice. Principalul dezavantaj aici este nefiabilitatea stocării datelor: dacă unul dintre discurile matrice eșuează, toate informațiile sunt distruse. De ce se întâmplă asta? Acest lucru se întâmplă deoarece fiecare fișier poate fi scris în blocuri pe mai multe hard disk-uri simultan și, dacă oricare dintre ele funcționează defectuos, integritatea fișierului este încălcată și, prin urmare, nu este posibilă restaurarea acestuia. Dacă prețuiești performanța și faci în mod regulat copii de siguranță, atunci acest nivel de matrice poate fi utilizat pe computerul tău de acasă, ceea ce va oferi o creștere vizibilă a performanței.

RAID-1 (oglindire)– „mod oglindă”. Puteți numi acest nivel de matrice RAID nivelul paranoic: acest mod nu oferă aproape nicio creștere a performanței sistemului, dar vă protejează absolut datele de deteriorare. Chiar dacă unul dintre discuri eșuează, copie exactă pierdut va fi stocat pe alt disc. Acest mod, ca și primul, poate fi implementat și pe un computer de acasă pentru persoanele care apreciază foarte mult datele de pe discurile lor.

La construirea acestor matrice, se folosește un algoritm de recuperare a informațiilor folosind coduri Hamming (un inginer american care a dezvoltat acest algoritm în 1950 pentru a corecta erorile în funcționarea calculatoarelor electromecanice). Pentru a asigura funcționarea acestui controler RAID, sunt create două grupuri de discuri - unul pentru stocarea datelor, al doilea grup pentru stocarea codurilor de corectare a erorilor.

Acest tip de RAID a devenit mai puțin răspândit în sistemele de acasă din cauza redundanței excesive a numărului de hard disk - de exemplu, într-o serie de șapte hard disk, doar patru vor fi alocate pentru date. Pe măsură ce numărul de discuri crește, redundanța scade, ceea ce se reflectă în tabelul de mai jos.

Principalul avantaj al RAID 2 este capacitatea de a corecta erorile din mers fără a reduce viteza de schimb de date între matricea de discuri și procesorul central.

RAID 3 și RAID 4

Aceste două tipuri de matrice de discuri sunt foarte asemănătoare ca design. Ambele folosesc mai multe hard disk-uri pentru a stoca informații, dintre care una este folosită exclusiv pentru stocarea sumelor de control. Trei hard disk-uri sunt suficiente pentru a crea RAID 3 și RAID 4. Spre deosebire de RAID 2, recuperarea datelor din mers nu este posibilă - informațiile sunt restaurate după înlocuirea unui hard disk defect într-o perioadă de timp.

Diferența dintre RAID 3 și RAID 4 este nivelul de partiționare a datelor. În RAID 3, informațiile sunt împărțite în octeți individuali, ceea ce duce la o încetinire gravă la scrierea/citirea unui număr mare de fișiere mici. RAID 4 împarte datele în blocuri separate, a căror dimensiune nu depășește dimensiunea unui sector de pe disc. Ca urmare, viteza de procesare a fișierelor mici crește, ceea ce este critic pentru computerele personale. Din acest motiv, RAID 4 a devenit mai răspândit.

Un dezavantaj semnificativ al matricelor luate în considerare este încărcarea crescută a hard disk-ului destinată stocării sumelor de control, ceea ce îi reduce semnificativ resursele.

RAID-5. Așa-numita matrice tolerantă la erori de discuri independente cu stocare distribuită a sumelor de control. Aceasta înseamnă că pe o matrice de n discuri, n-1 disc va fi alocat pentru stocarea directă a datelor, iar ultimul va stoca suma de control a iterației n-1 stripe. Pentru a explica mai clar, să ne imaginăm că trebuie să scriem un fișier. Acesta va fi împărțit în porțiuni de aceeași lungime și va începe alternativ să fie scris ciclic pe toate discurile n-1. Pe ultimul disc va fi înregistrată o sumă de control de octeți ai porțiunilor de date ale fiecărei iterații, unde suma de control va fi implementată printr-o operație XOR pe biți.

Merită avertizat imediat că, dacă vreunul dintre discuri eșuează, totul va intra modul de urgență, ceea ce va reduce semnificativ performanța, deoarece Pentru a aduna fișierul, vor fi efectuate manipulări inutile pentru a-i restabili părțile „lipsă”. Dacă două sau mai multe discuri eșuează în același timp, informațiile stocate pe ele nu pot fi restaurate. În general, implementarea unei matrice raid de nivel 5 oferă viteze de acces destul de mari, acces paralel la diferite fișiere și toleranță bună la erori.

În mare măsură, problema de mai sus este rezolvată prin construirea de matrice folosind schema RAID 6. În aceste structuri, este alocat un volum de memorie egal cu volumul a două hard disk-uri pentru stocarea sumelor de control, care sunt, de asemenea, distribuite ciclic și uniform pe diferite discuri. . În loc de una, sunt calculate două sume de control, care garantează integritatea datelor în cazul defecțiunii simultane a două hard disk-uri din matrice.

Avantajele RAID 6 sunt un grad ridicat de securitate a informațiilor și o pierdere mai mică de performanță decât în ​​RAID 5 în timpul recuperării datelor la înlocuirea unui disc deteriorat.

Dezavantajul RAID 6 este că viteza totală de schimb de date este redusă cu aproximativ 10% din cauza creșterii volumului de calcule a sumelor de control necesare, precum și datorită creșterii cantității de informații scrise/citite.

Tipuri RAID combinate

Pe lângă principalele tipuri discutate mai sus, sunt utilizate pe scară largă diverse combinații ale acestora, care compensează anumite dezavantaje ale RAID-ului simplu. În special, utilizarea schemelor RAID 10 și RAID 0+1 este larg răspândită. În primul caz, o pereche de matrice în oglindă sunt combinate în RAID 0, în al doilea, dimpotrivă, două RAID 0 sunt combinate într-o oglindă. În ambele cazuri, performanța crescută a RAID 0 se adaugă la securitatea informațiilor RAID 1.

Adesea pentru a crește nivelul de protecție Informații importante Sunt utilizate scheme de construcție RAID 51 sau RAID 61 - oglindirea matricelor deja foarte protejate asigură o siguranță excepțională a datelor în cazul oricăror defecțiuni. Cu toate acestea, este imposibil să implementați astfel de matrice acasă din cauza redundanței excesive.

Construirea unei matrice de discuri - de la teorie la practică

Un controler RAID specializat este responsabil pentru construirea și gestionarea funcționării oricărui RAID. Spre ușurarea utilizatorului obișnuit calculator personal, în majoritatea plăcilor de bază moderne aceste controlere sunt deja implementate la nivel de chipset southbridge. Deci, pentru a construi o serie de hard disk-uri, tot ce trebuie să faceți este să achiziționați numărul necesar dintre ele și să determinați tipul RAID dorit în secțiunea corespunzătoare. setări BIOS. După aceasta, în loc de mai multe hard disk-uri în sistem, veți vedea doar unul, care poate fi împărțit în partiții și unități logice, dacă doriți. Vă rugăm să rețineți că cei care încă folosesc Windows XP vor trebui să instaleze un driver suplimentar.

Și, în sfârșit, încă un sfat - pentru a crea un RAID, cumpărare hard disk-uri acelasi volum, acelasi producator, acelasi model si de preferat din acelasi lot. Apoi vor fi echipate cu aceleași seturi logice și funcționarea matricei acestor hard disk-uri va fi cea mai stabilă.

Etichete: , https://site/wp-content/uploads/2017/01/RAID1-400x333.jpg 333 400 Leonid Borislavski /wp-content/uploads/2018/05/logo.pngLeonid Borislavski 2017-01-16 08:57:09 2017-01-16 07:12:59 Ce sunt matricele RAID și de ce sunt necesare?

O scurtă prezentare a tehnologiei RAID

Acest document descrie elementele de bază ale tehnologiei RAID și oferă o scurtă prezentare a diferitelor niveluri RAID.

  • RAID 2, 3

    RAID 4, 5

    Masa: avantajele și dezavantajele nivelurilor RAID de bază

RAID este un acronim pentru Matrice redundantă de discuri independente.

O matrice de discuri este o colecție de dispozitive de disc care lucrează împreună pentru a îmbunătăți viteza și fiabilitatea unui sistem I/O. Acest set de dispozitive este controlat de un controler RAID special ( controler de matrice), care încapsulează funcțiile de plasare a datelor într-o matrice; iar pentru restul sistemului, permite ca întregul array să fie reprezentat ca un singur dispozitiv logic I/O. Efectuând operațiuni paralele de citire și scriere pe mai multe discuri, matricea oferă viteze de transfer crescute în comparație cu un singur disc mare.

Array-urile pot oferi, de asemenea, stocare redundantă a datelor, astfel încât datele să nu se piardă dacă una dintre unități se defectează. În funcție de nivelul RAID, se realizează fie oglindirea, fie distribuția datelor pe discuri.

Niveluri RAID

Fiecare dintre cele patru niveluri RAID principale utilizează o metodă unică de scriere a datelor pe discuri și, prin urmare, fiecare nivel oferă beneficii diferite. Nivelurile RAID 1, 3 și 5 asigură oglindirea sau stocarea biților de paritate; și, prin urmare, vă permit să restaurați informații dacă unul dintre discuri eșuează.

Nivelul RAID 0

Tehnologia RAID 0 este cunoscută și sub numele de data striping ( striping de date). Cu această tehnologie, informațiile sunt împărțite în bucăți (cantități fixe de date, numite de obicei blocuri); iar aceste piese sunt scrise pe discuri și citite de pe ele în paralel. Din perspectiva performanței, aceasta înseamnă două lucruri principale: avantaje:

    Mărește debitul I/O seriale prin încărcarea simultană a mai multor interfețe.

    latența de acces aleatoriu este redusă; Mai multe solicitări către diferite segmente mici de informații pot fi executate simultan.

Defect: Nivelul RAID 0 este destinat numai în scopuri de performanță și nu oferă redundanță de date. Prin urmare, orice eșec de disc va necesita restaurarea informațiilor din mediul de rezervă.

Controler de matrice

Discul 1

Discul 2

Discul 3

Discul 4

Discul 5

Segmentul 1

Segmentul 2

Segmentul 3

Segmentul 4

Segmentul 5

Segmentul 6

Segmentul 7

Segmentul 8

Segmentul 9

Segmentul 10

orez. 1. Diagrama de funcționare a matricei și distribuția datelor pe discuri pentru RAID 0. Notă: segment- acestea sunt 2 blocuri de disc de 512 octeți.

RAID Nivel 1

Tehnologia RAID 1 este cunoscută și sub numele de mirroring ( oglindirea discului). În acest caz, copii ale fiecărei informații sunt stocate pe un disc separat; sau, de obicei fiecare disc (utilizat) are un „dublu” care stochează copie exactă acest disc. Dacă unul dintre discurile principale eșuează, acesta este înlocuit cu „dublu”. Performanța de citire aleatorie poate fi îmbunătățită dacă „dublul” al cărui cap este situat mai aproape de blocul necesar este folosit pentru a citi informații.

Timpul de înregistrare poate fi ceva mai mult decât pentru un singur disc, în funcție de strategia de înregistrare: înregistrarea pe două discuri se poate face fie în paralel (pentru viteză), fie strict secvenţial (pentru fiabilitate).

Nivelul RAID 1 este potrivit pentru aplicațiile care necesită fiabilitate ridicată, latență scăzută de citire și unde nu este necesară minimizarea costurilor. RAID 1 oferă stocare redundantă a informațiilor, dar în orice caz ar trebui să fie acceptat copie de rezervă date, deoarece aceasta este singura modalitate de restaurare accidentală fișiere șterse sau directoare.

Disc 1 (date)

Disc 2 (copie a discului 1)

Disc 3 (date)

Disc 4 (copie a discului 3)

Disc 5 (gratuit)

Segmentul 1

Segmentul 1

Segmentul 2

Segmentul 2

Segmentul 3

Segmentul 3

Segmentul 4

Segmentul 4

orez. 2. Distribuția datelor pe discuri pentru RAID 1.

Nivelurile RAID 2 și 3

Tehnologia RAID nivelurile 2 și 3 asigură funcționarea în paralel („la unison”) a tuturor discurilor. Această arhitectură necesită stocarea biților de paritate pentru fiecare informație distribuită pe discuri. Singura diferență dintre RAID 3 și RAID 2 este că RAID 2 folosește mai multe discuri pentru a stoca biți de paritate, în timp ce RAID 3 folosește doar unul. RAID 2 este folosit extrem de rar.

Dacă un disc de date eșuează, sistemul își poate reconstrui conținutul din conținutul discurilor de date rămase și al discului de paritate.

Performanța în acest caz este foarte mare pentru volume mari de informații, dar poate fi destul de modestă pentru volume mici, deoarece citirea suprapusă a mai multor segmente mici de informații nu este posibilă.

Disc 1 (date)

Disc 2 (date)

Disc 3 (date)

Disc 4 (date)

Disc 5 (informații de paritate)

octet de paritate

octet de paritate

orez. 3. Distribuția datelor pe discuri pentru RAID 3.

Nivelurile RAID 4 și 5

RAID 4 corectează unele dintre deficiențele tehnologiei RAID 3 utilizând segmente mari de informații distribuite pe toate discurile, cu excepția discului de paritate. În acest caz, pentru cantități mici de informații, se folosește doar discul pe care se află informațiile necesare. Aceasta înseamnă că mai multe cereri de citire pot fi executate simultan. Cu toate acestea, cererile de scriere provoacă blocare la scrierea informațiilor de paritate. RAID 4 este folosit extrem de rar.

Tehnologia RAID 5 este foarte asemănătoare cu RAID 4, dar elimină blocarea asociată acesteia. Diferența este că informațiile de paritate sunt distribuite pe toate discurile din matrice. În acest caz, sunt posibile ambele operații simultane de citire și scriere.

Această tehnologie este potrivită pentru aplicațiile care funcționează cu cantități mici de date, cum ar fi sistemele de procesare a tranzacțiilor.

Discul 1

Discul 2

Discul 3

Discul 4

Discul 5

Segment de paritate

Segmentul 1

Segmentul 2

Segmentul 3

Segmentul 4

Segmentul 5

Segment de paritate

Segmentul 6

Segmentul 7

Segmentul 8

Segmentul 9

Segmentul 10

Segment de paritate

Segmentul 11

Segmentul 12

orez. 4. Distribuția datelor pe discuri pentru RAID 5.

Avantajele și dezavantajele nivelurilor RAID de bază

Nivel RAID

Mecanism de fiabilitate

Capacitate efectivă a matricei

Performanţă

Zona de aplicare

aplicații fără cerințe semnificative de fiabilitate

oglindire

ridicat sau mediu

aplicații fără cerințe semnificative de cost

paritate

aplicații care funcționează cu cantități mari de date (grafică, CAD/CAM etc.)

paritate

aplicații care funcționează cu cantități mici de date (procesarea tranzacțiilor)

Schimbarea focalizării de la aplicații centrate pe procesor la aplicații centrate pe date determină importanța crescută a sistemelor de stocare a datelor. În același timp, problema debitului scăzut și a toleranței la erori caracteristice unor astfel de sisteme a fost întotdeauna destul de importantă și a necesitat întotdeauna o soluție.

În industria computerelor moderne, discurile magnetice sunt utilizate pe scară largă ca sistem secundar de stocare a datelor, deoarece, în ciuda tuturor deficiențelor lor, au cele mai bune caracteristici pentru tipul adecvat de dispozitiv la un preț accesibil.

Caracteristicile tehnologiei de construire a discurilor magnetice au condus la o discrepanță semnificativă între creșterea performanței modulelor de procesor și discurile magnetice în sine. Dacă în 1990 cele mai bune dintre cele seriale erau unitățile de 5,25 inchi cu un timp mediu de acces de 12 ms și un timp de latență de 5 ms (la o viteză a axului de aproximativ 5.000 rpm 1), atunci astăzi palma aparține unităților de 3,5 inchi cu un timp mediu de acces de 5 ms și timp de întârziere 1 ms (la viteza axului 10.000 rpm). Aici vedem o îmbunătățire caracteristici tehnice cu o cantitate de aproximativ 100%. În același timp, performanța procesorului a crescut cu peste 2.000%. Acest lucru este în mare măsură posibil deoarece procesoarele au beneficiile directe ale utilizării VLSI (Very Large Scale Integration). Utilizarea acestuia nu numai că face posibilă creșterea frecvenței, ci și a numărului de componente care pot fi integrate în cip, ceea ce face posibilă introducerea de avantaje arhitecturale care permit calculul paralel.

1 - Date medii.

Situația actuală poate fi caracterizată ca o criză secundară de I/O a sistemului de stocare.

Creșterea performanței

Imposibilitatea creșterii semnificative a parametrilor tehnologici ai discurilor magnetice atrage după sine necesitatea căutării altor căi, dintre care una este procesarea paralelă.

Dacă aranjați un bloc de date pe N discuri ale unei matrice și organizați această plasare astfel încât să fie posibilă citirea simultană a informațiilor, atunci acest bloc poate fi citit de N ori mai repede (fără a lua în considerare timpul de formare a blocului). Deoarece toate datele sunt transferate în paralel, această soluție arhitecturală este numită matrice cu acces paralel(matrice cu acces paralel).

Matricele paralele sunt utilizate de obicei pentru aplicații care necesită transferuri mari de date.

Unele sarcini, dimpotrivă, sunt tipice o cantitate mare cereri mici. Astfel de sarcini includ, de exemplu, sarcini de procesare a bazei de date. Distribuind înregistrările bazei de date pe matrice de discuri, puteți distribui încărcătura poziționând discurile în mod independent. Această arhitectură este de obicei numită matrice cu acces independent(matrice cu acces independent).

Creșterea toleranței la erori

Din păcate, pe măsură ce numărul de discuri dintr-o matrice crește, fiabilitatea întregii matrice scade. Cu defecțiuni independente și o lege de distribuție exponențială a timpului între defecțiuni, MTTF-ul întregului array (timpul mediu până la eșec) este calculat folosind formula MTTF array = MMTF hdd /N hdd (MMTF hdd este timpul mediu până la eșec al unui disc). ; NHDD este numărul de discuri).

Astfel, este nevoie de creșterea toleranței la erori a matricelor de discuri. Pentru a crește toleranța la erori a matricelor, se utilizează codare redundantă. Există două tipuri principale de codare care sunt utilizate în matricele de discuri redundante - duplicarea și paritatea.

Duplicarea sau oglindirea este cel mai adesea folosită în matricele de discuri. Sistemele simple de oglindă folosesc două copii ale datelor, fiecare copie fiind localizată pe discuri separate. Această schemă este destul de simplă și nu necesită costuri suplimentare de hardware, dar are un dezavantaj semnificativ - folosește 50% din spațiul pe disc pentru a stoca o copie a informațiilor.

A doua modalitate de a implementa matrice de discuri redundante este de a folosi codificarea redundantă folosind calculul de paritate. Paritatea este calculată prin XORing toate caracterele din cuvântul de date. Utilizarea parității în matricele de discuri redundante reduce supraîncărcarea la o valoare calculată prin formula: HP hdd =1/N hdd (HP hdd - overhead; N hdd - numărul de discuri din matrice).

Istoria și dezvoltarea RAID

Deși sistemele de stocare bazate pe discuri magnetice, sunt produse de 40 de ani; producția în masă a sistemelor tolerante la erori a început destul de recent. Matricele de discuri redundante, numite în mod obișnuit RAID (matrice redundante de discuri ieftine), au fost introduse de cercetătorii (Petterson, Gibson și Katz) de la Universitatea din California, Berkeley în 1987. Dar sistemele RAID s-au răspândit numai atunci când discurile care erau potrivite pentru utilizare în matrice redundante au devenit disponibile și suficient de productive. De la cartea albă despre RAID din 1988, cercetările în matricele de discuri redundante au explodat în încercarea de a oferi o gamă largă de compromisuri cost-performanță-fiabilitate.

La un moment dat a avut loc un incident cu abrevierea RAID. Cert este că, la momentul scrierii acestui articol, toate discurile care erau folosite în PC-uri erau numite discuri ieftine, spre deosebire de discuri scumpe pentru mainframe (calculatoare mainframe). Dar pentru utilizarea în matrice RAID, a fost necesar să se utilizeze echipamente destul de scumpe în comparație cu alte configurații de PC, așa că RAID a început să fie descifrat ca matrice redundantă de discuri independente 2 - o matrice redundantă de discuri independente.

2 - Definiția Consiliului Consultativ RAID

RAID 0 a fost introdus de industrie ca definiție a unei matrice de discuri fără toleranță la erori. Berkeley a definit RAID 1 ca o matrice de discuri în oglindă. RAID 2 este rezervat matricelor care folosesc cod Hamming. Nivelurile RAID 3, 4, 5 folosesc paritatea pentru a proteja datele de erori individuale. Aceste niveluri, inclusiv nivelul 5, au fost prezentate la Berkeley, iar această taxonomie RAID a fost adoptată ca standard de facto.

Nivelurile RAID 3,4,5 sunt destul de populare și au o utilizare bună a spațiului pe disc, dar au un dezavantaj semnificativ - sunt rezistente doar la defecțiuni individuale. Acest lucru este valabil mai ales atunci când se utilizează un număr mare de discuri, când crește probabilitatea unui timp de nefuncționare simultan a mai multor dispozitive. În plus, ele se caracterizează printr-o recuperare îndelungată, care impune și unele restricții privind utilizarea lor.

Astăzi, a fost dezvoltat un număr destul de mare de arhitecturi care asigură funcționarea matricei chiar și cu defecțiunea simultană a oricăror două discuri fără pierderi de date. Dintre întregul set, este de remarcat paritatea bidimensională și EVENODD, care utilizează paritatea pentru codare, și RAID 6, care utilizează codificarea Reed-Solomon.

Într-o schemă care utilizează paritatea în spațiu dublu, fiecare bloc de date participă la construirea a două cuvinte de cod independente. Astfel, dacă un al doilea disc din același cuvânt de cod eșuează, un cuvânt de cod diferit este folosit pentru a reconstrui datele.

Redundanța minimă într-o astfel de matrice se realizează cu un număr egal de coloane și rânduri. Și este egal cu: 2 x Pătrat (N Disc) (în „pătrat”).

Dacă matricea cu două spații nu este organizată într-un „pătrat”, atunci când se implementează schema de mai sus, redundanța va fi mai mare.

Arhitectura EVENODD are o schemă de toleranță la erori similară cu paritatea în spațiu dublu, dar o plasare diferită a blocurilor de informații care garantează utilizarea minimă a capacității redundante. Ca și în paritatea în spațiu dublu, fiecare bloc de date participă la construirea a două cuvinte de cod independente, dar cuvintele sunt plasate în așa fel încât coeficientul de redundanță să fie constant (spre deosebire de schema anterioară) și să fie egal cu: 2 x Pătrat (N Disc).

Folosind două caractere de verificare, coduri paritate și non-binare, cuvântul de date poate fi proiectat pentru a oferi toleranță la erori atunci când apare o eroare dublă. Acest design este cunoscut sub numele de RAID 6. Codul non-binar, construit pe codarea Reed-Solomon, este de obicei calculat folosind tabele sau ca proces iterativ folosind registre liniare Cu părere, care este o operațiune relativ complexă care necesită hardware specializat.

Având în vedere că utilizarea opțiunilor RAID clasice, care oferă suficientă toleranță la erori pentru multe aplicații, are adesea performanțe inacceptabil de scăzute, cercetătorii implementează din când în când diverse mișcări care ajută la creșterea performanței sistemelor RAID.

În 1996, Savage și Wilks au propus AFRAID - A Frequently Redundant Array of Independent Disks. Această arhitectură sacrifică într-o oarecare măsură toleranța la erori pentru performanță. În încercarea de a compensa problema de scriere mică tipică a matricelor RAID de nivel 5, este posibil să lăsați striping fără calculul de paritate pentru o anumită perioadă de timp. Dacă discul desemnat pentru înregistrarea cu paritate este ocupat, înregistrarea cu paritate este întârziată. S-a dovedit teoretic că o reducere cu 25% a toleranței la erori poate crește performanța cu 97%. AFRAID schimbă efectiv modelul de defecțiuni al matricelor cu toleranță la erori, deoarece un cuvânt de cod care nu are paritate actualizată este susceptibil la defecțiuni ale discului.

În loc să sacrificați toleranța la erori, puteți utiliza tehnici tradiționale de performanță, cum ar fi stocarea în cache. Având în vedere că traficul pe disc este intens, puteți utiliza un cache de scriere inversă pentru a stoca date atunci când discurile sunt ocupate. Și dacă memoria cache este realizată sub formă de memorie nevolatilă, atunci, în cazul unei pene de curent, datele vor fi salvate. În plus, operațiunile pe disc amânate fac posibilă combinarea aleatorie a blocurilor mici pentru a efectua operațiuni mai eficiente pe disc.

Există, de asemenea, multe arhitecturi care sacrifică volumul pentru a crește performanța. Printre acestea se numără modificarea întârziată pe discul de jurnal și diverse scheme de modificare a plasării logice a datelor în cel fizic, care vă permit să distribuiți operațiunile în matrice mai eficient.

Una dintre variante - înregistrarea de paritate(înregistrare de paritate), care implică rezolvarea problemei de scriere mică și utilizarea mai eficientă a discurilor. Înregistrarea parității amână modificările de paritate la RAID 5 prin înregistrarea lor într-un jurnal FIFO, care se află parțial în memoria controlerului și parțial pe disc. Având în vedere că accesarea unei piese complete este în medie de 10 ori mai eficientă decât accesarea unui sector, înregistrarea de paritate colectează cantități mari de date de paritate modificate, care sunt apoi scrise împreună pe un disc dedicat stocării parității pe întreaga pistă.

Arhitectură date flotante și paritate(floating și paritate), care permite realocarea plasării fizice a blocurilor de disc. Pe fiecare cilindru sunt plasate sectoare libere pentru a reduce latența de rotație(întârzieri de rotație), datele și paritatea sunt alocate acestor spații libere. Pentru a asigura funcționarea în timpul unei căderi de curent, paritatea și harta de date trebuie să fie stocate în memorie nevolatilă. Dacă pierdeți harta de plasare, toate datele din matrice se vor pierde.

Dezbracare virtuală- este o arhitectură flotantă de date și paritate care utilizează memoria cache de writeback. Implementarea firesc laturi pozitive ambii.

În plus, există și alte modalități de îmbunătățire a performanței, cum ar fi operațiunile RAID. La un moment dat, Seagate a inclus suport pentru operațiunile RAID în unitățile sale cu interfețe Fibre Chanel și SCSI. Acest lucru a făcut posibilă reducerea traficului între controler centralși discuri într-o matrice pentru sistemele RAID 5. Aceasta a fost o inovație fundamentală în domeniul implementărilor RAID, dar tehnologia nu a decolat deoarece unele caracteristici ale standardelor Fiber Chanel și SCSI slăbesc modelul de defecțiune pentru matricele de discuri.

Pentru același RAID 5, a fost introdusă arhitectura TickerTAIP. Arata astfel - nodul inițiator al mecanismului de control central (nodul inițiator) primește cererile utilizatorului, selectează un algoritm de procesare și apoi transferă lucrul pe disc și paritatea la nodul lucrător (nodul de lucru). Fiecare nod de lucru procesează un subset de discuri din matrice. Ca și în modelul Seagate, nodurile lucrătoare transferă date între ele fără participarea nodului inițiator. Dacă un nod lucrător eșuează, discurile pe care le-a servit devin indisponibile. Dar dacă cuvântul de cod este construit în așa fel încât fiecare dintre simbolurile sale să fie procesat de un nod de lucru separat, atunci schema de toleranță la erori repetă RAID 5. Pentru a preveni defecțiunile nodului de inițiere, acesta este duplicat, astfel obținem o arhitectură care este rezistent la defecțiunile oricăruia dintre nodurile sale. Cu toate caracteristicile sale pozitive, această arhitectură suferă de problema „găurii de scriere”. Ceea ce înseamnă că apare o eroare atunci când mai mulți utilizatori schimbă cuvântul de cod în același timp și nodul eșuează.

De asemenea, merită menționată o metodă destul de populară pentru restaurarea rapidă a RAID - folosind disc liber(de rezervă). Dacă unul dintre discurile din matrice eșuează, RAID-ul poate fi restaurat folosind un disc liber în loc de cel eșuat. Principala caracteristică a acestei implementări este că sistemul trece la anterioară (starea de siguranță fără intervenție externă). Când se utilizează o arhitectură de rezervă distribuită, blocurile logice ale unui disc de rezervă sunt distribuite fizic pe toate discurile din matrice, eliminând nevoia de a reconstrui matricea în cazul în care un disc se defectează.

Pentru a evita problema de recuperare tipică nivelurilor RAID clasice, o arhitectură numită degruparea parităţii(distribuție de paritate). Aceasta implică plasarea mai puține unități logice de capacitate mai mare pe unități fizice mai mici și de capacitate mai mare. Folosind această tehnologie, timpul de răspuns al sistemului la o solicitare în timpul reconstrucției este îmbunătățit cu mai mult de jumătate, iar timpul de reconstrucție este redus semnificativ.

Arhitectura nivelurilor RAID de bază

Acum să ne uităm la arhitectura nivelurilor de bază ale RAID mai detaliat. Înainte de a lua în considerare, să facem câteva presupuneri. Pentru a demonstra principiile construirii sistemelor RAID, luați în considerare un set de N discuri (pentru simplitate, vom presupune că N este un număr par), fiecare dintre ele constând din M blocuri.

Vom nota datele - D m,n, unde m este numărul de blocuri de date, n este numărul de subblocuri în care este împărțit blocul de date D.

Discurile se pot conecta fie la unul, fie la mai multe canale de transfer de date. Utilizarea mai multor canale crește debitul sistemului.

RAID 0. Striped Disk Array fără toleranță la erori

Este o matrice de discuri în care datele sunt împărțite în blocuri, iar fiecare bloc este scris (sau citit) pe un disc separat. Astfel, mai multe operații I/O pot fi efectuate simultan.

Avantaje:

  • cea mai înaltă performanță pentru aplicațiile care necesită procesarea intensivă a cererilor I/O și volume mari de date;
  • ușurința de implementare;
  • cost redus pe unitate de volum.

Defecte:

  • nu este o soluție tolerantă la erori;
  • Eșecul unei unități duce la pierderea tuturor datelor din matrice.

RAID 1. Matrice de discuri redundante sau oglindire

Oglindirea este o modalitate tradițională de a crește fiabilitatea unei matrice de discuri mici. În cea mai simplă versiune, se folosesc două discuri, pe care sunt înregistrate aceleași informații, iar dacă unul dintre ele eșuează, rămâne un duplicat al acestuia, care continuă să funcționeze în același mod.

Avantaje:

  • ușurința de implementare;
  • ușurința recuperării matricei în caz de defecțiune (copiere);
  • performanță suficient de ridicată pentru aplicații cu intensitate mare de solicitare.

Defecte:

  • cost ridicat pe unitate de volum - redundanță 100%;
  • viteză scăzută de transfer de date.

RAID 2. Matrice de discuri tolerantă la erori folosind Hamming Code ECC.

Codarea redundantă folosită în RAID 2 se numește cod Hamming. Codul Hamming vă permite să corectați defecțiuni simple și să detectați erori duble. Astăzi este utilizat în mod activ în tehnologia de codificare a datelor în RAM de tip ECC. Și codificarea datelor pe discuri magnetice.

În acest caz, este afișat un exemplu cu un număr fix de discuri din cauza greutății descrierii (un cuvânt de date este format din 4 biți, respectiv, codul ECC este 3).

Avantaje:

  • corectare rapidă a erorilor („în zbor”);
  • viteză foarte mare de transfer de date pentru volume mari;
  • pe măsură ce numărul de discuri crește, costurile generale scad;
  • implementare destul de simplă.

Defecte:

  • cost ridicat cu un număr mic de discuri;
  • viteza mica procesarea cererilor (nu este potrivit pentru sistemele orientate spre tranzacții).

RAID 3. Matrice tolerantă la erori cu transfer paralel de date și paritate (Discuri de transfer paralel cu paritate)

Datele sunt împărțite în subblocuri la nivel de octeți și sunt scrise simultan pe toate discurile din matrice, cu excepția unuia, care este folosit pentru paritate. Utilizarea RAID 3 rezolvă problema redundanței ridicate în RAID 2. Majoritatea discurilor de control utilizate în RAID nivelul 2 sunt necesare pentru a determina poziția bitului eșuat. Dar acest lucru nu este necesar, deoarece majoritatea controlerelor sunt capabile să determine când un disc a eșuat folosind semnale speciale sau codificare suplimentară a informațiilor scrise pe disc și utilizate pentru a corecta defecțiuni aleatorii.

Avantaje:

  • viteză foarte mare de transfer de date;
  • defectarea discului are un efect redus asupra vitezei matricei;

Defecte:

  • implementare dificilă;
  • performanță scăzută cu solicitări de intensitate mare pentru date mici.

RAID 4. Matrice tolerantă la erori de discuri independente cu disc de paritate partajat (discuri de date independente cu disc de paritate partajat)

Datele sunt defalcate la nivel de bloc. Fiecare bloc de date este scris pe un disc separat și poate fi citit separat. Paritatea pentru un grup de blocuri este generată la scriere și verificată la citire. RAID Level 4 îmbunătățește performanța transferurilor mici de date prin paralelism, permițând mai mult de un acces I/O să fie efectuat simultan. Principala diferență dintre RAID 3 și 4 este că în cel din urmă, separarea datelor este efectuată la nivel de sector, mai degrabă decât la nivel de biți sau octeți.

Avantaje:

  • viteză foarte mare de citire a unor volume mari de date;
  • performanță ridicată la intensitate mare a solicitărilor de citire a datelor;
  • cheltuieli generale reduse pentru a implementa redundanța.

Defecte:

  • performanță foarte scăzută la scrierea datelor;
  • viteză redusă de citire a datelor mici cu solicitări unice;
  • asimetria performanţei în ceea ce priveşte citirea şi scrierea.

RAID 5. Matrice tolerantă la erori de discuri independente cu paritate distribuită (discuri de date independente cu blocuri de paritate distribuită)

Acest nivel este similar cu RAID 4, dar spre deosebire de cel anterior, paritatea este distribuită ciclic pe toate discurile din matrice. Această modificare îmbunătățește performanța scrierii unor cantități mici de date pe sisteme multitasking. Dacă operațiunile de scriere sunt planificate corect, este posibil să se proceseze până la N/2 blocuri în paralel, unde N este numărul de discuri din grup.

Avantaje:

  • viteză mare de înregistrare a datelor;
  • viteza de citire a datelor destul de mare;
  • performanță ridicată la intensitate mare a solicitărilor de citire/scriere a datelor;
  • cheltuieli generale reduse pentru a implementa redundanța.

Defecte:

  • Viteza de citire a datelor este mai mică decât în ​​RAID 4;
  • viteză redusă de citire/scriere a datelor mici cu solicitări unice;
  • implementare destul de complexă;
  • recuperare de date complexe.

RAID 6. Matrice tolerantă la erori de discuri independente cu două scheme independente de paritate distribuită (Discuri independente de date cu două scheme independente de paritate distribuită)

Datele sunt partiționate la nivel de bloc, similar cu RAID 5, dar pe lângă arhitectura anterioară, o a doua schemă este utilizată pentru a îmbunătăți toleranța la erori. Această arhitectură este dublă tolerantă la erori. Cu toate acestea, atunci când se efectuează o scriere logică, există de fapt șase accesări pe disc, ceea ce mărește foarte mult timpul de procesare a unei cereri.

Avantaje:

  • toleranță ridicată la erori;
  • viteza destul de mare de procesare a cererilor;
  • cheltuieli generale relativ mici pentru implementarea redundanței.

Defecte:

  • implementare foarte complexă;
  • recuperare de date complexe;
  • viteză foarte mică de scriere a datelor.

Controlerele RAID moderne vă permit să combinați diferite niveluri RAID. În acest fel, este posibil să se implementeze sisteme care combină avantajele diferitelor niveluri, precum și sisteme cu un număr mare de discuri. De obicei, aceasta este o combinație de nivel zero (decapare) și un fel de nivel tolerant la erori.

RAID 10. Matrice tolerantă la erori cu duplicare și procesare paralelă

Această arhitectură este o matrice RAID 0 ale cărei segmente sunt matrice RAID 1. Combină toleranța la erori și performanța foarte ridicată.

Avantaje:

  • toleranță ridicată la erori;
  • performanta ridicata.

Defecte:

  • cost foarte mare;
  • scalare limitată.

RAID 30. Matrice tolerantă la erori cu transfer paralel de date și performanță crescută.

Este o matrice RAID 0, ale cărei segmente sunt matrice RAID 3. Combină toleranța la erori și performanța ridicată. Utilizat de obicei pentru aplicații care necesită volume mari de transfer de date în serie.

Avantaje:

  • toleranță ridicată la erori;
  • performanta ridicata.

Defecte:

  • preț mare;
  • scalare limitată.

RAID 50: matrice tolerantă la erori cu paritate distribuită și performanță crescută

Este o matrice RAID 0, ale cărei segmente sunt matrice RAID 5. Combină toleranța la erori și performanța ridicată pentru aplicații cu intensitate mare de solicitare și rate mari de transfer de date.

Avantaje:

  • toleranță ridicată la erori;
  • viteză mare de transfer de date;
  • viteză mare de procesare a cererilor.

Defecte:

  • preț mare;
  • scalare limitată.

RAID 7: matrice tolerantă la erori optimizată pentru performanță. (Asincronie optimizată pentru rate I/O ridicate, precum și rate ridicate de transfer de date). RAID 7® este o marcă înregistrată a Storage Computer Corporation (SCC)

Pentru a înțelege arhitectura RAID 7, să ne uităm la caracteristicile acesteia:

  1. Toate cererile de transfer de date sunt procesate asincron și independent.
  2. Toate operațiunile de citire/scriere sunt stocate în cache prin intermediul magistralei x de mare viteză.
  3. Discul de paritate poate fi plasat pe orice canal.
  4. Microprocesorul controlerului matrice folosește un sistem de operare în timp real axat pe procesele de procesare.
  5. Sistemul are o scalabilitate bună: până la 12 interfețe gazdă și până la 48 de discuri.
  6. Sistemul de operare controlează canalele de comunicare.
  7. Sunt utilizate discuri standard SCSI, magistrale, plăci de bază și module de memorie.
  8. O magistrală X de mare viteză este utilizată pentru a lucra cu memoria cache internă.
  9. Procedura de generare a parității este integrată în cache.
  10. Discurile atașate la sistem pot fi declarate ca separate.
  11. Un agent SNMP poate fi utilizat pentru a gestiona și monitoriza sistemul.

Avantaje:

  • viteză mare de transfer de date și viteză mare de procesare a cererilor (1,5 - 6 ori mai mare decât alte niveluri RAID standard);
  • scalabilitate ridicată a interfețelor gazdă;
  • viteza de scriere a datelor crește odată cu numărul de discuri din matrice;
  • Nu este nevoie de transmisie suplimentară de date pentru a calcula paritatea.

Defecte:

  • proprietatea unui producător;
  • cost foarte mare pe unitate de volum;
  • perioada scurta de garantie;
  • nu poate fi deservit de utilizator;
  • trebuie să utilizați bloc sursă de alimentare neîntreruptibilă pentru a preveni pierderea datelor din memoria cache.

Să ne uităm acum la nivelurile standard împreună pentru a le compara caracteristicile. Comparația se face în cadrul arhitecturilor menționate în tabel.

RAIDMinim
discuri
Nevoie
în discuri
Eșec
durabilitate
Viteză
transmiterea datelor
Intensitate
prelucrare
cereri
Practic
utilizare
0 2 N foarte inalt
până la N x 1 disc
Grafică, video
1 2 2N* R > 1 disc
W = 1 disc
până la 2 x 1 disc
W = 1 disc
servere de fișiere mici
2 7 2N ~RAID 3Scăzutmainframe-uri
3 3 N+1 ScăzutGrafică, video
4 3 N+1 RWR=RAID 0
W
servere de fișiere
5 3 N+1 RWR=RAID 0
W
servere de baze de date
6 4 N+2cel mai inaltscăzutR > 1 disc
W
folosit extrem de rar
7 12 N+1 cel mai inaltcel mai inaltdiferite tipuri de aplicații

Precizări:

  • * - se are în vedere varianta utilizată în mod obișnuit;
  • k - numărul de subsegmente;
  • R - citire;
  • W - record.

Câteva aspecte ale implementării sistemelor RAID

Să luăm în considerare trei opțiuni principale pentru implementarea sistemelor RAID:

  • software (pe bază de software);
  • hardware - bazat pe autobuz;
  • hardware - subsistem autonom (bazat pe subsistem).

Este imposibil să spunem fără echivoc că orice implementare este mai bună decât alta. Fiecare opțiune de organizare a unei matrice satisface nevoile unuia sau altuia utilizator, în funcție de capacitățile financiare, de numărul de utilizatori și de aplicațiile utilizate.

Fiecare dintre implementările de mai sus se bazează pe execuția codului programului. Ele diferă de fapt în locul în care este executat acest cod: în procesorul central al computerului (implementare software) sau într-un procesor specializat pe un controler RAID (implementare hardware).

Principalul avantaj al implementării software-ului este costul scăzut. Dar, în același timp, are multe dezavantaje: performanță scăzută, încărcare pe procesorul central cu muncă suplimentară și trafic crescut de autobuz. Nivelurile RAID simple 0 și 1 sunt de obicei implementate în software, deoarece nu necesită un calcul semnificativ. Luând în considerare aceste caracteristici, sistemele RAID cu implementare software sunt utilizate în servere nivel de intrare.

Implementările RAID hardware costă în consecință mai mult decât cele software, deoarece folosesc hardware suplimentar pentru a efectua operațiuni I/O. În același timp, descarcă sau eliberează procesorul central și magistrala de sistem și, în consecință, permit o performanță crescută.

Implementările orientate pe magistrală sunt controlere RAID care folosesc magistrala de mare viteză a computerului în care sunt instalate (în ultimul timp este folosită de obicei magistrala PCI). La rândul lor, implementările orientate pe magistrală pot fi împărțite în nivel scăzut și nivel înalt. Primele de obicei nu au cipuri SCSI și folosesc așa-numitele Port RAID pe o placă de bază cu un controler SCSI încorporat. În acest caz, funcțiile de procesare a codului RAID și a operațiunilor I/O sunt distribuite între procesorul de pe controlerul RAID și cipurile SCSI de pe placa de bază. Astfel, procesorul central este eliberat de procesarea codului suplimentar și traficul de magistrală este redus în comparație cu opțiunea software. Costul unor astfel de plăci este de obicei scăzut, mai ales dacă sunt destinate sistemelor RAID - 0 sau 1 (există și implementări ale RAID 3, 5, 10, 30, 50, dar sunt mai scumpe), datorită cărora sunt înlocuind treptat implementari software de pe piața de servere entry-level. Controlerele de nivel înalt cu implementare magistrală au o structură ușor diferită de cea a fraților lor mai mici. Aceștia preiau toate funcțiile legate de I/O și executarea codului RAID. În plus, nu sunt atât de dependenți de implementarea plăcii de bază și, de regulă, au mai multe capacități (de exemplu, capacitatea de a conecta un modul pentru a stoca informații într-un cache în cazul unei defecțiuni a plăcii de bază sau a unei pierderi de putere) . Astfel de controlere sunt de obicei mai scumpe decât controlerele low-end și sunt utilizate în serverele mid-end și high-end. Ei, de regulă, implementează nivelurile RAID 0.1, 3, 5, 10, 30, 50. Având în vedere că implementările orientate pe magistrală sunt conectate direct la magistrala PCI internă a computerului, acestea sunt cele mai productive dintre sistemele luate în considerare ( la organizarea sistemelor cu o singură gazdă). Performanța maximă a unor astfel de sisteme poate ajunge la 132 MB/s (32bit PCI) sau 264 MB/s (64bit PCI) la o frecvență magistrală de 33MHz.

Alături de avantajele enumerate, arhitectura orientată pe autobuz are următoarele dezavantaje:

  • dependență de sistemul de operare și platformă;
  • scalabilitate limitată;
  • capabilități limitate de organizare a sistemelor tolerante la erori.

Toate aceste dezavantaje pot fi evitate prin utilizarea subsistemelor autonome. Aceste sisteme au o organizare externă complet autonomă și, în principiu, sunt un computer separat care este folosit pentru organizarea sistemelor de stocare a informațiilor. În plus, dacă tehnologia canalului de fibră optică se dezvoltă cu succes, performanța sistemelor autonome nu va fi în niciun fel inferioară sistemelor orientate pe magistrală.

De obicei, un controler extern este plasat într-un rack separat și, spre deosebire de sistemele cu o organizare de magistrală, poate avea un număr mare de canale de intrare/ieșire, inclusiv canale gazdă, ceea ce face posibilă conectarea mai multor computere gazdă la sistem și organizarea clusterului sisteme. În sistemele cu un controler de sine stătător, pot fi implementate controlere de așteptare la cald.

Unul dintre dezavantajele sistemelor autonome este costul lor ridicat.

Luând în considerare cele de mai sus, observăm că controlerele autonome sunt de obicei folosite pentru a implementa sisteme de stocare a datelor de mare capacitate și cluster.

RAID (Matrice redundantă de discuri independente)— o matrice redundantă de discuri independente, de ex. combinarea hard disk-urilor fizice într-o singură unitate logică pentru a rezolva orice problemă. Cel mai probabil, îl vei folosi pentru toleranța la erori. Dacă unul dintre discuri eșuează, sistemul va continua să funcționeze. ÎN sistem de operare matricea va arăta ca un HDD obișnuit. RAID– matricele au apărut în segmentul de soluții de server, dar acum sunt răspândite și sunt deja folosite acasă. Pentru a gestiona RAID, se folosește un cip special cu inteligență, numit controler RAID. Acesta este fie un chipset pe placa de bază, fie o placă externă separată.

Tipuri de matrice RAID

Hardware– acesta este momentul în care starea matricei este controlată de un cip special. Cipul are propriul CPU și toate calculele cad pe el, eliberând CPU-ul serverului de încărcare inutilă.

Program– acesta este momentul în care starea matricei este controlată program specialîn sistemul de operare. În acest caz, va fi creată încărcare suplimentară pe CPU-ul serverului. La urma urmei, toate calculele cad asupra lui.

Este imposibil să spunem fără echivoc ce tip de raid este mai bun. În cazul unui raid software, nu trebuie să cumpărăm un controler raid scump. Care costă de obicei de la 250 USD. ( îl puteți găsi pentru 70 USD, dar nu aș risca datele) Dar toate calculele cad pe CPU-ul serverului. Software

implementarea este potrivită pentru raidurile 0 și 1. Sunt destul de simple și nu necesită calcule mari pentru a funcționa. Prin urmare, raidurile software sunt mai des folosite în soluțiile entry-level. Raidul hardware folosește un controler raid pentru a funcționa. Controlerul raid are propriul procesor pentru calcule, iar acest procesor este cel care efectuează operațiuni I/O.

Niveluri RAID

Sunt destul de multe. Acestea sunt principalele - 0, 1, 2, 3, 4, 5, 6, 7 și cele combinate - 10, 30, 50, 53... Vom lua în considerare doar cele mai populare, care sunt utilizate în întreprinderile moderne infrastructură. Litera D din diagrame reprezintă date sau bloc de date.

RAID 0 (matrice de discuri în dungi fără toleranță la erori)

Aka dungă. Acesta este atunci când două sau mai multe unități fizice sunt combinate într-o unitate logică în scopul de a combina spațiu. Adică luăm două discuri de 500 GB, le combinăm în RAID 0 și în sistem vedem 1 HDD cu o capacitate de 1 TB. Informațiile sunt distribuite uniform pe toate discurile raid sub formă de blocuri mici (dungi).

Avantaje – Performanță ridicată, ușurință de implementare.

Contra: lipsa toleranței la erori. Când folosiți acest raid, fiabilitatea sistemului este redusă la jumătate (dacă folosim două discuri). La urma urmei, dacă cel puțin un disc eșuează, îți pierzi toate datele.

RAID 1 (oglindire și duplexare)

Aka oglindă. Acesta este momentul în care două sau mai multe unități fizice sunt combinate într-o singură unitate logică pentru a îmbunătăți toleranța la erori. Informațiile sunt scrise pe ambele discuri ale matricei simultan și atunci când unul dintre ele iese, informațiile sunt stocate pe celălalt.

Pro: viteză mare de citire/scriere, ușurință de implementare.

Dezavantaje: redundanță mare. În cazul utilizării a 2 discuri, aceasta este 100%.

RAID 1E

RAID 1E funcționează astfel: trei discuri fizice sunt combinate într-o matrice, după care este creat un volum logic. Datele sunt distribuite pe discuri, formând blocuri. O bucată de date (bandă) marcată ** este o copie a piesei anterioare *. În acest caz, fiecare bloc al copiei în oglindă este scris cu o schimbare pe un disc

Cea mai ușor de implementat soluție tolerantă la erori este RAID 1 (oglindire), o imagine în oglindă a două discuri. Valabilitate ridicată datele sunt garantate de prezența a două copii complete. Această redundanță a structurii matricei îi afectează costul - la urma urmei, capacitatea utilă este la jumătate mai mare decât cea utilizată. Deoarece RAID 1 este construit pe două HDD-uri, acest lucru nu este în mod clar suficient pentru aplicațiile moderne, avide de disc. Datorită unor astfel de cerințe, domeniul RAID 1 este de obicei limitat la volumele de servicii (OS, SWAP, LOG); acestea sunt utilizate numai în soluții cu buget redus pentru a găzdui datele utilizatorilor.

RAID 1E este o combinație de distribuire a informațiilor pe discuri (striping) din RAID 0 și oglindire din RAID 1. Concomitent cu scrierea unei zone de date pe o unitate, o copie a acesteia este creată pe următorul disc matrice. Diferența față de RAID 1 este că numărul de HDD-uri poate fi impar (minim 3). Ca și în cazul RAID 1, capacitatea utilizabilă este de 50% din capacitatea totală a discurilor matrice. Adevărat, dacă numărul de discuri este par, este de preferat să folosiți RAID 10, care, cu aceeași utilizare a capacității, este format din două (sau mai multe) „oglinzi”. Dacă una dintre unitățile RAID 1E eșuează fizic, controlerul comută solicitările de citire și scriere către unitățile rămase din matrice.

Avantaje:

  • securitate ridicată a datelor;
  • performanță bună.

Defecte:

  • ca RAID 1, este folosită doar 50% din capacitatea de disc a matricei.

RAID 2

În matricele de acest tip, discurile sunt împărțite în două grupuri - pentru date și pentru codurile de corectare a erorilor, iar dacă datele sunt stocate pe discuri, atunci discurile sunt necesare pentru a stoca codurile de corecție. Datele sunt scrise pe discurile corespunzătoare în același mod ca în RAID 0; acestea sunt împărțite în blocuri mici în funcție de numărul de discuri destinate stocării informațiilor. Discurile rămase stochează coduri de corectare a erorilor, care pot fi folosite pentru a restaura informații în cazul în care orice hard disk se defectează. Metoda Hamming a fost folosită de mult timp în memoria ECC și permite corectarea din mers a erorilor individuale și detectarea erorilor duble.

Dezavantajul matricei RAID 2 este că funcționarea acestuia necesită o structură aproape dublu față de numărul de discuri, astfel încât acest tip de matrice nu este larg răspândit.

RAID 3

Într-o matrice RAID 3 de discuri, datele sunt împărțite în bucăți mai mici decât un sector (împărțite în octeți) sau un bloc și distribuite pe discuri. Un alt disc este folosit pentru a stoca blocuri de paritate. RAID 2 a folosit un disc în acest scop, dar majoritatea informațiilor de pe discurile de control au fost folosite pentru corectarea erorilor din mers, în timp ce majoritatea utilizatorilor sunt mulțumiți de simpla restaurare a informațiilor în cazul unei defecțiuni a discului, ceea ce este suficientă informație. pentru a se potrivi pe un hard disk dedicat.

Diferențele dintre RAID 3 și RAID 2: incapacitatea de a corecta erorile din mers și mai puțină redundanță.

Avantaje:

  • citire și scriere de mare viteză a datelor;
  • Numărul minim de discuri pentru a crea o matrice este de trei.

Defecte:

  • o matrice de acest tip este bună numai pentru lucrul cu o singură sarcină cu fișiere mari, deoarece timpul de acces la un sector individual, împărțit pe discuri, este egal cu maximul intervalelor de acces la sectoarele fiecărui disc. Pentru blocurile mici, timpul de acces este mult mai mare decât timpul de citire.
  • există o sarcină mare pe discul de control și, ca urmare, fiabilitatea acestuia scade semnificativ în comparație cu discurile care stochează date.

RAID 4

RAID 4 este similar cu RAID 3, dar diferă prin faptul că datele sunt împărțite mai degrabă în blocuri decât în ​​octeți. Astfel, a fost posibil să se depășească parțial problema vitezei scăzute de transfer de date a volumelor mici. Scrierea este lentă datorită faptului că paritatea pentru bloc este generată în timpul înregistrării și scrisă pe un singur disc. Printre sistemele de stocare utilizate pe scară largă, RAID-4 este utilizat pe dispozitivele de stocare NetApp (NetApp FAS), unde deficiențele sale sunt eliminate cu succes datorită funcționării discurilor într-un mod special de înregistrare de grup, determinat de sistemul de fișiere intern WAFL utilizat pe dispozitive.

RAID 5 (Discuri de date independente cu blocuri de paritate distribuite)

Cel mai popular tip de matrice raid, în general, datorită rentabilității utilizării mediilor de stocare. Blocurile de date și sumele de verificare sunt scrise ciclic pe toate discurile din matrice. Dacă unul dintre discuri eșuează, performanța va fi semnificativ redusă, deoarece vor trebui efectuate manipulări suplimentare pentru ca matricea să funcționeze. Raid-ul în sine are viteze de citire/scriere destul de bune, dar este ușor inferioară RAID 1. Aveți nevoie de cel puțin trei discuri pentru a organiza RAID 5.

Pro: utilizarea economică a suporturilor, viteză bună de citire/scriere. Diferența de performanță față de RAID 1 nu este la fel de vizibilă precum economiile de spațiu pe disc. În cazul utilizării a trei HDD-uri, redundanța este de doar 33%.

Contra: Recuperarea și implementarea datelor complexe.

RAID 5E

RAID 5E funcționează așa. O matrice este asamblată din patru discuri fizice și în ea este creat un disc logic. Un disc de rezervă distribuit este spațiu liber. Datele sunt distribuite pe unități, creând blocuri pe un disc logic. Sumele de verificare sunt, de asemenea, distribuite pe discurile matricei și scrise cu o schimbare de la disc la disc, ca în RAID 5. HDD-ul de rezervă rămâne gol.

RAID 5 „Clasic” a fost considerat standardul pentru toleranța la erori de mulți ani subsisteme de discuri. Utilizează distribuția de date (striping) în cadrul matricei HDD; pentru fiecare dintre porțiunile (stripe) definite în acesta, sunt calculate și scrise sume de control (paritate). În consecință, viteza de înregistrare scade datorită recalculării constante a CS odată cu sosirea de noi date. Pentru a crește performanța, înregistrările CS sunt distribuite pe toate unitățile matrice, alternând cu datele. Stocarea CD-urilor consumă capacitatea unui singur suport, astfel încât RAID 5 utilizează un disc mai puțin decât numărul total de discuri din matrice. RAID 5 necesită minim trei (și maxim 16) HDD-uri, iar eficiența spațiului pe disc este în intervalul 67–94%, în funcție de numărul de discuri. Evident, acesta este mai mult decât RAID 1, care utilizează 50% din capacitatea disponibilă.

Suprafața redusă a implementării redundanței RAID 5 are ca rezultat o implementare destul de complexă și un proces îndelungat de recuperare a datelor. Calculul sumelor de control și adreselor este atribuit controlerului RAID hardware cu cerințe mari asupra procesorului, logicii și memoriei cache. Performanța unei matrice RAID 5 în starea sa degradată este extrem de scăzută, iar timpul de recuperare este măsurat în ore. Ca urmare, problema inadecvării matricei este agravată de riscul defecțiunii repetate a unuia dintre discuri înainte ca RAID-ul să fie restaurat. Acest lucru face ca volumul de date să fie distrus.

O abordare comună este includerea unui disc de rezervă dedicat în RAID 5 pentru a reduce timpul de nefuncționare înainte de a înlocui fizic un disc defect. După ce una dintre unitățile din matricea originală eșuează, controlerul include o unitate de rezervă în matrice și începe procesul de reconstrucție RAID. Este important să clarificăm faptul că înainte de această primă defecțiune, unitatea de rezervă este inactivă și este posibil să nu participe la funcționarea matricei ani de zile și să nu fie verificată pentru erori de suprafață. La fel ca cel care va fi adus ulterior pentru o înlocuire în garanție în locul celui defect, va fi introdus în coșul de disc și desemnat ca rezervă. O mare surpriză poate fi inoperabilitatea sa, iar acest lucru va deveni clar în cel mai inoportun moment.

RAID 5E este RAID 5 cu un disc de rezervă permanent inclus în matrice, a cărui capacitate se adaugă în mod egal fiecărui element al matricei. RAID 5E necesită minim patru HDD-uri. La fel ca RAID 5, datele și sumele de control sunt distribuite pe discurile matricei. Utilizarea capacității utile în RAID 5E este puțin mai mică, dar performanța este mai mare decât cea a RAID 5 cu hot-spare.

Capacitatea unui volum logic RAID 5E este mai mică decât capacitatea totală cu volumul a două medii (capacitatea unuia este folosită pentru sumele de verificare, a celuilalt pentru hot-spare). Dar citirea și scrisul sunt patru dispozitive fizice RAID 5E este mai rapid decât operațiunile cu trei unități RAID 5 fizice cu hot-spare clasic (în timp ce al patrulea, hot-spare, nu ia parte la operație). Discul de rezervă din RAID 5E este un membru permanent cu drepturi depline al matricei. Nu poate fi alocat pentru backup a două matrice diferite („un servitor de doi stăpâni” – așa cum este permis în RAID 5).

Dacă unul dintre discurile fizice eșuează, datele de pe unitatea defectată sunt restaurate. Matricea este comprimată și discul de rezervă distribuit devine parte a matricei. Unitatea logică rămâne la nivelul RAID 5E. După înlocuirea unui disc eșuat cu unul nou, datele de disc logic sunt extinse la starea initiala Scheme de distribuție HDD. Atunci când utilizați un disc logic RAID 5E în proiecte de cluster de failover, acesta nu își va îndeplini funcțiile în timpul compresiei/decompresării datelor.

Avantaje:

  • securitate ridicată a datelor;
  • Utilizarea capacității utilizabile este mai mare decât RAID 1 sau RAID 1E;
  • performanța este mai bună decât RAID 5.

Defecte:

  • performanța este mai mică decât RAID 1E;
  • nu poate partaja discul de rezervă cu alte matrice.

RAID 5EE

Notă: Nu este acceptat pe toate controlerele RAID level-5EE este similar cu RAID-5E, dar cu o utilizare mai eficientă a discului de rezervă și un timp de recuperare mai scurt. Similar cu nivelul RAID-5E, acest nivel de matrice RAID creează rânduri de date și sume de verificare pe toate unitățile din matrice. RAID-5EE oferă securitate și performanță îmbunătățite. Când utilizați RAID nivel-5E, capacitatea unui volum logic este limitată la capacitatea a două hard disk-uri fizice din matrice (unul pentru control, unul pentru backup). Discul de rezervă face parte dintr-o matrice RAID de nivel 5EE. Cu toate acestea, spre deosebire de RAID level-5E, care utilizează spațiu liber nepartiționat pentru rezervă, RAID level-5EE inserează blocuri de sumă de control în discul de rezervă, așa cum se arată în exemplul următor. Acest lucru vă permite să reconstruiți datele mai rapid dacă un disc fizic eșuează. Cu această configurație, nu o veți putea folosi cu alte matrice. Dacă aveți nevoie de o unitate de rezervă pentru o altă matrice, ar trebui să aveți un alt hard disk de rezervă. RAID nivel-5E necesită minim patru unități și, în funcție de nivelul firmware-ului și capacitatea acestora, acceptă de la 8 la 16 unități. RAID level-5E are firmware specific. Notă: Pentru nivelul RAID-5EE, puteți utiliza un singur volum logic în matrice.

Avantaje:

  • 100% protecție a datelor
  • Capacitate mare de disc fizic în comparație cu RAID-1 sau RAID -1E
  • Performanță mai mare în comparație cu RAID-5
  • Recuperare RAID mai rapidă în comparație cu RAID-5E

Defecte:

  • Performanță mai scăzută decât RAID-1 sau RAID-1E
  • Acceptă un singur volum logic per matrice
  • Imposibilitatea de a partaja o unitate de rezervă cu alte matrice
  • Nu toate controlerele sunt acceptate

RAID 6

RAID 6 este similar cu RAID 5, dar are un grad mai mare de fiabilitate - capacitatea a 2 discuri este alocată pentru sume de control, 2 sume sunt calculate folosind algoritmi diferiți. Necesită un controler RAID mai puternic. Asigură funcționarea după defecțiunea simultană a două discuri - protecție împotriva defecțiunilor multiple. Sunt necesare minimum 4 discuri pentru a organiza matricea. De obicei, utilizarea RAID-6 cauzează o scădere cu aproximativ 10-15% a performanței grupului de discuri în comparație cu performanța RAID-5 similară, care este cauzată de cantitatea mare de procesare pentru controler (necesitatea de a calcula o a doua sumă de control, precum și citiți și rescrieți mai multe blocuri de disc atunci când scrieți fiecare bloc).

RAID 7

RAID 7 este o marcă înregistrată a Storage Computer Corporation și nu este un nivel RAID separat. Structura matricei este următoarea: datele sunt stocate pe discuri, un disc este folosit pentru a stoca blocuri de paritate. Scrierea pe discuri este stocată în cache folosind RAM, matricea în sine necesită un UPS obligatoriu; În cazul unei pene de curent, se produce coruperea datelor.

RAID 10 sau RAID 1+0 (fiabilitate foarte ridicată cu performanță ridicată)

O combinație între un raid în oglindă și un raid cu dungi de disc. În acest tip de raid, discurile sunt combinate în perechi în raid-uri în oglindă (RAID 1) și apoi toate aceste perechi în oglindă sunt combinate într-o matrice cu dungi (RAID 0). Puteți combina doar un număr par de discuri într-un raid, minimul este 4, maximul este 16. Moștenim fiabilitatea de la RAID 1 și viteza de la RAID 0.

Avantaje – toleranță ridicată la erori și performanță

Contra - cost ridicat

RAID 50 sau RAID 5+0 (rate ridicate de I/O și performanță de transfer de date)

Cunoscut și ca RAID 50, este o combinație de RAID 5 și RAID 0. Matricea combină performanța ridicată și toleranța la erori.

Avantaje – toleranță ridicată la erori, viteză de transfer de date și execuție a interogărilor

Contra - cost ridicat

RAID 60

O matrice RAID de nivel 60 combină caracteristicile nivelurilor 6 și 0. O matrice RAID 60 combină striping-ul direct la nivel de bloc al RAID 0 cu striping-ul cu paritate dublă a RAID 6, și anume: RAID 0 este distribuit între elementele RAID 6. RAID 60 disc virtual Poate supraviețui pierderii a două hard disk-uri în fiecare configurare RAID 6 fără a pierde date. Este cel mai eficient cu datele care necesită fiabilitate ridicată, rate mari de solicitare, transfer mare de date și capacități medii până la mari. Numărul minim de discuri este de 8.

RAID liniar

Linear RAID este o combinație simplă de discuri care creează un disc virtual mare. În RAID liniar, blocurile sunt alocate mai întâi pe un disc inclus în matrice, apoi, dacă acesta este plin, pe altul etc. O astfel de consolidare nu oferă beneficii de performanță, deoarece cel mai probabil operațiunile I/O nu vor fi distribuite între discuri. De asemenea, RAID liniar nu are redundanță și crește probabilitatea defecțiunii - dacă o singură unitate se defectează, întreaga matrice va eșua. Capacitatea matricei este egală cu capacitatea totală a tuturor discurilor.

Concluzia principală care se poate trage este că fiecare nivel de raid are propriile sale avantaje și dezavantaje.

O concluzie și mai importantă este că un raid nu garantează integritatea datelor dumneavoastră. Adică, dacă cineva șterge un fișier sau este deteriorat de un proces, raidul nu ne va ajuta. Prin urmare, raidul nu ne eliberează de nevoia de a face copii de rezervă. Dar ajută atunci când apar probleme cu discurile la nivel fizic.