A kiemelt képen egy olyan dolog van, amiről NEM lesz szó, mert felesleges elmélyedni a témával alapszinten érdeklődőknek benne. 😀 Ennél jóval egyszerűbben nézzük itt most meg a dolgot.
Szerencsésnek mondhatod magad, ha nem élted még azt meg eddigi életed folyamán, hogy féltve őrzött, rendszerezett adataid (például a féltve őrzött családi fotók, vagy fontos dokumentumok) elvesztek.
Sokan közülünk azok nem voltak ennyire szerencsések, és bizony megszívták már legalább egyszer, a komolyabb versenyzők már többször is. Ez nem jelenti azt, hogy ők valamit rosszul csináltak, sok esetben csak a természet űzött tréfát velünk.
Egy személyes történet
Mielőtt rátérnénk, hogy mi az a RAID tömb, elmondanám, hogy én is azoknak a táborát erősítem, akik már megszívták. Én kétszer is. És nem verdestem földhöz az érzékeny merevlemezeket, nem történt túlzott, ipari igénybevétel, merevlemezeim mióta az eszem tudom lényegében a legféltettebb kincseim közé tartoztak.
Ennek ellenére (fejszámolás) még 2006 környékén történt meg velem először, hogy a 250 GB kapacitású (akkoriban nem éppen kicsinek számító [de azért mégis több mint a ’97-es 1,7GB-os – amivel kezdtem]) winchesterem bizony elszállt. Kerregett, kattogott, majd bumm, nem működött. Előjelek és bad sectorok nélkül. És az adatok sosem lettek meg abban a formában, amiben akkor voltak.
Élelmes énem nekiesett egy GetDatabackforFAT nevű szoftverrel, és 2006 óta (ez tény) van egy mappám (ma már a NASomon :D), amit úgy neveztem el, hogy „Recovered”. Na azóta képtelen voltam a több tízezer képfájlt kiválogatni (többször nekiültem és próbálkoztam), melyben weblapsarokpixelektől (a régi motoros webfejlesztők talán emlékeznek erre a korszakra) kezdve törölt képeken át a tényleges tartalomig minden van. Nem tudom hány hét/hónap(?) lenne kiválogatni, de sosem ültem még neki – talán majd ha nyugdíjba vonultam. Jó móka lesz olyan képekre bukkanni a zavarosban, amelyek rég feledésbe merültek.
Tudod, hogy honnan tudtam, hogy 2006-ban volt az adatvesztés? Épp anyósómnál vagyok. VPN-en felcsatlakoztam a távolban (otthon) lévő nasomra, megnyitottam windows intézőben a W:\ jelű hálózati meghajtót, hogy kikeressem: igen, 2006 óta vannak képeim rendezett formában. Vannak 2006 előttről is foszlányok, de azokat 1, vagy már a válogatáskor találtam 2, vagy utólag kértem el. Azért elég kényelmes így bármibe benézni távolról. 😀 Igen, ilyen kényelmes egy NAS.
A második adatvesztésem 2012-ben volt, ekkor egy sima laptopbekapcsolás alkalmával történt kerregés, kattogás, és huss. Nem működött többé, GetDataback barátunk sajnos fel sem ismerte, hogy merevlemezzel lenne dolga… Egy 1 TB-s merevlemez tartalma lett az enyészeté, ekkor viszont már voltam abban a helyzetben hogy meg tudtam bízni egy céget az adatmentéssel, Ez egy igen-igen mélyen zsebbe nyúlós történet volt. (100e+ Ft-ban)
Ennyit a mellékstoryzásról, számomra nem volt kérdés, hogy valamiféle adatbiztonsági koncepciót érdemes lenne kialakítani, viszont mindig is tiszta szívből gyűlöltem azt a verziót, hogy a fontos adataimat hetente (havonta) egy külső merevlemezre átmásolgatom, és a fiókban tartom őket – vész esetére. T
otál kényelmetlen volt, és már ekkortájt kacérkodtam a létező technológiával (egy Fujitsu Siemens Amilo Xi3650-es laptopot használtam, ami 18,4″ colos kijelzőjével egy igazi monstrumnak számított – imádtam, még mindig megvan!!!), a laptopomban két merevlemez számára volt hely, és ezeket „raidbe kötve” és lehetett volna használni. Ekkor találkoztam igazából először az említés szintnél komolyabban a raid fogalmával.
De mi az a raid?
Annak semmi értelme, hogy én itt mások által mér 59 ízben megírt dolgokat újraírjak, így két dolgot tennék, tömören, a saját szavaimmal (lehet hogy pontatlanul – a geekektől bocs), az átlagember számára érthetően megpróbálom összefoglalni, hogy mi az a raid, és akit ennél bővebben érdekel a dolog, az rendkívül sok helyen utánaolvashat. Tisztázzunk azonban két fogalmat kezdésképp:
A Redundancia az információelméletben az információ- vagy üzenetátvitelre használt csatornán maximálisan egyszerre átvihető bitek számának és az aktuális információ vagy üzenet bitjei számának a különbsége.
https://hu.wikipedia.org/wiki/Redundancia
Redundanciának ill. redundáns adattárolásnak nevezzük azt, amikor a minimálisan szükségesnél több adatot tárolunk egy adott információs állapot ábrázolása során. Egy ábrázolás általában attól lesz redundáns, hogy magában foglalja az adathalmaz más részeiből számítható információkat is.
https://wiki.prog.hu/wiki/Redundancia
Szóval mi az, hogy redundáns? Több van belőle mint kellene. 😀 Egy észveszejtő példát fogok előhozni. Kerti locsolórendszert akarsz beépíteni magadnak. Beépítesz ugyanarra a területre két kört. Ugyanoda. (Észnél vagy?! :D) Tételezzük fel, hogy azért teszed ezt, mert szeretnél a biztonságra játszani: ha az egyik locsolókör elromlik (kiesik), akkor a másik tudjon locsolni.
Vagy más esetben nincs jobb ötleted arra, hogy hogyan lehetne ugyanazt a területet fele annyi idő alatt meglocsolni. (Attól tekintsünk el hogy nagyobb teljesítményű eszközöket be lehet-e szerezni). Azt mondhatjuk ebben az esetben, hogy te redundánsan oldod meg a kertben a locsolást. Egy is tökéletesen elég lenne normál esetben, de te valamilyen oknál fogva inkább megnövekedett biztonságot akarsz elérni annak érdekében, hogy igenis, Te legyél az a szomszéd, akinek a fűje zöldebb.
A RAID (angolul Redundant Array of Independent Disks) tárolási technológia, mely segítségével az adatok elosztása vagy replikálása több fizikailag független merevlemezen, egy logikai lemez létrehozásával lehetséges. Minden RAID szint alapjában véve vagy az adatbiztonság növelését vagy az adatátviteli sebesség növelését szolgálja.
https://hu.wikipedia.org/wiki/RAID
A redundáns adattárolás példája
A redundanciánál megismert fogalmat ha átültetjük winchesterekre, pendriveokra (merevlemezekre, hard diskekre, adattárolókra, adatok floppyra vagy blu rayre történő másolásával – akárhogy is nevezzük), akkor épp ugyanerről van szó: redundánsan próbálunk valamit tárolni. Van 2 DB 1GB-os fájlod: X.mp4, és Y.mp4, valamint két pendriveod (A és B). Képzelj el két esetet (a 0. és az első eset)
0, Képzeljük el azt, hogy X file az A-ra, Y file a B-re kerül másolásra, ezáltal pedig két következménnyel kell szembesülnöd: ha szükséged van a fájlokra, akkor a két pendriveről egyidőben (a PC-hez való egyidejű párhuzamos csatlakoztatással) a PC-re történő másolással gyorsan, egy T idő alatt hozzáférsz az adataidhoz. Ez nagyon jó, gyors lesz a dolog. Viszont ha az egyik pendrive elszáll bármi miatt, akkor hiába a gyorsaság, az adat fele elveszett.
1, Másik példánkban X és Y az A-ra is rámásolásra kerül, és a B-re is. Igény esetén az A-ról hozzáférünk az adatainkhoz, a B-t pedig hívjuk biztonsági másolatnak. Ha hozzájuk akarsz férni, akkor elméletileg két opció van: A vagy B pendriveot csatlakoztathatod a számítógépedhez, és felmásolod mindkét fájlt.
Ez a 0-val jelölt példához képest 2T hosszúságú ideig fog tartani. Tehát kétszer olyan hosszú lesz a másolással eltöltött idő, jóval lassabb! Viszont, és ITT ugrik a majom a vízbe: Ha az egyik pendrive elromlik, akkor a másikon az adat továbbra is rendelkezésre áll. Hoppá. Na ezt hiányoltam én 2006-ban.
Azt tudni kell, hogy van két pendrive-unk van, és az 0. példában „2 pendrive-nyi” hasznos területünk – tehat mindkét pendrive egyidejűleg kapacitásügyileg rendelkezésre áll (ezáltal gyorsabbak vagyunk). Az 1.-gyel jelölt példában az adatbiztonság érdekében kétszer tároljuk ugyanazt – az egyik pendrive kapacitása „nem hasznos”, hiszen az a biztonsági területünk arra az esetre, ha a másik pendrive megadná magát.
[A harmadik verzió nyilván az lenne (ha két pendrive helyett egy darab pendriveot használnánk, de dupla méretben. Az lassú is lenne, nomeg totálisan mellőzné a biztonságot is.). Miért tartsd minden pénzed egyetlen bankszámlán? Miért diverzifikáld a befektetéseid? Ugyanez a téma.]
Szerintem ez a logika követhető, remélem Neked is átjött a lényeg. Most cseréld ki a pendrive szavakat merevlemezekre, és képzeld el továbbá, hogy nem neked kell szórakozni a pendriveok dugdosásával, hanem van egy keretrendszer, ami konfigurálást követően magától teszi amit kell. (Vagy begyorsítja az adat-hozzáférésed, vagy megemeli a biztonsági szintet). Na, ezt hívjuk RAID tömbnek.
Annak idején az én fent említett notebookomon tehát lehetett állítani a raid tömb típusát. SOHA nem használtam arra, hogy gyorsítsam a rendszert. A duplikált adattárolásra viszont igen. Mi volt a gond? Két merevlemezt kellett beleraknom, viszont ennek csak az egyik nagyságának megfelelő tárterületem állt hasznos kapacitásként rendelkezésre.
A RAID tömbök főbb típusai
Ha valaki nekiáll utánaolvasni, akkor belefuthat gyorsan abba a témába, hogy mindenféle számozású raid tömbök léteznek, összefoglalnám itt a fenti koncepció jegyében, hogy miről is van szó: (nem nem fogom az összes típust felsorolni, csak azt a négyet, amit megéri egy átlagembernek elmesélni). (wikiről idézek alább, néminemű kiegészítésekkel)
RAID 0 (összefűzés)
Az egyes lemezek egyszerű összefűzését jelenti, nem biztosít hibatűrést, azaz egyetlen meghajtó meghibásodása az egész tömb hibáját okozza. Mind az írási, mind az olvasási műveletek párhuzamosítva történnek, ideális esetben a sebesség az egyes lemezek sebességének összege lesz, így a módszer a RAID szintek közül a legjobb teljesítményt nyújtja.
Mit jelent ez? K.rva gyorsak vagyunk! 🙂 Tárterület? Ha 2×1 TB merevlemezünket Raid0-be kötjük, akkor 2 TB a hasznos terület. Hurráá! [Nem meglepő módon a RAID nullás elméletet írta le a 0-val jelölt példám a pendriveokkal]
RAID 1 (tükrözés)
A RAID 1 eljárás alapja az adatok tükrözése (disk mirroring), azaz az információk egyidejű tárolása a tömb minden elemén. Az eljárás igen jó hibavédelmet biztosít, bármely meghajtó meghibásodása esetén folytatódhat a működés.
Mit jelent ez? Nem vagyunk gyorsabbak, de van biztonsági tárterületünk. Ha 2x1TB merevlemezünkön Raid1-be kötjük, akkor 1TB lesz a hasznos terület, hisz a másik lemez a biztonságért felel. Ez egy drágább verzió lesz. Ez tény. Dehát az adatbiztonságnak ára van. [Nem meglepő módon a RAID 1 elméletet írta le az 1-gyel jelölt példám a pendriveokkal]
RAID 2
A kiemelt képen látható (egy részlete). Ahogy ígértem, lényegtelen most itt nekünk. 🙂
RAID 5 – Játék a paritásokkal
Nem kell értened a részleteket, és hogy mi van háttérben, csak azt, hogy mi a következmény: Minél több meghajtóval játszol egyidejűleg, annál kevesebb „nem hasznos” területed lesz a teljes meghajtókapacitáshoz képest. Ezt egy táblázatban foglalnám össze:
Azaz, minél több lemezünk van, annál nagyobb arányú lesz a hasznos tárterületünk, és annál „nem hasznos” területre lesz szükségünk. Ha egy lemez elromlik, akkor a hiányzó lemez tartalmát a NAS kiszámolja az összes többiből, elkerüljük az adatvesztést.
Mennyi az esélye annak, hogy két lemez egyidejűleg romoljon el? Nagyságrendekkel csekélyebb, mint annak, hogy csak 1 lemez romlik el egyszerre. De azért, kedves Olvasó, ha 12 lemezben gondolkodsz… azért 12 lemeznél 12 különálló hardvernek van esélye hogy tönkremenjen, annak ellenére hogy ezeknek egyszerre történő előfordulásának valószínűsége kisebb, mint az egyenkénti előfordulásnak.
Szóval kisvállalkozásba, otthonra, 12 lemezben gondolkodni már-már több, mint abnormális – szerintem. Ha te abban gondolkodsz, hogy Raid tömbbe rendezd az adataid, például amiatt, hogy adatbiztonságot valósíts meg, akkor minden attól függ, hogy milyen lehetőségeid vannak:
Ha van egy asztali számítógéped, akkor abban minden bizonnyal van lehetőség arra, hogy 2-4 merevlemezt elhelyezz. Ha laptopod van, akkor max 2. Ha mondjuk egy NAS vásárlását tervezed, akkor igényeidtől függően 1 lemez befogadására képes (és ezáltal raidben nem használható) verziótól kezdve a 10+ lemezes verzióik szinte minden-t lehet, viszont én a helyedben akkor sem mennék 2-3 lemez felé, tök felesleges kezdésképp. Lesz egy poszt arról, hogy mire figyeljünk nas vásárlás előtt, ott részletesebben ki fogom fejteni, hogy miért is gondolom azt, amit, és hogy én hogyan indultam el a nasok útján.
Raid 6
Ha megfigyelőrendszerben gondolkozik az ember, akkor tudnia kell, hogy a merevlemezek folyamatosan pörögni fognak, elvégre a megfigyelőrendszer folyamatosan menti le az éppen felvett tartalmát a kameraképeknek, és folyamatosan törli a régieket egyúttal.
Egy ilyen, folyamatos igénybevétel esetén lehet értelme Raid6ban gondolkodni: „A RAID 6 tekinthető a RAID 5 kibővítésének. A módszer segítségével kétszeres meghajtómeghibásodás is kiküszöbölhetővé válik. Nagy elemszám esetén a RAID 6 lényegesen biztonságosabb alternatívája a RAID 5-nek, valamint arányaiban kevesebb tárkapacitás veszteséggel jár.”
Minimum 4 lemez kell hozzá, tehát a fenti példát nézve 4x1TB esetén onnan indulunk, hogy a területünk 50%-as hasznos. Ha részletesebben meg szeretnéd érteni, hogy miért raid 6, ha megfigyelőrendszer, és tudsz angolul, akkor két linket ajánlanék a figyelmedbe. (https://ipvm.com/reports/advantages-of-raid6-over-raid5-for-video-surveillance, illetve https://envisioner.hu/data/RAID_f_surv.pdf)
Van 1db 2TB-s, 1db 1TB-s, és 1db 4TB-s lemezem. Melyik tömb való nekem?
A Raid-tömbök esetében azt kell még tudni, hogy a tömböt alkotó lemezeknek méret szerint homogénnek érdemes lenniük. Amennyiben ez nincs így, akkor sajnos nagyobb hasznosterület-veszteséggel számolhatunk, szöges egyenest a legkisebb meghajtó mérete fogja meghatározni minden egyes további lemez maximális kapacitását – sajnos.
Ennek logikai okai vannak, ennek taglalásába nem mennék bele, lényeg a válasz a fenti kérdésre: Ebben az esetben pont ugyanaz fog történni, mintha 3 db 1TB-os lemezzel rendelkeznél. Raid5ben 2TB hasznos terület, és 1 TB a biztonságra. Ez azért ahhoz hasonlítva, hogy amúgy 7TB-nyi merevlemezünk van, igencsak sajnálatos.
Szóval, ha már vannak lemezeid, akkor célszerű ezekkel megegyező méretű lemezeket csatarendbe állítani annak érdekében hogy a hasznos terület veszteséget elkerüljük.
DE! Ha Neked van 1 TB merevlemezed, és most veszel egy 4TB-s merevmelezt mellé, akkor a jelenlegi veszteséged még magas lesz, de ha 1 év mulva az 1TB-t kicseréled 4TB-re, akkor durván megkatapultálod a rendszered hasznos kapacitását…. Oké, már egy kicsit jobban belementem mint ebben a posztban akartam. 🙂
Ja, és felesleges most bevásárolni sok lemezből. Lehet hogy ugyanaz a lemez 2 év mulva féláron lesz, vagy ugyanezen az áron 2 év múlva 2x-es méretű lemezt vehetsz majd. No ezekről még majd dumcsizunk.
Es mi az az SHR?
Raid tömbök ide-oda, aki találkozott már Synology NAS-okkal, az belefuthatott az SHR elnevezésbe, ami annyit tesz, hogy Synology Hybrid Raid. Átlag felhasználók számára erről 2-3 dolgot érdemes tudni.
Lehetőség van egy (más, btrfs) fájlrendszerben működni abban az esetben, ha SHR tömböket építünk, elősegítve ezzel fájlkezelés egy hatékonyabb szintjén. Ami viszont sokkal láthatóbb lesz egy átlag user számára: Nagyon egyszerűen lehet a Synology DSM rendszerén keresztül kezelni az SHR tömbben szereplő lemezeket meghajtónak, és ami a legjobb dolog, hogy új lemezek hozzáadása esetén nem kell az egész tömböt felbontani és „újrakonfigurálni”, egyszerűen lehet bővíteni a lemezeink által alkotott kötetet (akkor is ha már vannak rajta adatok – nyilván).
Ez persze nem jelenti azt, hogy ne lenne érdemes biztonsági másolatban gondolkodni, mikor egy tömböt bővítünk – biztos ami biztos alapon. Akit bővebben érdekel az SHR téma, az a synology honlapján talál még információkat.
Szumma szummarum
Remélem sikerült értelmesen elmagyaráznom, hogy mi az a raid tömb. 🙂 Én arra használok Raid tömböt, hogy adataim biztonságosabban tudjam tárolni, hogy ne szívjam meg harmadjára is, mint 2006-ban és 2012-ben.