Hibrid adattárolási megoldások nagyvállalatoknak, Microsoft StorSimple

A felho rugalmas és végtelen bovítési kapacitása új lehetoségeket nyit a nagyvállalati adattárolás területén. Hibrid (saját és felhoben való) adattárolás és archiválás a Microsoft StoreSimple eszközzel és Windows Azure felhoszolgáltatással egy költség hatékony és egyben kelloen gyors elérésu, nagy teljesítményu adattárolási és archiválási megoldás kialakítás lehetoségét jelenti a nagyvállalatok számára.

Aki nem akarja végig olvasni a teljes cikket a lényeget megnézheti az alábbi (angol nylvu) videóban: https://www.youtube.com/watch?v=Xxi6FBJQA_M

Magam részérol több mint öt éve vezetek hibrid autót, eloször négy évig csak félig hibrid, most meg már egy teljesen hibrid kialakításút. A hibrid (azonos feladatra két eltéro technológiát egyesíto) megoldásokban én két okból hiszek, és ezt most az autós analógiában mutatnám be:

  • Óvatos lépés egy új technológia megismerése felé : A teljes hibrid (full-hybrid) autók esetében definíció szerint a belsoégésu motor egy opcionális komponens, az autó a belso égésu motor nélkül is képes elindulni, haladni (természetesen megállni) vagyis egy teljes értéku elektromos autó + benzinmotor. Ezt a képet persze árnyalja, hogy a csak elektromos autóként való muködés esetén csak néhány kilométer a megteheto távolság. A teljes elektromos autók esetében is ma még mindössze 160-300 km közötti hatótávolságról beszélünk, ami messze alul marad (egyelore) a benzines üzemu autók képességeitol, a tisztán elektromos autók – különösen a megfelelo tölto infrastruktúra hiányában – ma még eroteljesen kompromisszumos megoldást nyújt. Azonban úgy gondolom, hogy mivel kipróbáltam a fél hibrid és a teljesen hibrid üzemu autókat, megismertem a viselkedésüket, menet jellemzoiket mind tisztán elektromos mint hibrid autóként, megtanultam mire kell figyelni egy olyan autón ami részben akkumulátorról, elektromos motorral megy. Pl.: többet használjam a motorféket a fékpedál helyett, hiszen így a regenerativ fék visszatölti az akkumulátort és így „megmenti” azt a mozgási energiát, amit a fékek egyébként csak hové disszipálnának, vagy pl. milyenek a menettulajdonságai egy olyan autónak, amiben nincsenek sebesség fokozatok). Ezáltal én úgy gondolom, hogy felkészültebben tudok átülni majd egy teljesen elektromos autóba, mint valaki, aki esetleg egybol egy „hagyományos, kézi váltós, belsoégésu motoros autóból ül át majd egyszer az elektromos autóba. Összefoglalva: a hibrid megoldás használata lehetové teszi, hogy kipróbáljak egy új technológiai irányzatot (pl.: elektromos autó) úgy nem vagyok teljes mértékben kitéve az új technológia hiányosságainak (elektromos autók rövid hatótávolsága, szemben a hagyományos autók hatótávolságával)
  • Muködési költségek csökkentés lehetosége az innováció révén: A technológiai innováció mindig az emberek életének jobbá tételérol szól. Ez jelentheti, hogy olyan dolgok válnak elérhetové, amelyek korábban nem (vagy nem mindenkinek) elérheto, amely új távlatokat nyit meg, vagy segíti a meglevo életünk kényelmesebbé vagy éppen olcsóbbá tételét. Ha a technológiai innovációt vállalati, vállalkozási szempontból nézzük akkor annak az árbevétel növekedését és/vagy muködési költségek csökkentését, új üzleti lehetoségek megjelenését és/vagy ügyfél elégedettség növelését kell, hogy segítse. Az autós példánál maradva ugyan valamivel többet költöttem a teljes hibrid kialakítású autómra, mint amit az autó kategóriájában az átlag, viszont a 3,7-4,5 l/100km-es fogyasztás révén az autó használati ideje alatt sokkal kevesebbet költök üzemanyagra, mint ha egy ugyanilyen méretu hagyományos autót vettem volna, vagy pláne ha egy ugyan ilyen árban levo nagyobb autót vettem volna.

Összefoglalva és az autós részt lezárva: a hibrid kialakítással alacsony kockázattal tudom kipróbálni és használatba venni egy újonnan megjeleno technológiában levo lehetoségeket.

És akkor az autózás után térjünk át egy másik kedvenc témámra az adat és fájltárolásra. A fájlkiszolgáló technológia gyakorlatilag a számítás technika osi ideje óta velünk van, emiatt sokan hajlamosak elsiklani felette, mondván itt már nincs új a nap alatt. Noha ebben a cikkben nem a Windows Server fájlszerver újdonságait szeretném bemutatni, azok akik utoljára a Windows Server 2003 fájlszerver képességeit nézték át, javaslom mindenképpen nézzék meg mi minden újdonság/lehetoség van a Windows Server 2012 és Windows Server 2012 R2 fájl kiszolgálókban, mint például:

  • Fájl klasszifikáció,
  • Kvóta menedzsment
  • Fájl típus szurés
  • Jelentések
    Dinamikus hozzáférési listák (Dynamic ACLs)
  • iSCSI target és initiator
  • SMB 3.0

Ebben a cikkben a tárolási képességek egy másik új technológiai innovációjáról a felho alapú adattárolásról szeretnék egy bemutatót tenni. Korábban definiáltuk a felho fogalmát, ami természetesen a felho alapú adattárolásra is vonatkozik. A Microsoft felho megoldásaiban egy közös és szerintem nagyon fontos jellemzo más gyártók megoldásaihoz képest, hogy a Microsoft rendelkezik privát és a publikus felho megoldásokkal egyaránt és ezek a megoldások, átjárhatóak oda-vissza. Vagyis minden vállalat és IT eldöntheti, hogy mennyi publikus és mennyi privát felhot szeretne használni, ami számára ideális költségek, lehetoségek, és rugalmasság tekintetében. Ez igaz a fájlszerver és adattárolásra is.

A probléma köt bemutatása, definiálása

Napjainkban az adattárolási igények folyamatosan növekednek. A felhasználók egyre több és több fájlt hoznak létre, ahogy a vállalati élet minden területe egyre jobban digitalizálódik. Azonban ha az egy adott adat elérési gyakoriságát és az idot vizsgáljuk, akkor valami hasonló görbét kapunk:

Vagyis az adatok a keletkezésük idején nagyon gyakran, késobb egyre kevésbé kerülnek elérésre, de archiválás, adattárolási szabályzat, stb. miatt szükség van arra, hogy megtartsuk. A storage technológiákban jártasak számára ismeros a „Tiering” kifejezés, vagyis hogy az adatokat az elérési gyakoriságuk alapján osztályozzuk és a ritkábban elért adatokat olcsóbb tárolóra mozgatjuk. Nézzük át hogy „hagyományos storage” megoldás esetén a „tiering” és a teljes adattárolás milyen rétegekbol, komponensekbol áll (itt most nagyvállalati értelemben vett, üzlet és üzletfolytonosság kritikus adattárolásra gondolok, olyanokra amelyek elvesztése anyagi kárt jelent a vállalat számára).

  1. Elsodleges storage réteg: teljesíti a gyakran elért adatokkal, adatbázisokkal kapcsolatos teljesítmény igényeket (IOPS). Jellemzoje: legmagasabb egységnyi tárolt adatra vett ár (HUF/GByte)
  2. Archiválási storage réteg: Nagy kapacitású, de kisebb teljesítményu tároló (pl.: NAS ami SAS vagy egyéb olcsó tárolási megoldást használ). Az elso rétegnél szignifikánsabban alacsonyabb az egy GByte-ra eso adattárolási költség. Ez a réteg szolgál a hosszabb távon megorizendo, ritkábban használt de továbbra is a felhasználók számára az IT beavatkozása nélkül elérheto adatok tárolására.
  3. Disk alapú adatmentési réteg: A változások, fájlverziók módosításainak tárolása („pl: a reggeli verzióban még benne volt az a fejezet, biztos valaki véletlenül kitörölte”)
  4. Szalagos mentési réteg: archiválás hosszú távú megorzés (amely a felhasználó számára nem transzparensen elérheto)
  5. Geo-adattárolás, másodlagos telephelyre való adatreplikáció vagy átszállítás: célja az adatok több helyen való tárolása, az adatok védelme érdekében. Ez vállalati, adatmegorzési igények, eloírások, stb. szerint több különbözo módon történhet: az adatok hálózati replikációjával, vagy a fizikai adathordozók (pl. szalagos mentés) másodpéldányainak átszállításával. „sose becsüld alá a teherautó jelentette sávszélességet”

A fenti rétegek közül egy nagyvállalt legalább az elso réteggel és legalább még egy - de nagyobb valószínuséggel több – réteggel rendelkezik.

A fentiekbol jól látszik a növekvo adattárolási igények legfobb problémája – ami helyett én jobban szeretem a lehetoség, vagy megoldandó feladat kifejezést  – miszerint: egy új GB adat tárolása több rétegben is megjelenik, a tárolási költségek eszerint növekednek (storage-t kell bovíteni, mentési kapacitást kell bovíteni, a másodlagos adatközpont adattárolási kapacitását kell bovíteni, stb., stb.).

Az elasztikus, rugalmasan bovítheto felho szolgáltatások tehát itt jó költség megtakarítási lehetoséget nyújthatnak, ám a felho technológiák adattárolási lehetoségeinek hiányosságait (mint ahogy a teljesen elektromos autók limitált hatótávolságát kompenzálja a hibrid elektoromos-benzines kialakítás).

Microsoft StorSimple muködésének és elonyeinek áttekintése

A Microsoft StorSimple egy adattároló eszköz, ami a hasonló nevu cég felvásárlása révén került a Microsofthoz. Ha egy mondatban kellene megfogalmazni akkor kissé pongyolán azt mondanám egy saját adatközpontban levo gyorsító tár a Windows Azure nevu végtelen kapacitású adattárolóhoz. Az analógia alapja a CPU-ban is használt cache gyorsító tár, amely a mai gépekben levo GB-os TB-os RAM memória méretekhez képest elenyészoen picinek tunik (a L3-as cache is néhány MB a legmodernebb szerver kategóriás CPU-kban is, az L2, L1 cache ami a legközelebb van a CPU-hoz és a leggyorsabb még mindig kByte méretekben mérendo). A CPU cache (L1-L2-L3) feladata hogy az adatok elérhetoségét a CPU sebességén biztosítsa, mivel a RAM (még a modern DDR3 RAM-ok is) a CPU adatfeldolgozási sebességének töredékével képesek csak adatot írni és olvasni. Pontosan így kell elképzelni a StorSimple és a Windows Azure által biztosított hibrid adattárolást, természetesen néhány lényeges elemmel kiegészítve.

Nézzük meg egy ábrán, hogy néznek ki az adattárolási rétegek a StorSimple esetén:

Vagyis a StorSimple a korábban látott akár hat adattárolási réteget egy saját infrastruktúrában, és egy felhoben megvalósított rétegben valósítja meg. A korábban látott rétegek feladatait a StorSimple és a Windows Azure által biztosított megoldás a következo képen biztosítja:

  • A legfrissebb és leggyakrabban elért („legforróbb”) adatokat egy SSD adattárolón tárolja, ez jelenti a nagy teljesítményu elsodleges adat elérési réteget.
  • Ahogy az adatok folyamatosan érkezek be és az SSD adatterületen a szabad hely fogytán van akkor a StorSimple eszköz eloször is blokk szinten de-duplikálja az adatokat (teljesen szabványos, hagyományos blokk – tehát nem fájl szintu módon). Ez jelenti az elso archiválási és mentési réteget. A mentési réteget azért, mert a blokk szintu de-duplikáció hatékony tárolást biztosít hogy több verziót tudjunk tárolni ugyan abból a fájlból hasonlóan a Windows Server „Previous version” opciójához. Példa: van egy 30 Mbyte-os PowerPoint prezentációm a fájlszerveren. Errol csinálok snap-shot mentést, ami az aktuális állapotot tartalmazza. Holnap egy kollégám megmódosít 3 diát és felül írja a fájlomat. Azt hogy ezt egy korábbi állapotból visszahozzam, kell a korábbi snap-shot mentés. Viszont mivel a snap-shot mentés, az eredeti és a módosított fájl is a StorSimple által kezelt tárolón van így töredék annyi helyet használok: 30 MB lenne a snap-shot mentés adattárolási igénye és 30 MB lenne a módosított fájl is a fájlkiszolgálón és 30 MB tárhely kellene a korábi verzió visszaállítására. Ez összesen 90MB lenne, de StoreSimple-n a deduplikáció miatt ez csak 30MB + „eredeti fájlhoz képesti 3 dia módosítás” helyigényt jelent.
  • Ahogy az adatok folyamatosan érkezek be és a de-duplikáció után is alacsony az elérheto szabad hely az SSD tárolókon utána a már de-duplikált adatblokkokat a StorSimple eszköz tömöríti és utána a SAS tároló lemezekre írja. A tömörítés az nagyobb tárolási kapacitás mellett gyorsabb adatelérést is biztosít, mivel a CPU-k sebessége nagyságrendekkel gyorsabban fejlodött, mint a merevlemezek adatátviteli sebessége. Ez is az archiválási és adat mentési réteg része, amely még mindig saját infrastruktúrában található.
  • Ha az SSD és a SAS diszk rétegekben is egy adott szint alá kerül az elérheto szabad hely, akkor a StorSimple eszköz titkosítja (AES256) az adat blokkokat és a Windows Azure felhobe írja. A titkosítási kulcs kizárólag on-premise található meg, tehát a Windows Azure tárolóban levo adatokhoz sem a Microsoft sem senki más illetéktelen nem férhet hozzá. A Windows Azure jelenti a korlátlan adat archiválás, mentés és georeplikációs réteget. A Windows Azure-ban egy adatblokk minimum három példányban kerül tárolásra egy adatközpontban és ha explicit nem tiltjuk le akkor régión belül automatikusan replikálódik két adatközpont között. Ez azt jelenti hogy 6 példányban van tárolva a Windows Azure-ban tárolt adat (3-3 példány egy-egy adatközpontban), ezáltal a georeplikációs adatvédelem is biztosított. (A Windows Azure adatközpontok olyan távolságra vannak egymástól, hogy természeti, ipari vagy egyéb katasztrófák ne tudjanak egyszerre több régiót vagy az ott tárolt adatokat elérhetetlenné tenni. A nagyon nagy elonye ennek az on-premise adat archiválás, mentés és georeplikációhoz képest, hogy itt a költségek az adatmennyiséggel egyenes arányban nonek, míg onpremise esetben a plusz archive diszk, plusz mentési kapacitás, plusz georeplikáció, plusz másodlagos adatközpontban tárolási költség, stb is megjelenik.. Amenniyben egy Windows Azure-ban tárolt adatra van szükség akkor azt a StorSimple beolvassa a felhobol, és elhelyezi a SAS vagy SSD adattárolóban (de nem törli a Windows Azure-bol)

Fontos megemlíteni hogy a különbözo rétegek közötti adat mozgatást a StorSimple eszköz automatikusan végzi, tehát mind az üzemeltetonek, mind a végfelhasználónak egybefüggo nagy adattárolási területnek látszik a StorSimple + Windows Azure tárterület.

A fentieket ábrázolva a StorSImple és Windows Azure adattárolási megoldás költség elonye:

A Windows Azure révén elméletileg korlátlan tároló kapacitás áll rendelkezésünkre a StorSimple + Windows Azure mint archiválási megoldás révén, amely költség hatékony, hiszen a tárolási költségeink a kapacitás igényekkel lineárisan nonek (vagy még az alatt, mivel aki már nézegette a Windows Azure publikus ár kalkulátort láthata, hogy egységnyi adattárolás költsége nagyobb kapacitás igények esetén valamelyest alacsonyabb a Windows Azure-ban.

Egy nagyon érdekes adattárolás tervezési kérdést vet ez fel mégpedig, hogy milyen arányú legyen a „lokális cache” és az allokált felho tárolási kapacitás. Mivel ez adat igényektol, használattól, technológiai lehetoségektol stb. függo sok ismeretlenes egyenlet, amire általános javaslatot nem tudok tenni, pontosabban csak annyit hogy mi (Microsoft Consulting Services, Premier Support Services) és Windows Azure rendszerintegrátor partnereink állunk minden ügyfelünk rendelkezésére. :)

Amit fontos viszont kiemelnem:
A StorSimple és Windows Azure adattárolónkat elsodlegesen nem nagy teljesítmény igényu nagy adatmennyiségu adatok tárolására használjuk, amelyek esetén igaz az a megállapítás, hogy az adatok kis része van gyakran használatban a többi inkább csak archív:

  • Fájlszerver: Klasszikus irodai fájlmegosztás a legelso és egyik leghatékonyabb felhasználási területe a StorSimple és Windows Azure alapú adattárolásnak (CIFS-SMB, NAS, NFS)
  • Nagy média fájl archívumok: Mérnöki anyagok, CAD, EMR/PACS, naplók, logok, jogi, építészeti, stb.
  • SharePoint: Blob tárólók, adatbázisok
  • Virtualizációs környezet: VM archívumok, library-k, nem elsodleges telephelyek VM gépeinek háttértára

Természetesen egy StorSimple és Windows Azure tároló megoldás a fenti igényeket egyszerre is tudja kezelni.

Fentartással legyunk azokban az esetekben amikor ez a fajta tárolási mód nem ideális, mint például:

  • Virtuális gépek amik nagy teljesítményt igényelnek
  • Archívumok amiket az alkalmazásuk folyamatosan indexel, katalogizál
  • SQL adatbázisok (mérettol függoen)

Semmilyen körülmények között ne használjuk a StorSimple és Windows Azure alapú tárolást az alábbiakra:

  • Mento szoftver háttértára (se System Center 2012 Dataprotector Manager, se más harmadik fél). A DPM képes közvetlenül a Windows Azure-ba menteni, használjuk az ha közvetlenül a felhobe szeretnénk menteni.
  • Nagy teljesítmény igényu rendszerek (ERP, CRM, adatbányászat és analitika)
  • Exchange, vagy egyéb levelezo rendszer

Az eszköz

Zárásként azok kedvéért, akiket érdekelnek a technológiai részletek is a StorSimple eszközt szeretném bemutatni:

 Az eszköz felépítését és javasolt hálózati kialakítását az alábbi ábra mutatja:

Látható hogy a két controller két-két hálózati kártyával rendelkezik az iSCSI forgalom számára, illetve mind a két kontroller rendelkezik egy management és egy internet csatlakozást biztosító adapterrel a Windows Azure tároló eléréséhez. Az eszköz management-je megoldható az iSCSI Ethernet csatlakozókon keresztül is, nem kötelezo (de javasolt) a management hálózat használata

Az eszköz rendelkezik egyaránt MMC és webes konfigurációs felülettel is. Használat tekintetében ugyan úgy kell kezelni mint bármilyen iSCSI storage-t, ki kell alakítanunk diszk területeket, amiket az iSCSI initiator-oknak (kiszolgálóknak) egyszeruen diszkekként kiallokálunk (akár MPIO-n keresztül). A lényeges különbség hogy egy hagyományos SAN-nal ellentétben itt a benne levo SSD és SAS diszkek kapacitásai feletti tárolási kapacitást tudunk kiallokálni és felhasználni.u

Összefoglalás

Azokra az adattárolási igényekre, amelyek mérsékelt teljesítmény igényu, viszont nagyon-nagy archiválási kapacitás igényuek azokra a StorSimple eszköz a Windows Azure olcsó adattárolási képességével egy hatékony és a nagyvállalati igényeket (archiválás, mentés, georedundáns tárolás) teljes mértékben kielégíto, költséghatékony megoldást tud nyújtani.

A hibrid adattárolást nem lehet 1:1-ben összehasonlítani a hagyományos adattárolási technológiákkal, fontos hogy értsük a muködését, lássuk a használati területeket, hol jelent elonyöket, de ugyan úgy lássuk a korlátait is. Ez se nem egy általános célú high-end, se nem egy mid-range enterprise storage, hanem egy új adattárolási lehetoség, amely elonyeit komplexen az adattárolási, archiválási és mentési megoldások egészével kell összevetni üzemeltetés és költségek tekintetében.