Privát felhő üzemeltetés: Incidens és probléma kezelés

Ebben a cikksorozatunkban a privát felho megoldások üzemeltetéséhez kapcsolódó megközelítést tekintjük át. Ez a cikksorozat nem technikai hanem üzemeltetés módszertani megközelítést, filozófiát mutat be, azt hogy az ITIL/MOF alapú üzemeltetési módzsertant mivel érdemes kiegészíteni, milyen területeket érdemes újra gondolnia olyas valakinek aki egy privát feljo infrastruktúra üzemeltetésében gondolkodik. Ez a cikkünk az incidens és probléma kezelésrol szól.

Incidens és probléma kezelés (Incident and Problem Management)

Az incidens kezelés célja, hogy megoldja azokat az eseteket amiknek kihatásuk lehet a szolgáltatásokra olyan gyorsan amilyen gyorsan csak lehet, a leheto legkisebb kieséssel. A probléma kezelés célja hogy azonosítsa és megoldja azokat az alap okokat amik miatt az incidensek keletkeztek és meggátolják a jövobeni incidensek kialakulását vagy minimalizálják azok kihatásait.

A privát felho alapú szolgáltatások incidens és probléma kezeléséhez az ITIL vagy MOF értelemben vett érett és kiforrott szervezett szükséges. A privát felho szolgáltatás egy új koncepciót von be az incidens és probléma kezelés kérdéskörébe ez pedig az eroforrás romlás (resource decay).

Eroforrás romlás számítása

Ez a koncepció meghatározza, hogy hogyan kezelendoek a hardver eredetu hibák. Ahelyett hogy a kiesett kiszolgálót incidensként kezelnénk ami azonnali megoldást igényel a kieso kiszolgálót az ütemezett csere vagy tervezett karbantartási ablakban kell kezelni, vagy akkor amikor az eroforrás csoport elért egy kritikus romlási szintet. Más szóval ha egy fizikai kiszolgáló meghibásodik akkor azt nem incidensként kell kezelni, ami azonnali beavatkozást igényel, hanem ahhoz hogy ez költség hatékony legyen azt úgy kell kezelni, mint bekövetkezett romlást az eroforrás csoportban, amire az eroforrás csoport tervezetten fel van készítve (tervezzünk a hibára!).

Ahhoz hogy az üzemeltetés megfeleloen kiegyensúlyozza a költségeket, hatékonyságot és kockázat kezelést és felkészüljön hogy az alábbi módok valamelyikének követése szükséges egy privát felho alapú üzemeltetési modellben (és persze az infrastruktúrának és az üzemeltetési folyamatoknak ehhez kell igazodnia):

  • A meghibásodott kiszolgálók cseréje az elore tervezett ütemterv szerint
  • A meghibásodott kiszolgálók cseréje amennyiben egy adott százaléka a kiszolgálóknak meghibásodott
  • Egy egész skálázódási egység cseréje, amikor a meghibásodás mértéke elért egy adott szintet az adott skálázódási egységben
  • A kiszolgáló kiesések kezelése továbbra is incidens jelleggel történik