Ciao a tutti,
oggi vi parlerò delle nuove funzionalità di autohealing (autocorrezione) presenti in DPM 2010 e di come fare un tuning mirato di queste funzionalità in caso di scenari e necessità più specifiche.

DPM 2010, rispetto alla precedente versione (DPM 2007), ha aggiunto la capacità di autohealing che permette a DPM 2010 di rilevare e di rendere le repliche delle nostre datasources che stiamo proteggendo, consistenti in modo automatico e affidabile con lo stato attuale delle datasources stesse presenti sui nostri server protetti.

Le tre principali funzioni di autohealing presenti in DPM, sono l’Auto-grow, l’Auto-CC (Consistency check) e l’Auto-rerun.

Auto-Grow
L’Auto-grow è la capacità di DPM 2010, di gestire e di ampliare autonomamente l’eventuale esaurimento di spazio disponibile sui volumi separati delle repliche e dei recovery point, o dei volumi che includono sia e più repliche che recovery point (nel caso si utilizzi la co-location su disco).

DPM 2010 rileva questo possibile problema al raggiungimento di una determinata percentuale di soglia sullo spazio occupato (90% dello spazio occupato per un determinato volume) e l’Auto-grow è usufruibile solo per i dischi contenuti nello Storage Pool sul server DPM 2010 (i custom volumes non permettono di utilizzare questa funzione in quanto la loro gestione non viene seguita da DPM 2010 ma è in carico all’utente finale tramite lo snap-in di Disk Management del sistema operativo)

L’abilitazione dell’Auto-grow può essere effettuata sia durante la creazione del protection group che dopo la creazione del protection group.

a) durante la creazione del protection group si può selezionare l’opzione per abilitare l’Auto-grow durante il wizard “Create new protection group”:

untitled

b) se durante la creazione iniziale del protection group, l’Auto-grow non fosse stato abilitato, è possibile abilitarlo selezionando la datasource e scegliendo “modifying disk allocation” . Da questa schermata, si può abilitare l’Auto-grow come dal seguente esempio:

untitled

Tramite l’Auto-grow è possibile impostare una dimensione di estensione o una percentuale di incremento dello spazio totale di determinati volumi per le repliche e i recovery point, che DPM 2010 implementerà appena avrà rilevato che ci sia un problema di esaurimento dello spazio disponibile evitando che le repliche non possano essere aggiornate e che i recovery point non vengano creati correttamente in base alle schedulazioni dei nostri protection group.

Consiglio di verificare con i vostri vendor SAN/HW, la possibilità e la capacità di estendere e accorciare la dimensioni dei dischi fissi che andrete ad utilizzare con DPM 2010 in fase di progetto/preventivo per evitare di non sfruttare pienamente la funzione di Auto-growin fase di produzione.

Auto-CC
L’Auto-CC, o auto-consinstency check, è una funzionalità che permette a DPM 2010 di innescare un’altro consinstency check dopo 15 minuti trascorsi i quali il primo consinstency check schedulato non fosse andato a buon fine.

Il consinstency check è una funzionalità che può essere attivata nella configurazione del protection group e che viene eseguita quando DPM 2010 rileva, per qualsiasi causa, che la replica di una determinata datasource non è consistente con lo stato attuale della datasource presente su un determinato server protetto:

untitled

Esiste una chiave di registro di DPM 2010, che consente di specificare e impostare il numero di ritentativi massimi che DPM dovrà effettuare per i consinstency check (nel caso la chiave non fosse presente è necessario aggiungerla manualmente):

HKLM\Software\Microsoft\Microsoft Data Protection Manager\Configuration

Nome Chiave: AutoCCNumberOfAttempts
Tipo: DWORD
Impostazioni controllate: Il numero di volte che DPM cercherà di risolvere uno stato di inconsistenza di una replica prima di stabilire che il job di consistency check sia fallito definitivamente

Implicazioni: il default è 1. L’aumento di questo valore può aumentare il carico sull’intero sistema in proporzione al numero di data source e al numero di inconsistenze sulle repliche

Auto-rerun
L’Auto-rerun è un miglioramento incluso in DPM 2010 che permetterà di eseguire un job schedulato (creazione e consolidamento dei recovery point) che falliranno al primo tentativo.

Tenete in considerazione i seguenti aspetti per questa funzionalità:

  1. L’auto-rerun ha un ritardo tra due tentativi di un’ora per default.
  2. L’auto-rerun non sarà effettuato se un’altro job è schedulato entro quattro ore o per qualsiasi job con funzioni particolari di DPM 2010.
  3. il numero di ritentativi di default è 1. Questo valore può essere cambiato tramite una chiave di registro
  4. L’auto-rerun sarà innescato quando vengono sollevati i seguenti alert nella console di amministrazione di DPM 2010:

    la creazione dei recovery point per una data replica non è avvenuta con successo

    il consolidamento dei recovery point per le repliche non è avvenuto con successo (ad esempio, mancato salvataggio dei recovery point nel relativo volume per mancanza di spazio disponibile)
  5. Nel caso in cui fosse abilitato il consinstency check nel protection group che include un job di recovery point non andato a buon fine, DPM effettuerà instantaneamente un consistency check per ripristinare lo stato di consistenza di una data replica e permettere di effettuare la creazione del recovery point in un secondo momento.

Questa è la chiave di registro che consente di modificare il numero di ritentativi per l’Auto-rerun (nel caso la chiave non fosse presente è necessario aggiungerla manualmente):

HKLM\Software\Microsoft\Microsoft Data Protection Manager\Configuration

Nome Chiave: AutoRerunNumberOfAttempts
Tipo: Dword

Impostazioni controllate: il numero di tentativi che verranno effettuati in caso un job sia fallito al primo tentativo schedulato, prima che DPM 2010 consideri questo job definitivamente non andato a buon fine.
Implicazioni: il valore di default è 1. L’aumento del valore può aumentare il carico sull’intero sistema. I  ritentativi vengono effettuati in base ad un ritardo configurabile con la chiave di registro AutoRerunDelay.

Nome Chiave: AutoRerunDelay
Tipo: DWORD

Impostazioni controllate: il ritardo in termini di tempo prima che DPM tenterà automaticamente di rieseguire i job non andati a buon fine.

Implicazioni: Questo valore dovrebbe essere cambiato se si hanno dei down time previsti per i server di produzione o per gli ambienti di rete dove sono presenti i server DPM e quelli protetti, che eccedono il valore di 60 minuti. Se vengono configurati ritentativi multipli questa chiave imposterà il ritardo tra un ritentativo e l’altro. Se il valore di questa chiave viene impostato a zero, DPM rieseguirà il job non andato a buon fine immediatamente.

Spero di avervi fornito ulteriori informazioni sulle nuove funzionalità di DPM 2010 e sul loro utilizzo.

Aspetto vostri eventuali commenti e richieste di approfondimento sugli argomenti trattati in questo post.

Ciao e alla prossima Sorriso