Se o objetivo de uma organização de TI é entregar de forma efetiva e eficaz os serviços de TI aos usuários e clientes, é importante que haja planejamento para todas as fases necessárias para tal. A quais fases estou me referindo? Às fases que mapeiam o ciclo de vida de um serviço de TI, representada, segundo o Microsoft Operations Framework (MOF), pela figura abaixo:
Os envolvidos no planejamento, entrega e operação desses serviços de TI devem ser capazes de:
A melhor forma de atingir aos objetivos listados acima é garantir que as responsabilidades estejam mapeadas com os papéis e times de trabalho.
Todos que executam uma tarefa ou atividade associada a um serviço deve ter claramente definido seu papel, entender suas responsabilidades e possuir a capacitação correta para cumprir essas responsabilidades.
Embora algumas responsabilidades possam variar dependendo da área de TIC e da indústria de atuação da organização, existem algumas responsabilidades básicas que podemos mapear, a saber:
A separação do time de trabalho em papéis e responsabilidades é necessária para que todos saibam quem é responsável a fazer o que. Isso ajuda a:
Uma correta separação de papéis e responsaabilidades demonstra como construir e manter um time que é:
Um passo importantíssimo para entregar o valor esperado pelos clientes com os serviços de TI é garantir que exista um acordo de nível de serviço, planejado por todas as áreas de TI bem como com o cliente final. Logicamente não basta existir um SLA, ele deve ser cumprido, mas o fato de existir algum SLA já é o primeiro passo, por que significa que o mesmo foi discutido dentro da área de TI bem como com o cliente.
O SLA é útil para garantir que os serviços entregues atendem às expectativas de negócios, as metas de desempenho e os custos necessários para a entrega de um determinado serviço de TIC a um conjunto de clientes. Um SLA eficaz reflete a comunicação entre os clientes e usuários (os consumidores do serviço) e deverá traduzir-se na tabela de indicadores. Os objetivos de nível de serviço que são identificados, em seguida, serão usados para desenvolver e personalizar o scorecard de aderência para o serviço.
O SLA deve ser balanceado entre ser relevante e factível. Em geral, a disponibilidade desejada por todos é de 100%, mas isso, infelizmente, é irreal. O SLA deve conter um objetivo relevante a ponto de atingir o nível de serviço realmente necessário e exigido pelo negócio, mas também deve ser possível de ser entregue, não pode conter premissas ou promessas irreais.
Um SLA deve possuir a descrição e definição, em linguagem clara para o cliente, de todos os pontos importantes sobre o serviço de TIC. Por exemplo, descrição do serviço, seus requerimentos, necessidades de dados de entrada, saídas esperadas, horários de funcionamento do serviço, tempos de atendimento ao usuário em caso de problema, disponibilidade total esperada, tempo de retorno em caso de indisponibilidade, etc.
Um dos pontos mais comuns de ser descrito em um SLA é a disponibilidade esperada do serviço. Um indicador comum usado para medir a disponibilidade é o percentual de tempo que um serviço foi capaz de servir aos seus clientes e usuários.
No caso de um serviço que é esperado que funcione 24 x 7, o tempo total esperado, no ano, é de 24 horas x 365 dias = 8760 horas.
Em geral, a disponibilidade desejada por todos é 100%, mas isso, infelizmente, é irreal. Num caso mais realista, a disponibilidade nos SLAs é medida em “noves”, ou seja, quantos “noves” no percentual são esperados. Um serviço que é esperado “3 noves” deve ter disponibilidade de 99,9%.
A tabela abaixo mostra os cálculos de disponibilidade em relação a um serviço 24x7, com base anual.
% Disponibilidade
Horas Totais no Ano (24x7)
Tempo máximo de indisponibilidade
Horas Totais no Ano (8x5)
90%
8760 horas
876 horas (36,5 dias)
2086 horas
208.6 horas (26 dias)
95%
438 horas (18,3 dias)
104 horas (13 dias)
99% (2 noves)
87 horas (3,6 dias)
20,86 horas (2,6 dias)
99,9% (3 noves)
8,76 horas
2 horas
99,99% (4 noves)
52,56 minutos
12,5 minutos
99,999% (5 noves)
5,3 minutos
1,25 minutos
Como pode ser reparado na tabela de tempos de indisponibilidade, o tempo máximo aceitável de indisponibilidade é alterado com a alteração do tempo total esperado de serviço (janela de funcionamento do serviço). No caso de um serviço em horário comercial (8x5), uma queda do sistema durante a madrugada, com o serviço voltando a funcionar antes ainda do horário comercial não afeta o cálculo de disponibilidade para efeitos do SLA, por que o serviço não tinha a obrigação de funcionar fora da sua janela estipulada.
A Microsoft recomenda considerar os seguintes pontos quando da criação e manutenção de SLAs e medições de disponibilidade:
Conduzir uma reunião regular de Revisão de Nível de Serviço é uma forma importante de entender o estado atual do serviço. A revisão frequente dos dados atingidos mantém o foco de trabalho nos mais importantes indicadores de negócio, bem como pode alertar com boa antecedência para eventuais desvios aos objetivos dos SLAs.
Após a documentação e formalização do serviço do SAJ com mapa de serviço, SLAs, OLAs, e a tecnologia totalmente revisada e corretamente configurada, a manutenção dos níveis de serviço requerem criação de:
Bem, espero que as informações discutidas aqui possam ajudar o entendimento da função de Gerenciamento de Nível de Serviço, possibilitando a área de TI entregar serviços de TI com mais qualidade, agregando valor ao cliente.
Abraços e até o próximo post,
Ronaldo Smith Jr.