システム運用のサービスレベル管理の説明です。
サービスレベル管理は、SLAを管理するプロセスです。
サービス品質を維持するための活動のことを指すこともあれば、SLAの立案や合意も含めることもあります。
SLAを守るためには、モニタリングの仕組みなどが必要となり、その仕組みの導入は開発プロジェクトの中で行われるので、システム運用としてはSLAの立案や合意を含めない方が自然かなと思います。
1.SLAとは
そもそもSLAとは何でしょうか?
SLAは、Service Level Agreementの略で、提供するITサービスの可用性や性能などの品質について保証する項目と水準を定めたものです。
規定される項目は原則として、定量的に計測可能なものとなります。
似たようなもので、SLOがあります。
SLOは、Service Level Objectiveの略で、SLAが保証なのに対して、SLOは目標です。SLAには達成できなかった際のペナルティがあるのに対して、SLOにはペナルティはありません。
SLAで取り決めた内容を達成するために、サービス提供者側が設定する目標で、SLOの目標はSLAで設定したものよりも厳しくなることが一般的です。たとえば月間稼働率がSLAで99.95%を保証するのであれば、SLOでは99.99%を目標にします。
SLOは目標なので、SLAにない項目もSLOで目標とすることも多いです。
クラウドなどのサービス提供型ではなく、受託開発の場合には、SLAを交さず、SLOとして発注者と合意するに留めるプロジェクトが多いです。
2.SLAやSLOで設定する項目
SLAにしてもSLOにしても、定量的に測定できる項目が対象となります。基本的には、非機能要件で合意した項目の中で、定量的に測定できるものがSLAやSLOとなります。
このように、意外とSLAやSLOに設定できる項目って少ないのが分かります。
コンピューターなのに、定量的にその状態を捉えられないのが、システムの難しさです。
3.サービスレベル管理
SLAやSLOで定めた項目を維持するために必要な活動がサービスレベル管理です。
各項目が達成できているかモニタリングし、サービス品質の維持を阻害するインシデントを事前に除去したり、発生時に速やかに対応できるように準備を整える活動です。
評価する指標だけをモニタリングするのではなく、その指標を落とす原因となるものもモニタリングをします。
例えば性能です。
レスポンスを測定するだけでなく、レスポンスを低下させる要因も測定や監視をします。
ユーザー数が増えていないか?大量にリソースを消費する機能がないか?アクセスが急増するようなイベントがないか?
サービスレベル管理のモニタリングの大半は、キャパシティ管理と同じものになります。
【振り返り】
サービスレベル管理の説明は以上で終了となります。次回はキャパシティ管理の説明をしていきたいと思います。
①インシデント管理
②問題管理
③構成管理
④変更管理
⑤リリース管理
⑥サービスデスク
⑦サービスレベル管理
⑧キャパシティ管理
⑨可用性管理
⑩ITサービス財務管理
⑪ITサービス継続性管理