MTBFとMTTRとは

システムの信頼性を表す際に使われる単語に MTBFやMTTRがあります。

MTBFやMTTRの数値から そのシステムが平均してどのぐらいの間隔で故障するか?復旧や修理にかかる時間はどのくらいか?を知ることができます。

またMTBFとMTTRから、そのシステムの稼働率を知ることもできます。

  • MTBF・・平均故障間隔。故障と故障の間の時間。
  • MTTR・・平均修理時間。復旧・修理にかかる時間

MTBF

Mean Time Between Failuresの略。Mean Timeが平均の意味。

故障と故障の間の時間、つまり稼働している時間になります。平均故障間隔といいます。

MTBF

稼働している時間を合計して割り算すると平均故障間隔を出すことができます。

(600+200+400)/3=400

この場合 400時間が、平均故障間隔になります。

MTBFが大きいほど 故障までの時間や稼働している時間が長く 信頼性が高いといいます。

一回故障すると それで使えなくなるという場合は、MTTF 平均故障時間が使われます。

MTTF

Mean Time To Failureの略で、機器の寿命がどれくらいかを示す指標です。ハードディスクやSSDなどのストレージで使われることがあります。

MTTR

Mean Time To Repairの略。

故障から復旧までの時間、修理が終わるまでの時間になります。平均修理時間といいます。

復旧中の時間を合計して割り算すると平均修理時間を出すことができます。

MTTR

(1+3+2)/3=2

2時間が平均修理時間になります。

MTTRが小さいほど 復旧や修理が早く 保守性が高いといいます。


稼働率

稼働率とは、すべての時間の中で稼働している時間の割合を表します。

稼働率は、MTBF/(MTBF+MTTR)で出すことができます。

稼働率

  • MTBF=400
  • MTTR=6
  • 稼働率=400/(400+6)=約0.995

稼働率が高いほど、機器やシステムを使用できる時間の割合が高く 可用性が高いといいます。

このようにシステムは、MTBF、MTTR、稼働率を調べることができ指標とすることができます。

信頼性(Reliability)・可用性(Availability)・保守性(Serviceability)の頭文字をとって RASといいます。

直列システムの稼働率

直列システムでは、AかBいずれかが故障すると全体のシステムは停止します。

複数のシステムが直列で接続されている場合は、それぞれの稼働率を掛け合わせることで計算することができます。

直列システム

例えば、Aの稼働率 0.9、Bの稼働率 0.8なら、

全体のシステム稼働率=0.9×0.8=0.72となります。0.72がこの直列システムの稼働率です。

またA・Bの他にCが接続されている場合は、A×B×Cと計算します。

並列システムの稼働率

並列システムでは、AかB両方とも故障すると全体のシステムは停止します。

一方が故障しても稼働できるので 直列システムより稼働率は高くなります。

並列システム

計算方法は、

全体の稼働率=1-(1-Aの稼働率)×(1-Bの稼働率)です。

例えば、Aの稼働率 0.9、Bの稼働率 0.8なら、

全体の稼働率=1-(1-0.9)×1-(1-0.8)=1-(0.1×0.2)=1-0.02=0.98

0.98がこの並列システムの稼働率となります。

バスタブ曲線

一般的に機器やシステムは、時間の経過とともに以下のように故障率が変動する傾向があります。

これをバスタブ曲線といいます。

バスタブ曲線

  • 初期故障期間・・機器の初期不良や設計ミス・バグなど。
  • 偶発故障期間・・故障率は低く安定します。
  • 摩耗故障期間・・機器の摩耗から故障率は高くなります。