
要約
ネットワーク障害は、その症状が発生場所や原因と直接的な関連を持たないため、データセンターオペレータにとって引き続き深刻な課題である。本稿では、問題のあるリンクを特定し、各TCP接続における問題の原因を特定可能な、軽量かつ常時稼働型の診断アプリケーション「007」を提案する。007はエンドホスト内に完全に封じ込められており、1つのTier-1データセンターにおいて2か月間の展開が行われた結果、従来導入済みのモニタリングツールが検出していたすべての問題を検出するとともに、これまで検出されていなかった他の問題の原因も特定した。