「Webエンジニアのための監視システム実装ガイド」読了

監視システム実務ベース概論の書籍です。
最終Chapterに構成例があり、どのようなOSSがあるか参考になると思います。

Webエンジニアのための
監視システム実装ガイド
    info
        マイナビ
        馬場俊彰
    Chapter 1 監視テクノロジの動向
        残念な事実
            「システムは何もしないと壊れる」
            「システムはよくわからない状態になる」
        本書想定
            Webサービス
            Webシステム
        志向
            チェック志向
                異常検知
            メトリクス志向
                状態把握
    memo
        用語
            SPA
                Single Page Application
            PWA
                Progressive Web Apps
            結果整合性
                Eventual Consistency
            SOA
                Service Oriented Architecture
            Microservice
            DR
                Disaster Recovery
                災害復旧
            RUI
                Real User Monitoring
            APM
                Application Performance Monitoring
            O11y
                Observability
                可観測性
            SRE
                Site Reliability Engineering
                SREs
                    Site Reliability Engineer
            MTBF
                Mean Time Between Failure
                平均故障間隔
            MTTR
                Mean Time To Repair
                平均復旧時間
            SPOF
                Single Point Of Failure
                単一障害点
            SNMP
                Simple Network Management Protocol
            時系列
                Time Series
                時系列データベース
                    Time Series DataBase
            生データ
                Raw Data
            閾値
                Threshold
            原因推定
                Root Cause Detection
            Chaos Engineering
                カオスエンジニアリング
            死活監視
                liveness probe
            応答監視
                readiness probe
            IOPS
                Input Output per Second
            RRD
                Round Robin Database
            LTSV
                Labled Tab Separated Values
            SLI
                Service Level Indicator
            KPI
                Key Perfomance Indicator
            flapping detection
                ばたつき検知
            parents
                親子関係
            BTS
                Bug Tracking System
            ITS
                Issue Tracking System
            異常検知
                Anomaly Detection
            RUM
                Real User Monitoring
    Chapter 2 監視テクノロジの概要
        可用性
            Availability
            計測
                Uptime
                    稼働時間
            一ヶ月
                利用不可能
                    99.98%
                        10分程度
                    99.95%
                        約22分
                    99.99%
                        フォーナイン
                        約259秒
                    99.999999999%
                        イレブンナイン
                        約0.03ミリ秒
        ジャンル
            チェック
            メトリクス
            ログ
            トレース
            APM
            運用
                通知
                コミュニケーション
                ドキュメント
                チケット
        構成要素
            観測部分
            データ収集部分
            データ利用部分
        The Twelve-Factory App
            https://12factor.net/ja/
    Chapter 3 監視テクノロジの基礎
        時系列データベース
            RRDTool
            Graphite
            OpenTSDB
            InfluxDB
            TimescaleDB
    Chapter 4 監視テクノロジの導入
    Chapter 5 監視テクノロジの実装
        定番の観測項目
            エンドポイント
            物理インフラ層
            ネットワーク
            OS
            ミドルウェア
            アプリケーション
            フロントエンド
    Chapter 6 インシデント対応 実践編
        Avoid Blame and Keep It Constructive
            「非難せず、建設的であること」
    Chapter 7 監視構成例
        伝統的なOSS
            Nagios
            Graphite
            Grafana
            Graylog
            OpenTelemetry
            OpenCensus
            Jaeger
        最近のOSS
            Prometheus
        Saas利用
            Mackerel
            Loggly
            New Relic
            Datadog

memo

Posted by shi-n