概要
AIOps は IT 運用のための人工知能です。それは IT 運用アプローチであり、手作業による問題解決とシステム解決を補強するためにデータサイエンスを使用する統合ソフトウェアシステムでもあります。AIOps は、ビッグデータと人工知能または機械学習を組み合わせて、広範な IT 運用プロセスとタスクを強化、あるいは部分的に置き換えます。
AIOps の仕組み
AIOps の AI 部分が機能するために取り組むべきものがあります。それはデータ、すなわち運用データです。アップタイム、ダウンタイム、処理のための使用、ネットワーク・トラフィック、アプリケーションログ、エラー、認証試行、ファイアウォール・アラートなどの詳細と履歴データが必要になります。こうしたデータの収集、整理、クリーニングは、通常、アルゴリズムや学習モデルを組み込むよりも困難です。
データが確立されたら、サービスレベル目標と指標を決定します。追跡可能なメトリクスを用いて運用の健全性を定義します。これが AIOps システムのベースラインになります。多くのエンタープライズ・プラットフォームには運用監視コンポーネントが付属 (または接続) しています。Red Hat® OpenShift® には Red Hat OpenShift Observability が含まれ、Red Hat Enterprise Linux® は Red Hat Satellite を使用し、Red Hat Ansible® Automation Platform は Prometheus と Grafana を使用します。
運用の健全性が定義されたら、AI を適用できます。また、プロジェクトへの AI 導入はかつてないほど容易になっています。
- IBM watsonx Code Assistant (Ansible Lightspeed with IBM watsonx Code Assistant を介して Ansible® Automation Platform に含まれる) を使用。IBM の量子コンピューティング・フリートをサービスとして利用して、これらすべてのデータセットを処理することも可能
- アプリケーション・プログラミング・インタフェース (API) を用いて、OpenAI の生成 AI システムである ChatGPT を利用
- Google の Natural Language AI をクラウドサービスとして使用
これだけの機会があることから、私たちの文化において自然言語処理 (NLP)、AI、機械学習 (ML)、ディープラーニング (DL) といった言葉が聞かれるようになったのも不思議ではありません。
Red Hat のリソース
AIOps のメリットと課題
メリット
- 解決のスピード:AIOps は、新たな問題を検出してそれに対応することでダウンタイムを削減し、平均解決時間 (MTTR) を短縮します。
- 自己修復システム:自己修復インフラストラクチャにより、パフォーマンスと稼働時間が大幅に向上します。
- ビッグデータ:AIOps はビッグデータをクリーニングし、分析し、それに対してアクションを実行することでビッグデータを活用できます。
- 効率とスケール:アクションの特定と検出の拡張に AI モデルからの知見を活用することで、スタッフの効率を向上させます。
- イノベーション:繰り返し作業が排除されるため、IT チームはより戦略的で価値の高いプロジェクトを開発し、提供できます。
- 単純化:AIOps は、多くの反復的な IT サービス管理タスクを効率化することができます。
- リアルタイムのデータ相関と意思決定:AIOps に自動化エンジンが含まれる場合、データに基づいて自動的に応答できるため、ノイズを最小限に抑えながら人間の介入やエラーを削減できます。
- データ相関と予測の拡張:AIOps は、人間が手動で実行できるレベルをはるかに超えて、考えられるあらゆる順列を自動的に分析できます。
課題
- 専門知識:広範囲に及ぶデータサイエンスの専門知識が必要なため、開始するだけでも参入障壁が上がります。
- インフラストラクチャ:標準化されたプラットフォームと機能 (Red Hat OpenShift や Ansible Automation Platform によって提供されるものなど) がなければ、特定のインフラストラクチャに合わせた AIOps のトレーニングは困難になる可能性があります。
- 価値実現までの時間:AIOps システムは、設計、実装、導入、管理が難しい場合があるため、投資対効果を確認するまでに時間がかかることがあります。
- データ:先進的な IT 運用によって生成されるデータの量、品質、一貫性は圧倒的で、対処が困難な場合があります。また、AIOps の結果はデータソースの品質によって決まります。
- 全体的な合意:システムの健全性のベースラインと標準的な運用目標を設定するには、多くの関係者からの大規模な賛同が必要ですが、合意を得るのは困難な場合があります。
- 範囲:開始するだけでも、検討事項の数が膨大になることがあります。あるいは、ベースラインを設定できないほど環境が動的である場合もあります。
- 失敗率:AI プロジェクトの失敗率はかなり高く、IDC の AI InfrastructureView によると、調査回答者の 31% が AI をプロダクションに導入していますが、組織全体のメリットを実感しているのはその 3 分の 1 のみです。
AIOps のユースケース
では具体的に見ていきましょう。さまざまなプロフェッショナルが AIOps を使用するのはなぜでしょうか?
- アプリケーション SRE (サイト信頼性エンジニア) は、重点的に AI を活用できる 4 つのゴールデンシグナル (レイテンシー、エラー率、トラフィック、サチュレーション) を定義できます。
- 開発者は、AIOps 分析を用いて独自の根本原因分析 (RCA) を実行できます。また、人間の介入なく AIOps エンジンが RCA を実行できるようにすることもできます。
- ビジネスオーナーは AIOps を使って、SRE が使用するのと同じゴールデンシグナルを監視し、エンドユーザーの観点からアプリケーションのパフォーマンスを理解できます。
- インフラストラクチャ・オペレーターは、AIOps を用いて数十の仮想マシン (VM) から数千のクラスタに至るまで、ハイブリッドクラウド、マルチクラウド、マイクロサービスベースの IT 環境を監視し、Day 2 オペレーションを単純化することができます。
これらの各ユースケースは、AIOps が潜在的な問題の検出と対応に役立つことを示していますが、AIOps システムが経験豊富な IT システム管理者や他の運用チームメンバーに取って代わることができる段階にはまだ達していません。AIOps はほとんどの IT 革命と同様、人が運転席に座っている間、機械に雑務をやってもらうようなものです。
したがって、機械が人間に取って代わっているわけではありません。しかし、データサイエンティストも DevOps エンジニアも、来るべき IT 革命を活用してスキルを広げる必要があります。
- 企業はパフォーマンス重視の経歴を持つ候補者を求めており、アプリケーション・パフォーマンス監視 (APM) の重要性はさらに増すでしょう。
- 基盤となる AI スクリプトを理解し、組み込み、または記述し、イベント相関およびアラートエンジンを実行エンジンに転換するための自動化スキルがより重要になるでしょう。
- すでに AI に精通している場合は、ネットワーク AI (SD-WAN、Wi-Fi など) の実験を (安全に) 開始する理由を見つけましょう。
AIOps と DevOps
DevOps とは、アプリケーション・ライフサイクル全体で、小規模の漸進的な改善を継続的に行うことです。つまり、DevOps の悩みの種はダウンタイムですが、ここが AIOps の出番です。AIOps は、開発プロセスと運用プロセスにデータサイエンスを追加することで、DevOps 文化を強化します。
AIOps は DevOps に代わるものではなく、DevOps が進化したものです。AIOps は、同じデジタル・トランスフォーメーション・ライフ サイクルにおけるもう 1 つのポイントです。AIOps と DevOps は同じ責任を共有します。AIOps は機械化された脳で人間の知能を拡張するだけです。
DevOps と AIOps の間の実際の境界線はかなり曖昧ですが、AIOps は DevOps プロセスの両端にうまく適合します。
- 初期段階では、AIOps が大量のインフラストラクチャ・データを消費し、DevOps エンジニアに基盤となる統合開発環境 (IDE) の問題を警告します (あるいは問題を完全に修正します)。
- 最終段階では、AIOps はプロダクションでの冗長な IT の問題を自動的に解決できると同時に、新規の増分リリースごとに発生する新たなバグの修正方法を学習します。
DevOps と同様、ただ 1 つの AIOps ツール、AIOps プラットフォーム、AIOps 製品はありません。DevOps 機能と AIOps 機能の構築に使用されるツールは、IT スタック (ハードウェアとソフトウェア) と同じくらい数多くあり、それぞれ独自のものです。構築される AIOps ソリューションは、開発環境とプロダクション環境を極めてユニークなものにするあらゆる要素を統合し、分析し、機能させる必要があるからです。
AIOps とオープンソース
AIOps は、アップストリーム・プロジェクトとしても多くのコミュニティ内でも、オープンソースにおいて深い存在感を示しています。単一の製品で完結する AIOps ソリューションは一つもありませんが、独自の AIOps ソリューションの一部として使用できる、オープンソースの開発、運用、AI、自動化のプロジェクトは数多くあります。また、特定の AIOps の問題に対する AIOps ソリューションを提供するオープンソース・プロジェクトも多数開発されています。
さまざまな企業が、ダウンストリームの AI 製品コードをアップストリーム・プロジェクトとしてリリースしています。
- 世界最大のソーシャルメディア・コングロマリットである Meta は、Llama 2 の大規模言語モデルをオープンソース・プロジェクトとしてリリースしました。
- 当社 Red Hat は、Project Wisdom が Ansible Automation Platform の Ansible Lightspeed with IBM watsonx Code Assistant コンポーネントを生み出したのと同じように、Project Thoth オープンソース・プロジェクトがエンタープライズグレードの強化製品につながることを期待しています。
- また、Red Hat は、Artificial Intelligence Center of Excellence (AICoE) の AIOps プロジェクトなど、他の組織が主導する AIOps プロジェクトにも貢献しています。
Red Hat を選ぶ理由
当社の自動化プラットフォームとパートナーの AI 機能を組み合わせることで、企業は AI の可観測性機能と当社の自動化エンジンのイベント駆動型アーキテクチャを兼ね備えた、戦略的な AIOps ソリューションのコーディングに向けて大幅に有利なスタートを切ることができます。
Event-Driven Ansible を使用すると、AI の検出結果に対してアクションを実行できます。当社の自動化プラットフォームをパートナーの因果 AI エンジン (Dynatrace やその他の先進的な可観測性ツールによって提供されるものなど) と組み合わせることができます。そして、Ansible Lightspeed with IBM watsonx Code Assistant を使用すると、あらゆるスキルレベルの開発者と運用チームが、AI が生成した推奨事項に従って構文的に正しいコードを記述できるようになります。
Red Hat 公式ブログ
Red Hat のお客様、パートナー、およびコミュニティのエコシステムに関する最新の情報を入手しましょう。