【製品情報】EDB Postgres AI Hybrid Manager 1.3.1

音声ガイド

概要

1. HMとは何か?
EDB Postgres AI Hybrid Manager(HM)は、EDB Postgres AI Platformのための中央コントロールプレーンです。簡単に言えば、これはすべてのPostgreSQLデータベース、AIワークロード、および分析パイプラインを、単一の統一されたインターフェースからデプロイ、管理、監視、スケールさせることを可能にする包括的な管理ソリューションです。

これは、オンプレミスの自社データセンター、パブリッククラウド(AWS EKS、Google GKEなど)、またはその両方を組み合わせたハイブリッド環境など、あらゆるKubernetes環境で実行できるように設計されています。

2. HMのメリット
Hybrid Managerを使用する主なメリットは、一元化、コントロール、そして高度な機能に集約されます。

  • 一元管理: データ資産全体を管理するための「単一の管理画面(a single pane of glass)」を提供します。データベース、AIモデル、分析のために別々のツールを使用する代わりに、HMはそれらすべてを1つのプラットフォームに集約し、運用を簡素化し、複雑さを軽減します。
  • データ主権とコントロール: すべてのデータ、モデル、処理は、ユーザー自身のインフラストラクチャー内に留まります。オンプレミスで実行しているか、自社のクラウドアカウントで実行しているかに関わらず、データが外部に出ることがないため、規制の厳しい業界やデータプライバシーにとって非常に重要です。
  • 柔軟性とポータビリティ: Kubernetes上で実行されるため、HMはプラットフォームに依存しません。Kubernetesが動作する場所であればどこにでもデプロイでき、ベンダーロックインを回避し、ニーズに最適なインフラストラクチャーを選択できます。
  • 優れた運用性: 高可用性の設定、災害復旧、バックアップ、スケーリング、ライフサイクル管理といった複雑なデータベースタスクを自動化・簡素化し、チームの運用負荷を軽減します。
  • 統合されたAIと分析機能: HMは単なるデータベース管理ツールではありません。GenAIアプリケーションを構築・提供するためのAI Factoryと、Apache IcebergやDelta Lakeといった最新のデータレイクハウス形式を活用する分析エンジンをネイティブに統合しています。

3. HMはどのようにして上記のメリットを実現するのか?
HMは、いくつかの主要なテクノロジーとアーキテクチャレイヤーを統合することで、これらのメリットを実現しています。

  • 一元管理とポータビリティのため: 基盤レイヤーとしてKubernetesを使用します。これにより、すべてのコンポーネントをコンテナ化されたサービスとしてオーケストレーションし、スケーラビリティ、耐障害性、そして場所を選ばない実行能力を提供します。
  • Postgres管理のため: Kubernetes上での堅牢なPostgresデプロイのためにCloudNativePGを活用し、高度なマルチリージョン高可用性と災害復旧を提供するためにEDB Postgres Distributed (PGD) を利用します。
  • データ主権を保つAIのため: AI Factoryは、スケーラブルなモデル提供のためにKServeを使用し、NVIDIA NIMマイクロサービスと統合して、Llama 3のような強力なAIモデルをユーザー自身のGPUハードウェア上で直接実行します。これにより、すべてのAI推論がローカルで行われます。
  • 分析機能のため: Apache Iceberg®およびDelta Lake形式を使用して、トランザクションデータベースから「コールド」データをコスト効率の良いオブジェクトストレージにオフロードします。そのレイクハウス・クラスターは、このデータと「ホット」なトランザクションデータを単一の統一された方法でクエリできます。

4. HMのメカニズム
Hybrid Managerのメカニズムは、Kubernetesクラスター上で実行される3つの主要な論理グループからなるアーキテクチャを通じて理解できます。

  • Kubernetesコントロールプレーン: これはあらゆるKubernetesクラスターの標準的な中核であり、基本的なオーケストレーションを担当します。HMはこの上に構築されています。
  • コントロール・コンピュート・グルーピング: これがHybrid Manager自体の「頭脳」です。これは70以上のPodからなる論理グループで、主要な管理コンポーネントを実行します。これには以下が含まれます。
    • 可観測性スタック: プラットフォーム全体のメトリクス収集、監視、ロギングのためのPrometheus、Grafana、Loki。
    • ネットワーキングとセキュリティ: サービス間のネットワークトラフィックを安全に管理するためのIstio。
    • 管理サービス: HMコンソール(UI)、APIを提供し、データベースやAIワークロードのライフサイクルを管理するコンポーネント。
  • データ・コンピュート・グルーピング: ここで実際のワークロードが実行されます。PostgresデータベースやAIモデルをデプロイすると、HMはこのグルーピング内に必要なPodとリソースをプロビジョニングします。このレイヤーはコントロールプレーンとは論理的に分離されており、ユーザーのワークロードが管理プラットフォームに干渉しないようになっています。

これら3つのレイヤーが連携して、シームレスな体験を提供します。ユーザーがHMコンソールで「クラスターを作成」をクリックすると、コントロール・グルーピングがKubernetesコントロールプレーンに指示を出し、適切なストレージ、ネットワーキング、高可用性の設定で、データ・グルーピング内に必要なデータベースPodをスケジュール・実行します。

5. リリース1.3.1の新機能
リリース1.3.1は、プラットフォームの安定性と信頼性を向上させるバグ修正とセキュリティアップデートに焦点を当てたメンテナンスリリースです。主要な新機能の追加はありませんが、既存の機能が洗練されています。

以下に、主な改善点の詳細をまとめます。

HMコンソールの改善(精度の向上と使いやすさ)
この一連の修正により、管理者向けのユーザーインターフェースがより正確で信頼性の高いものになりました。

  • 正確なクラスター数: ホームページでPostgresクラスターの総数が正しく表示されるようになり、個別のノード(レプリカなど)はカウントから除外されるようになりました。これにより、過大な数値が表示されるのを防ぎ、資産の正確な状況を把握できます。
  • 正しい接続情報: PGDクラスターへの接続時に、コンソールが誤ったデータベース名(’bdrdb’ではなく’edb_admin’)を表示するバグが修正されました。これにより、ユーザーの接続エラーを防ぎます。
  • ストレージメトリクスの改善: 監視タブで、セルフマネージドクラスターのデータベースサイズが正しく表示されるようになり、正確な可観測性が確保されました。

高度な高可用性および分散高可用性(PGD)の修正(安定性の向上)
これらの修正は、EDBの最も高度な高可用性ソリューションにおける問題に対処し、より堅牢なものにします。

  • 意図しないリセットの防止: データベースパラメータ(GUC)の空の設定を送信しても、すべての設定がデフォルトにリセットされることがなくなりました。既存の設定が正しく保持されるようになります。
  • クラスター作成の信頼性向上: PGD-Xクラスター(高度なPGDトポロジ)の作成が無期限に停止する可能性があったバグが解決されました。
  • 正しいPGD設定: PGDに必須のshared_preload_libraries設定に、重要なコンポーネントであるpgaaが正しく含まれるようになりました。設定が誤っている場合、コンソールが明確な表示を提供します。

バックアップ、リカバリ、ストレージの強化(データ保護の強化)
これらのアップデートにより、HMのデータ保護ワークフローの信頼性が向上しました。

  • ストレージクリーンアップの改善: 保持期間が過ぎた後もクラスターのメタデータが完全に削除されず、オブジェクトストレージ(S3)に孤立したファイルが残る問題が修正されました。これにより、ストレージ効率が向上します。
  • 信頼性の高いクロスロケーションリストア: クラスターを別の地理的な場所に復元する機能が、pg_basebackupメソッドを正しく使用するようになり、災害復旧能力が強化されました。

コアプラットフォーム機能とAPIの安定性(信頼性の向上)
これらは、特に大規模環境やマルチデータセンター環境において、HMプラットフォーム全体をより安定させるための基本的な修正です。

  • マルチDC通信の修正: セカンダリロケーションの「ビーコンディスパッチャ」がプライマリビーコンサーバーに接続できないという重大なバグが解決されました。これは、マルチデータセンター構成が機能するために不可欠です。
  • 大規模環境での安定性向上: 「ビーコンエージェント」コンポーネントのデフォルトのメモリ割り当てが増加され、制限が設定可能になりました。これにより、多くのデータベースを持つ複雑な環境でのクラッシュや安定性の問題を防ぎます。
  • 接続タイムアウトの防止: プロセスグループが1時間後に再接続を試みるのをやめてしまうバグが修正され、継続的な接続試行が保証されることで、プラットフォーム全体の安定性が向上しました。

日本語マニュアルを見る
※ 日本語マニュアルの閲覧には ユーザー登録(パスワード)が必要です。