Gradion
ソリューション
主要業界
Gradionについて
お問い合わせ
ソリューション
主要業界
Gradionについて
  • English
  • Deutsch
  • Tiếng Việt
  • ไทย
  • العربية
  • 日本語
お問い合わせ

場当たり的な事後対応ではなく、24時間体制で信頼性を追求するエンジニアリング。

概要

本番システムの運用は、構築とは全く異なる性質を持ちます。システムが本番稼働に入れば、祝日の深夜2時であっても、顧客が気づく前にアラートをトリアージし、再発防止のために根本原因を特定・修正する責任者が不可欠です。多くの開発チームは、新機能のリリースに特化しており、このような運用体制には対応していません。

グラディオンのマネージド運用サービスは、このギャップを埋めます。ドイツとベトナムを拠点とするフォロー・ザ・サンモデルにより、お客様の生産システムの運用負荷を軽減し、社内で専任のオンコール体制を構築することなく、継続的なカバレッジを提供します。当社のエンジニアは、お客様がエスカレーションする独立したサポート部門ではなく、お客様のチームの一員として機能します。

このモデルはSRE(Site Reliability Engineering)に基づいています。SLO(Service Level Objective)を最優先する考え方、構造化されたインシデント管理、そしてインシデント発生間の予防的な信頼性向上作業が特徴です。私たちは、重要な指標を測定し、対応すべきアラートに絞り込み、平穏な時間を利用して、緊急事態の発生頻度を低減するための投資を行います。

提供サービス

フォロー・ザ・サン体制による継続的なカバレッジ

ドイツとベトナムのエンジニアリングハブが連携し、欧州およびアジア太平洋地域のビジネス時間を網羅する重複カバレッジを提供します。オンコール体制は、一般的なヘルプデスクが手順書を読むのではなく、お客様のシステムを熟知したエンジニアによって運用されます。引き継ぎは構造化され、文書化、追跡されるため、タイムゾーンをまたいでも情報が失われることはありません。

SLO設計と管理

監視を開始する前に、お客様のサービスにとっての信頼性とは何かを明確に定義します。お客様のチームと協力し、実際のユーザー体験に紐づくサービスレベル目標(SLO)を確立し、それに基づいたエラーバジェットフレームワークを構築し、システムを適切に計測します。アラートは、ノイズとなる生データではなく、SLOの消費率に合わせて調整されます。

インシデント対応とポストモーテム

システム障害発生時には、トリアージ、封じ込め、緩和、復旧という構造化された対応プロセスに従います。インシデント後には、非難を伴わないポストモーテムを実施し、具体的な改善項目を記した記録を作成します。これらの項目は完了まで追跡します。目標は、場当たり的な対応能力の向上ではなく、時間とともに障害発生が減少するシステムを構築することです。

プロアクティブな信頼性エンジニアリング

運用時間は、単に事後対応に費やされるだけではありません。インシデント発生の合間には、キャパシティプランニング、依存関係の強化、ランブックの自動化、非クリティカルパスでのカオステストなど、信頼性向上のための作業を行います。この作業には、各スプリントで契約時間の一部を明確に割り当てています。

オブザーバビリティと監視環境の構築

運用を可能にする監視スタック(メトリクス、ログ、分散トレーシング、ダッシュボード、アラートルート)を構築・維持します。ツールは、お客様の環境に基づいて選定されます。通常はPrometheus、Grafana、OpenTelemetry、PagerDutyなどのエコシステムから選ばれますが、お客様が既に導入されているツールにも柔軟に対応します。

オンコールランブックの開発

当社は、運用するすべてのシステムを文書化します。ランブックには、標準的な障害モード、エスカレーションパス、ロールバック手順、連絡ツリーが含まれます。これにより、新しいエンジニアでも数日で生産性を発揮できるようになります。ランブックは常に最新の状態に保たれ、インシデント発生後には必ず更新されます。

本番環境での実績

DataFlow Group (グローバルな資格情報認証プラットフォーム) は、国際的な管轄区域で高い可用性を要求されるバックグラウンドチェックおよび文書検証システムを運用しています。手動運用がデプロイの遅延や人為的ミスを引き起こしていました。グラディオンはインフラストラクチャを刷新し、オートスケーリングと自動デプロイメントを導入、Infrastructure as Codeにより手動によるエラーを排除しました。その結果、デプロイメントは5倍高速化し、手動作業は30%削減され、プラットフォームは99%の自動運用を達成しました。

企業価値19億ドル、年間GMV750億ドル以上、年間5億件の注文を誇るcommercetools社は、グローバルなクラウドインフラを3チーム体制の「フォロー・ザ・サン」モデルで運用しています。Gradionは、このモデルのベトナム拠点として、米国およびドイツチームが担当するインフラと同一の範囲を、日中の時間帯にわたり完全に運用管理しています。これは単なる監視キューやエスカレーションパスではなく、世界をリードするコンポーザブルコマースプラットフォームが、単一チームに24時間体制を強いることなく、24時間365日の運用体制を維持するための重要な柱の一つです。

技術スタック

監視と可観測性:Prometheus、Grafana、OpenTelemetry、Jaeger

アラートとオンコール:PagerDuty、OpsGenie、VictorOps

ログ管理:Loki、ELKスタック、CloudWatch

インシデント管理:構造化された事後分析プロセス、ConfluenceまたはNotionによるドキュメント化

インフラ:クラウドネイティブ(AWS、GCP、Azure)およびKubernetesネイティブ環境

次のステップ

お客様のシステムについてお聞かせください。運用リスクを評価し、最適なカバレッジモデルをご提案いたします。

年間GMV750億ドル、フォロー・ザ・サン運用

commercetools社は年間GMV750億ドル以上、年間5億件の注文を処理しています。Gradionは、同社のフォロー・ザ・サン型クラウド運用において、APAC地域の日中時間帯におけるグローバル本番プラットフォームの完全な運用管理を担っています。

社内で運用チームを構築することなく、24時間365日のインフラカバレッジが必要ですか?

SLAに裏打ちされた応答時間で、お客様のインフラを24時間体制で運用します。稼働時間の要件をお聞かせください。

ご相談を予約する導入事例を見る

一緒に取り組みましょう

プロジェクトについてお聞かせください。最適なチームを編成いたします。

相談を予約する
Gradion
プライバシーポリシー特定商取引法に基づく表記利用規約Cookieポリシー© 2026 Gradion. 全ての権利を保有しています。

当サイトではCookieを使用して体験を向上させています。許可するカテゴリを選択できます。 プライバシーポリシー