一度のデータベース更新がどのようにして世界の20%のインターネットを麻痺させるのか

11 月 18 日の故障警告:Cloudflare の障害時、インフラの負担を誰が負うのか?

米国東部時間午前6時20分、世界中の約20%のインターネットトラフィックが突然停止。一通の定期的なデータベース権限調整が連鎖反応を引き起こし、現代のネットワーク運用を支えるコアサービスの大規模な中断を招いた。

これはハッカー攻撃でも外部の脅威でもない。問題の根源は、設定ファイルの容量が倍増したことで、システムのデフォルト上限を超えたことにある。

一行のデータベースクエリから始まった災害

事件のタイムラインは明確かつ残酷だ:

UTC 11:05 — Cloudflare が ClickHouse データベースクラスターの権限を更新、安全性と信頼性を向上させる目的で。

UTC 11:28 — 変更がユーザー環境に反映され、初めてエラーログが記録される。

UTC 11:48 — 公式ステータスページが障害を認める。

UTC 17:06 — サービスが完全に復旧、所要時間は5時間超。

技術的な真実

故障の核心は、一見単純な見落としにある:Cloudflare のロボット防御サービス設定ファイルを生成するデータベースクエリに、「データベース名」のフィルタ条件が欠落していた。

これにより、システムは重複したエントリを返す—一つはデフォルトのデータベースから、もう一つは底層の r0 ストレージデータベースから。結果、設定ファイルの容量は約60の特徴から200以上に倍増した。

Cloudflare はメモリの事前割り当て設定で200の特徴のハードコード上限を設けていたが、エンジニアは「これは現在の使用量をはるかに超えている」と考えていた。だが、予期せぬ事態により、この緩衝域は瞬時に崩壊した。

容量超過のファイルが上限を超え、Rust のコードは直接エラーを投げる:“thread fl2_worker_thread panicked: called Result::unwrap() on an Err value”

ロボット防御システムは Cloudflare ネットワーク制御層の中核だ。これが故障すると、負荷分散器に「どのサーバーが正常に動作しているか」を指示するヘルスチェックシステムも同時に機能しなくなる。

最も皮肉なことに、この設定ファイルは5分ごとに再生成される。更新後のクラスターのノードでクエリを実行すると、誤ったデータが生成され続ける。結果、Cloudflare のネットワークは「正常」と「故障」の間を繰り返し切り替え、正しいファイルを読み込むこともあれば誤ったファイルを読み込むこともあった。

この「断続的な中断」は、エンジニアたちに大規模な分散型サービス拒否攻撃(DDoS)を受けていると誤認させた。なぜなら、内部のエラーは通常、このような周期的な復旧-崩壊サイクルを引き起こさないからだ。

最終的に、すべての ClickHouse ノードの更新が完了すると、生成されるファイルはすべて誤ったものとなった。正確なシステム信号がなく、防御システムはデフォルトで「保守モード」に入り、大部分のサーバーを「不健康」と判定した。インターネットトラフィックは Cloudflare のエッジノードに絶えず流入するが、正しくルーティングされない。

世界のネットワークの静寂な時刻

Web2 プラットフォーム全体がダウン

  • X プラットフォームにて9,706件の故障報告
  • ChatGPTが会話途中で応答停止
  • Spotifyのストリーミング中断
  • Uberや配達プラットフォームの機能異常
  • ゲーマーは強制的に切断される
  • さらにはマクドナルドのセルフオーダー端末もエラー画面を表示

暗号領域も例外ではない

主要取引所のウェブインターフェースが崩壊し、ユーザーはログインページや取引画面の読み込みに失敗。

ブロックチェーンブラウザ(例:Etherscan、Arbiscan)もダウン。

データ分析プラットフォーム(DeFiLlama)では断続的なサーバーエラーが発生。

ハードウェアウォレットの提供者も公告を出し、サービスの可用性が低下。

唯一の「例外」:ブロックチェーンのプロトコル自体

報道によると、主要取引所のフロントエンドに故障はなく、オンチェーンの取引は正常に行われている。ブロックチェーン自体は完全に正常に稼働しており、コンセンサスの中断も見られない。

これは鋭い矛盾を露呈している:もしブロックチェーンがブロックを生成し続けているのに、誰もアクセスできないなら、暗号通貨は本当に「オンライン」なのか?

Cloudflare の世界的インターネットトラフィックにおける役割

Cloudflare はウェブサイトをホスティングせず、クラウドサーバーも提供しない。彼らの役割は「仲介者」—利用者とネットワークの間に立つ存在だ。

主要データ:

  • 2,400万のウェブサイトにサービス提供
  • 120か国、330都市に展開するエッジノード
  • 世界の約20%のインターネットトラフィックを処理
  • DDoS防御分野で82%の市場シェア
  • エッジノードの総帯域幅は449テラビット/秒(Tbps)

この「仲介者」が故障すると、その背後に依存するすべてのサービスも同時に「触れられなくなる」。

Cloudflare CEOのMatthew Princeは公式声明で次のように述べている:「これは2019年以来最も深刻な故障です……過去6年以上にわたり、私たちのネットワークを通じて大部分のコアインターネットトラフィックが遮断される事態はなかった。」

18か月で4回の重大故障:なぜ業界は未だ変わらないのか?

2024年7月 — CrowdStrikeのセキュリティアップデートの脆弱性により、世界中のITシステムが麻痺(フライト停止、病院遅延、金融サービス凍結)

2025年10月20日 — AWSの故障が15時間続き、米東部リージョンのDynamoDBサービスが中断、多くのブロックチェーンネットワークもダウン

2025年10月29日 — Microsoft Azureの設定同期問題により、Microsoft 365やXbox Liveがダウン

2025年11月18日 — Cloudflareの故障により、世界の約20%のインターネットトラフィックが影響を受ける

単一請負業者モデルのリスク

AWSは世界のクラウドインフラの約30%を支配し、Microsoft Azureは20%、Google Cloudは13%を占める。これら3社だけで、現代のネットワークを支えるインフラの60%以上をコントロールしている。

暗号業界は本来、「非中央集権」の解決策を目指していたが、今やこれらの最も中央集権的なインフラ供給者に依存せざるを得なくなっている。

故障が起きたとき、業界の唯一の「災害復旧戦略」は待つことだけだ。Cloudflareの修復を待ち、AWSの復旧を待ち、Azureのパッチ適用を待つ。

「非中央集権」の虚偽:プロトコル層の非中央集権はアクセス層の非中央集権を意味しない

暗号業界が描いてきたビジョンは:

非中央集権金融、検閲耐性通貨、信頼不要のシステム、シングルポイント故障なし、コードは法律

しかし、11月18日の現実は:午前中の一度の故障で、多くの暗号サービスが数時間停止した。

技術的には: どのブロックチェーンプロトコルも故障を通報していない。

実際には: 取引インターフェースが崩壊し、ブラウザはダウン、データプラットフォームは停止、500エラーが画面いっぱいに表示される。

ユーザーは「所有」すべき「非中央集権」ブロックチェーンにアクセスできなくなる。プロトコル自体は正常に動作している—ただし、それに「接触」できるかどうか次第だ。

なぜ業界は「便利さ」を選び、「原則」を選ばないのか?

自前で非中央集権インフラを構築するには:高価なハードウェアの購入、安定した電力供給の確保、専用帯域の維持、安全専門家の雇用、地理的冗長化、災害対策システムの構築、24時間監視が必要だ。

一方、Cloudflareを使えば:ボタン一つをクリックし、クレジットカード情報を入力し、数分で展開完了。

スタートアップは「迅速な市場投入」を追求し、投資機関は「資本効率」を求める—すべての人が「便利さ」を選び、「耐故障性」を犠牲にしている。

「便利さ」が「便利さ」でなくなるその瞬間まで。

なぜ「非中央集権」の代替案は「好評だが売れない」のか?

分散型ストレージ(例:Arweave)、分散型ファイル伝送(IPFS)、分散型計算(Akash)、分散型ホスティング(Filecoin)などの方案は確かに存在する。

しかし、それらが直面する問題は:

  • パフォーマンスが中央集権型に劣り、遅延はユーザーに直接感じられる
  • 普及率が極めて低く、使用手順が煩雑
  • コストも三大クラウドサービスからのレンタルより高い場合が多い

真の非中央集権インフラの構築は非常に難しく、想像以上だ。

多くのプロジェクトは「非中央集権」を口にするだけで、実際に実現できていない。中央集権的な方案を選ぶのが常により簡単で安価—故障が起きるまでは。

規制の新たな課題

30日以内に3回の重大故障があり、規制当局の関心も高まっている:

  • これらの企業は「システム重要インフラ」に該当するのか?
  • ネットワークのコアサービスは「公益事業的規制」に含めるべきか?
  • 「巨大すぎて倒せない」インフラとテクノロジーの結合はどんなリスクをもたらすのか?
  • Cloudflareが世界のインターネットトラフィックの20%を支配していることは、独占の問題を引き起こすのか?

米国財務省は、身分証明書をスマートコントラクトに埋め込み、DeFiの各インタラクションにKYCを義務付けることを推進している。次のインフラ故障が起きたとき、ユーザーが失うのは取引の権利だけでなく、「自分の身元を証明する能力」も失われる。

もともと3時間の故障が、次は「人間と機械の認証ができない3時間」へと変わる—それは認証サービスが崩壊したインフラ上で動作しているからだ。

「便利さ」から「必然」へ:いつが転換点か?

11月18日、暗号産業は「失敗」していない—ブロックチェーン自体は完璧に動作している。

本当に「失敗」したのは、業界の自己欺瞞だ:

  • 「崩壊可能なインフラ上に、阻止できないアプリを構築できる」と思い込む
  • 「3社がアクセスチャネルを支配しているときに、検閲耐性は意味を持つ」と考える
  • 「Cloudflareの設定ファイル一つで何百万人の取引が決まる」と思い込むとき、「非中央集権」は実質的な意味を持たなくなる

インフラの耐故障性は「付加価値」ではなく、「すべてを支える基礎的要件」だ—これがなければ、他のすべての機能も語れない。

次の故障はすでに準備されている—AWSからかもしれないし、Azureからかもしれないし、Google Cloudからかもしれないし、Cloudflareの二次故障かもしれない。来月かもしれないし、来週かもしれない。

中央集権的方案を選ぶのは、依然としてより安価で迅速、便利な選択肢だ—それがもう「そうではなくなる」まで。

次のCloudflareの設定変更が次の重要サービスの隠れた脆弱性を引き起こしたとき、私たちはまた見慣れた光景を目にするだろう:満載の500エラー、取引の全面停止、ブロックチェーンは正常に動いているのに誰もアクセスできない、企業は「次はもっと良くなる」と約束するが、実現しない。

これが現業界のジレンマだ:すべては変わらない、「便利さ」が「リスク回避」を凌駕し続ける—その「便利さ」の代償があまりにも大きくなる日まで。

AR9.53%
FIL5.65%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン