障害復旧に感謝 | CloudFlare障害の図解と解説
関連するつぶやきはいろんな作品で上がっていますが、このネタとしては「とんとんとん」さんが、高校生向けイメージで分かりやすい作品を作ってくださっています。(このプロンプトを理解して画像を作ってくれるナノバナナさんも凄い!)
『ウェブサイトの道案内、一時停止!~みんなのスマホは無事だよ~』 https://www.chichi-pui.com/posts/6526e3f8-9c4b-4e56-9eef-2762a99cfc68/
この流れに続け!ε=ε=٩(๑・∀・)۶
ということでよりディープに、情報共有ということで技術的な話をしましょう。
1枚目はPEGASUS版のうちのエリアーヌで、2枚目は今回の障害の図解です。
nano-banana版のダンテさん(龍神様かもしれないw)を付けたからこれはAIを使ったイラストだと言い張れるぜ!(゚∀゚)=3
--------------------------------------------------------------------------------
■障害の原因はどこか
ちちぷいさんのX公式アカウントでは「使用している外部サービスの障害により」と発表されています。
この使用している外部サービスが「CoudFlare」で、ここで起こった障害が発端です。
----------
■CloudFlare(クラウドフレア)ってなんぞ?
アメリカンのカルフォニア州に本拠がある会社で、「CDN」というものを展開している会社です。
https://ja.wikipedia.org/wiki/Cloudflare
----------
■CDN(コンテンツ・デリバリー・ネットワーク、コンテンツ配信ネットワーク)ってなんぞ?
IT・ネットワーク用語ですがぐぐるといろんな説明が見つかります。目標のWebサイトやWebサービスにアクセスする手前で、コンテンツの内容を代わりに表示することで、本来の目標のWebサイトやWebサービスへのアクセス頻度を減らして負荷を減らしてくれるという仕組みです。ブラウザの持っている「キャッシュ」機能と同じようなものです。
ちちぷいさんですと...
・皆さんが11/18に投稿した作品の画像やテキスト→これは新鮮なコンテンツなのでCDNには載らず、まずはちちぷいさんから取得してブラウザに表示されます
・皆さんが投稿した作品で長い期間表示され、多数の人が見る画像→トップページの「おすすめ」に載った作品のサムネ画像とか。これはもしかしたらCDNに載るかもしれません。(これは推測です)
・ちちぷいトップページのバナー画像や、「プリンセス企画実施中!」「PEGASUSモデル公開中!」「ユーザー企画募集中!」のバナー画像など→これは全ユーザーがたびたび見る画像です。こういうのがCDNにキャッシュとして載ります
・HTMLの勉強をするとよく出てくる、Webページの見栄えをよくするCSS(カスケーディング・スタイルシート)→物理的には拡張子.cssのファイルとして存在します。ちちぷいさんでも使っています。このCSSファイルも内容はあまり変わらないので、よくCDNにキャッシュとして載ります。
といった具合で、本来はちちぷいさんのサービス内にある様々なファイルが一時的に乗ります。
これらのファイルは物理的な実物は、CloudFlareならCloudflare配下にある世界各国の様々な場所のデータセンター内に一時的に保持されます。なので我々のネットワークアクセスが、ちちぷいさんから何度もリソースを取ってこなくてよくなるので、より短い時間で済んで快適になります、ということです。
よく解説記事に出てくるワードとしては
WAF:Webアプリケーションファイアウォール、要はそのWebアプリ(=ちちぷいさん)を狙った悪意あるネットワーク上からのアクセスを遮断して守ってくれる仕組み
他にも「DDoS攻撃対策」とか技術キーワードがいろいろ出てきますが、要はキャッシュの仕組みで快適にちちぷいできる以外にも、セキュリティ的にいろいろ守ってくれる機能を持っているありがたいものです。
我々がLet'sちちぷい! と画面を見ようとすると、ネットワークアクセスの起点はパソコン上のブラウザやスマホ上のブラウザです。そこからネットワーク上のリクエストが飛んで、ゴールの「ちちぷい」まで到達して、レスポンスとして画面が返ってきます。
この一連のネットワークアクセスを「車」や「旅人」に例えると...
・あまり混んでなくてよく整備されていて目的地まで到達できる高速道路
・大きくて沈むことがなくて安全に目的地まで運んでくれる安心な大型フェリー
・クラウドフレア騎士団が守っていて、モンスターが出ないことで有名な大きな街道。ここを使うとちちぷい王国まで安全に行ける
・ちちぷい王国のちちぷい王女様が国民に対し通達を出したそうな。知りたいけど王国までかなり遠い→街道の途中でも通達のコピーを配ってるから、ここでコピーをもらって引き返せるよ!
というようなことをしてくれるものです。
こういう見えないけどありがたい存在が、ちちぷいさんのページにたどり着く手前に実はいるんですよ、ということになります。
----------
■CDNは誰向けなのか
CDNにはいろんなWebサイトやWebサービスが個別に契約をして使うので、世界中でいろんなサービスがCloudFlareと契約しています。
ですので今回の障害で不具合が発生したサイトやWebサービスはどこも、Cloudflareを使っているという共通点があるのが分かります。
Xが落ちたのもCloudFlareを使っていたからです。ChatGPTのブラウザからアクセスする部分もCloudFlareを使っていたので落ちましたね。ほかにもGoogle関係のサービスとかいろいろ落ちましたね。
----------
■こういう会社はほかにもあるのか
ぐぐると出てきますが、世界で20数社ぐらいしかありません。とても大きな規模のネットワークインフラの設備が必要なので、そんなにたくさんはないんですね。CloudFlareは米国本拠のCDNの中でTOP1、世界でもほぼ最大手です。
稼働率99.99%だったかで障害は年1-2回ですから、かなり優秀で信頼されているサービスです。
1つのWebサイトやWebサービスはCDNの仕組みを幾つもいくつも使うのかというと、だいたいひとつしか使いません。
なのでCloudFlareが落ちると世の中のいろんなサイトやサービスがみんなまとめて落ちてしまいますよ、ということになります。
----------
■こういうCDNの障害はよく起こるのか
世界的な障害は滅多に起こりません。いったん起こると世界中で話題になって非難されたりしますが、そう頻発するものではないです。
なので一般ピープルとしては「はあ、そんな大きくて信頼されてるインターネットの仕組みでも、たまには故障することもあるんだねえ(お茶ズズズ)」ぐらいの気持ちであわてず騒がず復旧を待つのが吉です。
----------
■なぜみんなCloudFlareを知らないのか
これは職業としてのITエンジニアでも、知らない人もけっこういると思います。
例えば、電気、ガス、水道といった生活の基本的インフラはみんな普段気にならないけど、何か問題が起こった時に気になりだすものですね。
インターネットにおけるインフラも似たような側面があります。ふだんは空気のように存在している縁の下の力持ちで、正常運行中はみんな実は使っているのだが認識しておらず気にならない...でもこういう障害が起こった時に改めて認識しがちなものだから、というところがあります。
----------
■障害発生時、初見で読み取れる情報
ちちぷいさんにアクセスしようとした際、以下のような画面が見えたかもしれません。
図形が3つ横に並んで互いに繋がってテキスト表示されたものです。
以下のニュース記事の途中にスクショがあります。
https://www.itmedia.co.jp/news/articles/2511/18/news128.html
Internal Server Error
Error Code 500
・一番左:ブラウザアイコン、正常を表す緑のチェックアイコン、You Browser 緑でWorking
・真ん中:クラウドを表す雲のアイコン、異常を表す赤の×、CloudFlare 赤でError
・一番右:コンピュータ本体を表すリソースのアイコン、正常を表す緑のチェックアイコン、www.chichi-pui.com Host Working
これは翻訳すると「あなたのブラウザは正常に動いています。ブラウザのURL欄ではwww.chichi-pui.comと表示されているちちぷいというWebサービスも正常に動いています。ネットワークでその間をつないでいるクラウドフレアで問題が起こっています」ということを言っています。
知識があればこの画面でもう推測できた方もいるかと思います。
この画面自体はちちぷいさんではなく、間にあるCloudFlareの仕組みの中で表示されているはずです。(ネットワークアクセスがちちぷいさんまで届いていないからでです)
----------
■CloudFlareの障害の原因
2025/11/18(火)の夜にCloudFlare社のCTO(最高技術責任者、つまり偉い人)がXのポストで
「ボット対策機能を支えるサービス内の潜在的なバグにより、私たちが行ったルーチンの設定変更後にサービスがクラッシュしたことだった」
と公式に述べています。(ITMedia NEWSより)
一般人にはなんのこっちゃという話で正直僕もよく分からないです(笑)。まあ中身はかなり複雑で広大な仕組みを持っているでしょうから、内部の人にしかわからない何か難しいことが起こったのでしょう。
今回の障害で良かったことは、サイバー攻撃ではなかったことですね。そして2025/11/19(水)日本時間午前2時ごろに、復旧完了がアナウンスされています。
だいたいこういう障害は数時間ぐらいで復旧することが多いです。まる1日24時間だとけっこう長いですね。金融系やコンビニ系のシステムでやらかしてこういう長時間の障害が起こるとニュースに載ったりします。
--------------------------------------------------------------------------------
■こういう障害の見分け方
・パソコンのブラウザ
・スマホのブラウザやスマホアプリ
・うさゾンじゃなかったアマゾン・プライムやネットフリックスなどの配信系サービスとか
などなど、「ネットワークアクセス」する電子機器でいろいろ試すと情報が得られます。
●すべての機器でまったく繋がらない
インターネットが壊れました。コワイ!( ノД`) ...ということはまずなくて、こういうのは家の回線が繋がっていないとかWiFiルーターの調子が悪いとか、そういう原因が多いですね。
●WiFiでない契約回線での、スマホだけ繋がらない
こういう時は契約している各キャリア、ドコモやauやソフトバンクなどなど...が展開している回線側の問題が多いです。
●繋がるサイトと繋がるサイトの両方がある (今回のケース)
こういうケースはこのCDNの問題で発生することがあります。
CloudFlareは世界中で使われているので、CloudFlareを使っているWebサイトやサービスはすべて影響を受けます。
ちちぷいさんが繋がらない→Xも繋がらない→あれ、全部ダメなの?と不安になった方もおられるのではないでしょうか。
こういう時はいろんなサイトを片っ端から見ていくことで原因の切り分けができます。たとえば、Googleでググった結果が出れば、ああ影響の出たところと出なかったところと両方あるのだな、と分かります。また、だいたいインターネットのどこかには速報でニュースが出ることが多いですね。
●他のサイトは繋がって、ちちぷいさんだけが繋がらない
ここまで特定できると、ちちぷいさん固有の障害と判別できます。
ここから先もまた問題は細分化できて...
・ちちぷいさんのサービス全体が載っている土台のクラウドホスティングサービスの障害 (これはたぶん一般ユーザーに判別する手段はないのでは...もしかしたら画面に何か出るかも)
・そうでなかったらちちぷいさん本体の障害。でもドメインが幾つかあって...
- www.chichi-pui.com のちちぷいさん本体
- membership.chichi-pui.com のメンバーシップ
- pui.chichi-pui.com のちちぷい生成機能
- もしくはデータベース。データベースも複数ある可能性はある
このうちどれかだけが落ちる場合もあれば、複数が一緒に落ちる場合もあります。これはシステム内部の作りによるし、障害の原因にもよります。
----------
■ちちぷいさんでの障害もろもろ
我々がブラウザでちちぷいさんを見られるのは、いろんなプログラムが格納されたちちぷいさん本体が「Webサーバー」の上で動いているためです。ブラウザでアクセスできなくなったら、このWebサーバーの障害となります。厳密にいうとWebサーバーだけの障害の時と、その上で動いているちちぷいさんの障害に細分化できたりする場合もあります。
●Webサーバーで動いているちちぷいさんで障害が起こった時
日々のランキングの計算や、全ユーザーの予約投稿を30分ごとに処理する仕組みなど、定期実行されるプログラムは、Webサーバーの上でちちぷいさんを動かしているプログラムとは別に動いていることが多いです。(人間に例えたら別の担当者がいると思ってください)
なのでWebサーバーとしてのちちぷいさんにもし障害が発生して落ちていても、こういう定期的な処理は無事なことが多いです。ユーザから見た挙動としたら、Webサーバーとしてのちちぷいさんが無事復旧して自分のページを見たら、おっ落ちている期間の予約投稿分も無事に投稿されてるぞ、よかった...という動きになります。
●情報が格納されている場所
障害が起こったから自分の作品が全部消えちゃうんじゃないか、あるいは予約投稿が全部消えちゃうんじゃないか、と心配する方もいるかもしれませんが...それは可能性はかなり低いです。そうした情報が格納されている「データべース」というのものはかなり頑丈にできていて、Webサーバーの障害の影響を受けることは少ないからです。だいたいWebサーバーとはまた別のマシン(クラウド的には別の「インスタンス」や「リソース」がより正しい)の上でそうしたデータベースが動いています。
●障害発生時の投稿
また、予約投稿でなく即時投稿で「投稿」ボタンを押した後に障害が起こった、あるいは既に障害発生中の状態だった...の場合はこの投稿作品は影響をもろに受けます。だいたい「投稿が完全成功する」「完全失敗する」のどちらに倒せるように設計したりプログラムの中で工夫したりするものですが、途中の中途半端な不正な状態になったりすると厄介です。
「なんかちちぷいさん調子悪いな~」「コメントや他の作品でもみんな言ってる」「Xで繋がっている知り合いも同じように言ってる」などの場合は、可能なら投稿は控えた方が安全です。既存作品の編集も同様です。
●障害発生時の閲覧
ふつうにトップページを見たりトレンドを見たり個別の作品を見たりの操作です。こちらは情報を得るだけで更新がないので、一般的には投稿などの操作に比べると安全です。リロードしたりをやりすぎると負荷がかかる...はあるかもしれませんが、一人のユーザーがリロードを繰り返すぐらいの操作はサービス全体からしたら微々たるものではあります。
●定期的な処理での障害
Webサーバーの障害とは別に、予約投稿の仕組みだけに一時的に不具合が起こったりすることは、これはこれでありえます。しばらく前の2025/10/29(水)の朝7:00頃にありましたね。
●ちちぷい投稿機能での障害
ちちぷい投稿機能で「生成」ボタンを押して待っている間に障害が発生したとしたら...これは定期的な処理ではなくユーザーがボタンを押した時点で発生する処理です。なのでPUIだけ消えたり、画像が生成されなかったりは残念ながらありえます。
完全にちちぷいさん側の自責(サービス運営側に責任がある障害)であると判明した障害では、お詫びにPUIを返してくれたりは今までも実施されていたかと思います。
ちなみにちちぷいさんの中身はプログラム言語で記述されたコードが動いて機能を実現していますが、稼働中のWebサービスで、できたてほやほやのテスト不十分な新機能があったりしなければ、プログラムのバグでこういう障害が起こる...というケースは比較的少ないです。なぜならそういう種類のバグは事前にテストで発見しうるからです。
どちらかいうと想定外の操作をされたとか、アクセスがあまりに集中してコンピューティングリソースが支えきれなくなった、ハードウェア的な問題...などの原因の方がありえますね。
----------
■今回の障害で、ちちぷいさんはどんな対応をしたのか (ここは推測です)
原因を切り分けてCloudflareの問題だと分かった後は、ぶっちゃけちちぷいさんにできることはほとんど何もないはずです。最新の公式情報を待ちつつ復旧を待っていたのではないかと思います。
こういう時一般的に、障害が起こった仕組みやサービスに対して「早く直せ!」とか言うのはほとんど意味がないですね。言われる側からすると「そんなこと言われんでもいま全力で復旧作業中じゃい」となって、問い合わせ自体が向こうにとっては負荷になるだけだからです。
よく行われる対応は、その仕組み側からの
・契約した企業に対し個別ではなく世界全体に向けて発信している公式の最新情報(公式サイトのダッシュボードなど)
・更新頻度の高いメディアでの通知(Twitter改めXとか)
を見て経緯を見守ることです。SNSでも善意のある人や知識のある人がが拡散したり記事にしたりして正しい情報を広めてくれることもありますが、同時に誤情報や憶測も含まれることもあるので注意すべきと言われています。こういうところは、地震や津波など、自然災害が起こった時と同じようなものですね。
たぶんCloudFlareを使っていた世界中の様々なWebサイト・Webサービスの担当者の方々も、上のように最新情報をチェックしつつ復旧を待っていたのではと思います。
----------
■こうした障害発生時にユーザーがしないほうがよいこと
これは一般的に言われることですが、むやみに騒ぎ立てたり誤情報を広めたりすることですね。
これもそのコミュニティにどんな人が集まっているかで大きく変わります。
たとえばこの1-2年は更新をさぼってますが、僕ははてなブログで技術系ブログを維持していました。ITエンジニア向けのQAメインのSNSや技術系記事のみのブログサービスみたいなのもあります。こういうコミュニティ近辺で自分から情報を発信しているようなレベルの人々はもう優秀で凄い人、知識のある人、つよつよエンジニアがいっぱいいるので、こういうインターネット障害が起こってもみんな落ち着いたものです。
これがXになると、もうどんな人が集まるかの界隈によって千差万別です。
一般人が集まるSNSになると民度がまた下がります。たとえば懐かしの「ミク◎ィ」を僕も長くやってましたが、サービス障害が起こるとまぁほんとにゴミみたいな書き込みがありましたね...書いてる人間もゴミ認定ですわ...
今回のCloudFlare障害とはまったく別の話ですが、ちちぷいの投稿作品でもキャプションに何かの障害起因やら不満やらで運営さんへの罵詈雑言や汚い言葉が書かれた作品、過去にもありました。トレンドやランキングに載るような人でこれをやるとさらに見苦しいですね。
こちらもまったくおススメしないですね。ユーザーの民度や品位を下げる行為、ひいてはSNS全体やAIイラスト界隈全体の信用を貶める行為です。
そういうキャプションを読むと知識のある人は「フフフ...無知な愚民はこれだから困る...罰としていいねなしのタブそっ閉じの刑じゃ(^ω^)」とか思うわけですよフフフ...
まあ上記はギャグですが、作品を見ていて同じような気持ちになったことは僕も何回もあります。
----------
■逆に、ユーザーがしたほうがよいこと
ユーザーができることはほとんど何もないので、まずは落ち着いて冷静に行動することです。こういうのは地震に火災に津波、自然災害発生時と同じですね。
エンジニアリング的に冷たいことを述べると、人間という生物の思考による祈りの力は、世界のどこかにあるデータセンターの中で動いているコンピューティングリソースには影響を及ぼしません。従って、「サーバー復旧の祈り」というものは技術的には効果を持ちません。
(クラウド時代には正確には「サービス復旧」と呼んだ方がより正しいですね。)
でもユーザーが復旧を祈っていることや復旧に感謝していることが、Webサービスを運営している側のエンジニアの皆さんに届けば...それは血の通った人間同士の感情の持つ力として、意味を持つでしょう。
復旧したら作品を上げてタイトルや内容やキャプションでお礼を伝えたり、トピックスでお礼を伝える(でも今回はこれはもうすぐリニューアルですね)などすれば、世界がより温かくなってみんなほっこりになることでしょう。😊
--------------------------------------------------------------------------------
【追記】翌々日の2025年11月20日のデイリー呪文あり4位、#オリジナルで2位、ちちぷい生成機能で3位、うちPEGASUSで1位🐰多数のご来訪ありがとうございました~🎉
いつも見ているちちぷいさんも他のWebサービスも、裏ではこんな仕組みや人々が頑張って支えているというのが少しでも理解の解像度が上がれば幸いです😊
呪文
呪文を見るにはログイン・会員登録が必須です。
イラストの呪文(プロンプト)
イラストの呪文(ネガティブプロンプト)
- Steps 50
- Scale 7
- Seed 472761590
- Sampler DPM++ 2M Karras
- Strength 0
- Noise 1
- Steps 50
- Scale 7
- Seed 472761590
- Sampler DPM++ 2M Karras
- Strength 0
- Noise 1