深夜3時5分、QuickBuy のフラッシュセールは止まりました。
商品ロードが終わった直後、Perl のプロセスが Out of Memory で落ちたのです。商品ロード前は 200MB だったメモリ使用量が、わずか数秒で 2.4GB まで跳ね上がっていました。サーバーの上限は 2GB。開始5分で障害、推定売上損失は 5 千万円。数字だけ見れば十分に事故ですが、僕にはもう一つ理解できないことがありました。
10万件の商品で 2.4GB。単純計算で 1 商品あたり約 24KB です。けれど商品が持っているのは、名前、価格、在庫、カテゴリ、税率くらいです。そんなに重くなるはずがない。
僕は加藤。EC プラットフォーム「QuickBuy」のバックエンドエンジニアです。今回のセールでは「全商品をメモリに載せて、在庫と価格をリアルタイムに突き合わせたい」という要件を、そのまま正面から実装しました。10万件くらいなら何とかなるだろう。そう見積もったのが間違いでした。
翌日の午後、メモリダンプとログを抱えて LCI を訪ねました。ロックさんは机の上の空き缶を寄せ、僕が差し出したグラフを一目見て言いました。
「商品そのものより、付属品を複製しているね」
初対面の相手としては十分に不可解でしたが、少なくとも話はコードの中身から始まりました。僕としては、その時点でかなり助かっていました。
現場検証:10万件の中で何が膨らんだのか
「まずはクラス定義を見よう。メモリは嘘をつかない」
僕は Product 周辺のコードを開きました。
| |
ロックさんは軽くうなずきました。
「設計そのものは素直だ。問題は、これを10万件どう組み立てたかだろう」
そこで、セール用に追加したロード処理を見せました。
| |
ロックさんはその場で紙に数字を書き始めました。
「ここだ。ループの内側で Category->new と TaxRule->new を毎回呼んでいる。商品が10万件なら、Category も 10 万個、TaxRule も 10 万個できる」
「でも、DB の行にはカテゴリ名も税率も入っています。そこから素直に組み立てただけです」
「では確認しよう。QuickBuy のカテゴリは何種類ある?」
「えっと……家電、食品、ファッション、書籍、スポーツ……全部で20種類です」
「税率の種類は?」
「標準税率10%、軽減税率8%、非課税、輸出免税、経過措置——5種類です」
「それなら、商品が10万件あってもカテゴリの実体は 20 種類、税率ルールは 5 種類で足りる。ところが今のコードは、その20種類と5種類を毎回作り直している。商品名や在庫のように個別であるべき値と、共有できる値が同じ箱に入っているんだ」
「つまり、商品ごとに違うものだけを持てばよかったのに、共通のカテゴリ情報まで抱え込ませていたんですね」
「その通り。商品を増やしたつもりが、同じ付属品まで増やしていたわけだ」
graph LR
subgraph "10万個の Product"
P1[商品A] --> C1[Category: 家電]
P2[商品B] --> C2[Category: 家電]
P3[商品C] --> C3[Category: 家電]
P4[...5,000個...] --> C4[Category: 家電]
end
style C1 fill:#f99,stroke:#333
style C2 fill:#f99,stroke:#333
style C3 fill:#f99,stroke:#333
style C4 fill:#f99,stroke:#333
「赤いノードは全部ほぼ同じ中身だ。違う個体として持つ意味がない」
ロックさんは図の余白に二つの言葉を書きました。
- 内部状態: 全インスタンスで共有できる不変データ
- 外部状態: インスタンスごとに異なるデータ
「カテゴリ名、アイコン、表示ルール、税率。これは内部状態だ。商品名、価格、在庫は外部状態だ。今の設計では内部状態まで商品ごとに複製されている。これが Duplicated Intrinsic State、つまり内部状態の重複だ」
「内部状態だけ外に出して共有すれば、商品は軽くなるということですか」
「そうだ。10万件が重いのではない。共有できるものまで10万回 new しているのが重いんだ」
推理:共有すべきものを共有する
「対策は単純だ。内部状態だけ別管理にして、必要なときに参照させればいい」
ロックさんは僕のノートPCを手元に寄せて、まずプールを切り出しました。
【After】共有プール(CategoryPool / TaxRulePool)
| |
「get は、同じキーのオブジェクトがなければ一度だけ作り、以降は同じものを返す。ここで重要なのは、Category や TaxRule 自体の API を変えていないことだ。共有の責務をプール側に閉じ込めている」
「ということは、Product 側はカテゴリの作り方を知らなくていいんですね。必要なものを受け取るだけで済む」
「そうだ。共有の都合をドメイン本体に漏らさない。それも大事な設計だ」
次に、商品ロードをプール経由に直しました。
【After】プールを使った商品ロード
| |
「見た目の差分は小さい。だが意味は大きい。ループのたびに新しい内部状態を作るのではなく、既存の内部状態を再利用するようになった」
| |
「でも、本当に同じオブジェクトなんですか。値が同じなだけではなくて」
「確認してみよう。疑うのは健全だ」
| |
「== で同じになるなら、本当に共有されていますね」
「そういうことだ。見た目が同じなのではなく、同じ実体を見ている」
graph LR
subgraph "10万個の Product"
P1[商品A]
P2[商品B]
P3[商品C]
P4[...5,000個...]
end
subgraph "CategoryPool(20個)"
CE[Category: 家電]
end
P1 --> CE
P2 --> CE
P3 --> CE
P4 --> CE
style CE fill:#9f9,stroke:#333
「これが Flyweight パターンだ」とロックさんは言いました。「共有可能な内部状態を、外部状態から切り離して再利用する。大げさな仕掛けではない。オブジェクトの数え方を正しくするだけだ」
「カテゴリが 10 万個から 20 個、税率が 10 万個から 5 個……。内部状態だけ見れば、別物みたいな差ですね」
「商品固有のデータは残る。それでも共有できる部分だけで、十分に壁を崩せる」
検証結果:2.4GB から 240MB へ
ロックさんは最終的に、再現用のテスト結果を並べてくれました。
| |
「新しいカテゴリを足しても、増えるのは 1 個だけなんですね」
「共有の単位がカテゴリだからね。商品数ではなく、種類数で増える」
何より大きかったのは、メモリ使用量が約 2.4GB から約 240MB まで落ちたことでした。問題の本質が「商品数」ではなく「重複した内部状態」だったと、ようやく腹落ちしました。
そのあとロックさんは、締めのように一つだけ注意点を添えました。
「Flyweight は共有した内部状態を変更しないと約束できるときだけ効く。もし『同じ家電カテゴリでも、この商品だけ表示ルールを変えたい』という要件があるなら、それは共有オブジェクトに持たせるべきではない。外部状態として分離するか、共有そのものをやめるべきだ」
この話が重要でした。共有は魔法ではありません。不変であるから共有できる。不変でないなら、共有はむしろ事故の入口になります。
LCI を出たあと、僕は CTO への報告にこう書きました。原因はメモリ不足ではなく、共有可能データの複製。対策は Flyweight による内部状態の共有。次のセールでは、同じ失敗は繰り返さないはずです。
探偵の調査報告書
| 容疑(アンチパターン) | 真実(パターン) | 証拠(効果) |
|---|---|---|
| Duplicated Intrinsic State(内部状態の重複)。10万個のオブジェクトが、20種類のカテゴリと5種類の税率のデータをそれぞれ個別に保持。本来25個で済む共有データが20万個に膨張し、メモリを2.4GB消費してOOMクラッシュを引き起こした。 | Flyweight パターン。不変の共有データ(内部状態)をプールで一元管理し、各オブジェクトはプールへの参照だけを保持する。10万個のオブジェクトが25個の共有インスタンスを参照し、メモリ使用量を99.99%削減。 | メモリ使用量が2.4GBから約240MBに削減。Category オブジェクトが10万個→20個、TaxRule オブジェクトが10万個→5個に。新カテゴリ追加はプールに1個増えるだけ。ロード処理の変更は new を pool->get に差し替えるだけで、呼び出し側の構造変更は不要。 |
推理のステップ
- 内部状態と外部状態を分ける: 全商品で共有できる不変データと、商品ごとに異なるデータを切り分ける
- 共有プールを用意する: 同じキーなら同じオブジェクトを返す
getを実装する - 生成箇所だけ差し替える:
newを直接呼ばず、プール経由で内部状態を取得する - 参照共有をテストする: 同じカテゴリの商品が同じオブジェクトを参照していることを確認する
- 不変性を確認する: 共有オブジェクトを書き換える要件がないかを最後に点検する
ロックより
オブジェクトを細かく分けること自体は悪くありません。問題は、同じ中身を大量に複製しているのに、それを個別の実体として抱え続けることです。
Flyweight パターンは派手な技巧ではなく、共有してよいものを見極める整理術です。内部状態が不変なら共有する。可変なら共有しない。この判断を誤らなければ、メモリ使用量だけでなく、設計の見通しもかなり改善します。
