ストレスフリーにゲームを楽しんでもらうためには、インフラ整備、つまりサーバーの構築や安定した運用が必要不可欠です。グリーでは、「SI」、「SO」、「SE」の3つのチームが中心となって、ウェブゲームを提供するGREEや、その他グループ会社の各ゲームのインフラを支えていますが、彼らはどんな思いをもって仕事に取り組んでいるのでしょうか。各チームのフロントマンに話を伺いました。
岩堀(SI) 開発本部 インフラストラクチャ部 シニアエンジニア
エンジニアが多くいる環境に身を置きたいと思いグリーへ。現在、SIとしてサーバーの立ち上げから構築までを担当。仕事におけるモットーは、数値、設定、ソースコードといった信用できる情報をしっかり見ること。
小林(SE) 開発本部 インフラストラクチャ部
大規模なインフラ構築に興味をもちグリーに入社。現在、SEとしてサーバー内を動かすさまざまなプログラムを担当し、インフラにおけるもっともテクニカルな部分を支えている。趣味は動物園と寺巡りという意外な側面も。
竹ヶ原(SO) 開発本部 インフラストラクチャ部
グリーに入社したのは、自分で携帯ゲームの運用をやってみたいと考えたから。現在、サーバーの運用を行うSOを担当している。グリーは「会社と一緒に自分が成長し続けられる場所」。お酒とカラオケが大好き。
万年 開発本部 インフラストラクチャ部 マネージャー
SEの小林と同じく、以前からインフラについて興味がありグリーへ入社。マネージャーとしてSIチームを取りまとめており、「ゲームが新しくリリースされたときのお祭り感が大好き!」と話す。座右の銘は「人間万事塞翁が馬」。
インフラの仕事内容とは
――「インフラ」といわれても、きっと多くの方が漠然としたイメージしか持っていないと思うので、まずはみなさんがどんなことをやられているのか、具体的に教えてもらえますか。
万年:インフラチームでは、ゲームを開発するためのサーバーの立ち上げから、保守・運用までのすべてを担っています。チームはSI(サービスインストレーション)、SO(サービスオペレーション)、SE(サービスエンジニアリング)の3つに分かれていて、それぞれインフラに関連する役割を分担しています。
岩堀:僕が所属しているのはSIという部署です。ゲームを遊んでいただくためにはサーバーが必要になりますが、SIはゲームの開発初期から参画して、各事業部との調整、具体的なサーバーの仕様決め、そして実際の構築も行っています。ゲームをリリースしてから落ち着くまでのサーバー運用も僕たちの仕事ですね。
――他部署とのやりとりがあるということは、技術的知見に加えてコミュニケーション能力も必要とされるのでしょうか。
岩堀:おっしゃる通りです。サーバーは「数を増やせば安定するんでしょ」と思われがちですが、開発しているゲームの技術要素にも影響を受けます。また、お客さまがどれぐらいアクセスするのかといった予測、さらには予算の制約もあるので、ゲーム開発の部署とやり取りしながら、ベストな構成を考えなければいけません。
竹ヶ原:そう考えるとSIはインフラのおいしいとこどりですね(笑)。責任は重大ですけど。
岩堀:ゲームのリリース時、予想以上に多くのお客さまが遊びに来てくださったときなども、開発に負担をかけないように、色んな解決手段を予算とあわせて提案することもあります。だから、仕事の内容としてはかなり幅広いですね。
竹ヶ原:そんなSIからバトンを受け取るのが、僕らSO。SOの「O」はオペレーションを指していて、SIが立ち上げたサーバーが落ち着いたら、今度は僕らが「運用」をしています。グリーにはいくつものゲームがあるので、それらすべてを24時間365日、快適に楽しんでいただくための体制を敷いています。いま担当しているゲームは30本以上あるので、人数も結構多いですよ。
岩堀:まさに縁の下の力持ち的な存在ですね。
竹ヶ原:だからこそ、その体制作りがすごく重要だと思っています。すぐに崩壊するような縁の下じゃダメですから(笑)。僕らは基本的に、障害対応の一次請けをやっていますが、トラブルが発生してアラートを受けたら、まずは状況を把握して関連するチームに伝えなければいけません。従って、技術に関連する知識はもちろんですが、それをメンバーに的確に伝えるためのコミュニケーション能力も、SOをやるうえで実は必要だったりします。
万年:コミュニケーションツールもチャットが基本。ちょっとしたニュアンスで、怒っているんじゃないかと感じる人もいるでしょうから細かいところまで配慮しています。結局のところ、人と人なんです。些細なことで現場の空気は良くもなるし、悪くもなる。そして、その空気がゲームのクオリティにも影響を与えるんです。
――続いて、SEはどういった職種ですか。
小林:SEは、実際にサーバーの中で動かしているさまざまなプログラムに接しています。SIやSOのメンバーも知識は必要ですが、僕らはより技術的な観点からインフラに関わっているイメージですね。
岩堀:SEは、まさにインフラ領域におけるプロフェッショナルなんです。
小林:ハードルを上げないでください(笑)。特に最近はミドルウェアが多様化しているので、ソースコードを読んだり、ミドルウェアを調べたりと、技術的なことに長時間接しています。インフラで使っているツールの中には自社で開発したものもあるので、そのあたりのメンテナンスも行っています。インフラチームの中で、一番コードを書いているのも僕らかもしれません。
万年:SEはデータベースが突然重くなったときなど、こちらで調査しても原因がわからないときの駆け込み寺でもあるんです。
小林:そういう意味では、SIやSOがコミュニケーション能力を必要とされるのに対し、SEは技術が第一。トラブルが起きたときに、その答えを僕らがもっていなければいけないので、常に技術を磨くように意識しています。
万年:こちらがそこまで深く考えていないことでも、SEは技術的な側面から答えを出してくれるんです。結果的にそれは、お客さまへのサービスの質の向上にもつながってくるんですよ。
絶対にサービスを止めない、という文化
――インフラチームにとって、一番大変な時期はいつですか。
岩堀:導入部分を担当するSIでいえば、ゲームがリリースしてから1か月ぐらいですね。お客さまがこちらの予測を上回って遊んでくださった場合、サーバーの数が不足することもある。増設するのか、それとも別の方法で対処するのか。アラートの数がもっとも多いのがこの時期です。
万年:SIは特に迅速な判断が求められますよね。
岩堀:サーバーを増やせばそのぶん費用もかかるので、将来的にどういう方向性で落ち着かせていくのかを常にイメージしておかなければいけません。とはいえ、ゲームをするのは「人」なので、リリースしてみなければわからないことも正直たくさんあります。
――初期は障害が多いものなのでしょうか?
岩堀:はい。もちろん障害が出たときの対応マニュアルはたくさんありますが、それだけではカバーできないこともあります。
竹ヶ原:そういうときは、綿密に連絡を取り合って対応します。そして、それもまたマニュアルに落とし込み次回からの糧にしています。
万年:そもそもグリーには以前から「絶対にサービスを止めない」という文化が根付いています。そのための施策のひとつが、先ほどあがったアラートの多さ。ゲームにそれほど影響がない場合でも、あえてアラートが鳴るように設定しています。サービスが止まってしまうとお客さまに迷惑をかけてしまうので、トラブルが起こってからではなく、起こる前にできる限りの対策をしよう、という考え方ですね。
岩堀:アラートひとつとっても、粒度が細かい。他社さんだったら検知しないようなアラートもありますから。
小林:基本的には、遊べないお客さまを一人も作らないようにすることを心掛けています。冗長化、二重化ともいうんですけど、ひとつのサーバーが落ちてもゲーム自体に影響がでないようにもしています。あとはモニタリング。負荷の指標やディスクの読み書き、メモリ、通信状況など、さまざまな角度からサーバーの状況を常に監視しています。
竹ヶ原:トラブルが起こったときも、モニタリングをしているから原因特定のスピードが速い。トラブル発生時は、原因の切り分けができるかどうかが、安定運用の肝でもあります。なので、ここまで細かく、しかも短い単位でデータをとっているところはなかなかないと思いますよ。
岩堀:異常なほど監視していますからね(笑)。過去の障害データも細かくとってあるので、そこからも答えを導き出すことができる。
小林:監視専門のチームがある会社もなかなかないんじゃないですか?
岩堀:ないですね。それができる環境があるのは、グリーの強みだと思いますよ。
竹ヶ原:そのあたりのテクニカルな部分もSEが担ってくれています。SEは何かあったときの“最後の砦“のような存在です。技術的な観点から具体的な答えを出してくれるので、本当に助かっています。
――みなさんがそうやって見えないところで動いているからこそ、ユーザーがストレスなくゲームを楽しめるわけですね。
竹ヶ原:そのほかにも、僕らが大切にしている指標のひとつに「レスポンスタイム」があります。レスポンスタイムとは、お客さまが何か操作をして読み込むまでにかかる時間のことで、これが改善されるだけでプレイ体験はものすごく良くなります。どれだけ面白いゲームも、レスポンスが悪いとダメですね。
万年:「遅い」とお客さまに感じさせてしまったら、あっという間にゲームから離れられてしまいますから。常にお客さまの気持ちになって考えることが大切ですね。
岩堀:アラートもモニタリングも、結局のところはお客さまに気持ちよく遊んでもらうためのものなんです。
自分たちの好きなゲームを自分たちが支える
――みなさんがやりがいを感じるのはどんなときでしょう。
岩堀:お客さまがたくさん来てくださると、そのぶんたくさんのトラフィックがあるのでサーバー調整する甲斐がありますよね。想定外のアクセスを安定稼働までもっていったときはやっぱり嬉しいです。
竹ヶ原:そうそう。障害が発生してしまったとき、復旧作業はやりがいが感じられる瞬間でもあります。規模が大きいと大変ではあるんですが、メンバーがひとつの目標に対して一丸となって対応するときの雰囲気と達成感が好きです。
岩堀:あとは、ゲームのプッシュ通知を送ったときにサーバーの負荷が連動して増えていく様子が見られるのも面白いです。たくさんのトラフィックがあると何か施策を打ったときの効果もわかりやすいですね。
竹ヶ原:マニアックだなぁ(笑)。
小林:僕は新しい技術に触れられたときですね。グリーは、CTOの藤本の意向もあって、新しいことに挑戦してみようという社風があります。たとえばミドルウェアの新しいバージョンが出たら、まずはみんな触れてみる。新しいものに触れるのは楽しいから、僕らもモチベーションがあがる。良い技術を見つけてプロダクト側に提案し、パフォーマンスがあがれば、結果的にプロダクトやお客さまにも貢献できますから。
万年:先ほどの新しい技術を取り入れようという社風はもちろん、グリーでは勉強会やセミナーにも積極的に参加させてもらえますからね。僕らはゲームが動いて当たり前の世界にいるので、保守的に見られがちですが、実際は日々情報収集に努めています。
小林:大小合わせて月に一度くらいは勉強会に参加しています。会社もバックアップしてくれるので、新技術に積極的に関われることも含めて、エンジニアにとってはすごく働きやすい環境だと思います。
――みなさん、やっぱりゲームがお好きですか。
竹ヶ原:インフラに関わるメンバー全員、ゲーム好きです。自分たちの好きなゲームを自分たちが支えている。きっとここにいるメンバーも心の中で、そういう自負をもっているんじゃないですかね。
岩堀:僕らが携わったゲームをたくさんのお客さまが楽しく遊んでくれたら、純粋に嬉しいですよね。あとは不安定だったサーバーが、僕らの対応によって安定してきたときは「よしっ」ってなる(笑)。
竹ヶ原:そうそう。一般の人にはなかなか伝わらないと思いますが。だから、他社さんのゲームをやっていて不安定になると、大変そうだな…と逆に心配になってしまいます。
小林:完全に職業病ですね(笑)。
岩堀:ストアランキングトップタイトル50位に入るゲームを運用している会社が、インフラの資料を公開すると必ずチェックしちゃいますし。
竹ヶ原:結局のところすべてはお客さまのためなんです。障害などが起こった場合も、判断基準はすべて「お客さまに影響があったかどうか」ですから。
岩堀:障害があったときも、お客さまがどれぐらいの時間アクセスできなかったかという報告をしています。
竹ヶ原:障害はどうしても起きてしまいます。大切なのはその原因を追究すること。起きてしまったのであれば、それを二度と起こさないためにはどうするか。それをチーム全体で考えるようにしています。
小林:些細なオペレーションミスがあったときも、こういうアラートがあったらもっと早くに気付けますよねとか、人がやるとミスが発生するから自動化しましょうという問題解決を一緒にやっています。
万年:サーバーを増やして人を増やせば、ゲームは安定しますが、やはり僕らが目指すところはそこじゃない。限られた時間、予算のなかで、どうやって最高のパフォーマンスを実現させるか。そこにグリーのノウハウや技術があるんです。とはいえ、僕らインフラチームの存在が、お客さまに気付かれるようではダメ。僕らの存在を微塵も感じさせないようにすること。それがある意味、僕らの使命といえるのかもしれません。
インフラを支える4名のメンバーたち。彼らの話の節々からは、インフラという仕事に対する誇りとゲームへの愛情、そして、たくさんのお客さまにストレスなく楽しんでもらいたいという思いがあふれていました。普段、私たちが何気なく楽しんでいるゲームも、彼らインフラチームの存在があってこそなのです。
※取材は2017年7月に行いました。
本件に関するお問い合わせ先
- グリー株式会社 広報担当
- 東京都港区六本木6-10-1 六本木ヒルズ森タワー
- E-mail: jp-pr@gree.net
- URL: https://corp.gree.net/jp/ja/
- Facebook: グリー株式会社
- Twitter: @GREE_pr_jp