GBLのレーティングシステムについての考察、あるいはやっぱりNianticはおかしい

2021/12/14 00:00

前回の続き。初稿から少々追記があり、以下はそれを踏まえての内容。

前提:レーティング戦のK値は28で近似する

これは俺の戦績のうち一部の抜粋になるが、

・セット開始前レーティング:2343
・勝:2351
・勝:2331
・負:2394
・勝:2350
・負:2354
・終了後のレーティング:2360

これはK値28でレーティングの変動値を計算し、かつ計算は一括で行った時の結果と概ね一致する。これまでも何回かレーティングの情報は記録しておりそれらとも突き合わせたが、誤差が出てもせいぜい1程度で、たまにその程度が出るなら概算としては許容範囲と判断した。また一括計算ではなく都度計算にするともう少し誤差が出るが、全体に論旨に影響はなさそうなので、以下の計算では一括計算ではなく都度計算も多く含まれる。(※一括計算でレーティング分散の概算プログラムを書き直すのが面倒くさかったため。)

謎の初期レーティング及びレーティング平均値

以前の考察ではランク20到達時のレーティングの算出方法は深堀しなかった、というかわけがわからなかったので、地元のポケモンGO仲間が勝率50%ぐらいでエース帯に居たので、多分レーティングの平均値=ランク1時点の真の初期レーティングは2000ぐらいだろうと見積もっていたが、シーズン10におけるtwitter上の報告を見ると大分乖離があるようだ。

俺のデータだけを見ると195戦123勝でレーテイング2154だったので、勝敗差を見ると51の勝ち越し。ランク1の内部レーティング1500開始、K値28で下当たりばかり勝ち越したとするとイロレーティングで計算した結果に結構近くなるが、他のプレイヤーの報告を見ると結構ずれがある。

ランク20までのレーティング計算には

・K値をランクごとに変えてる説。
・イロレーティングを(少なくとも全部では)使ってない説。
・前期の最終レーティングが影響する説。

などが色々あるが、どれもしっくり来ないのが実際の所。ランク1のレーティング1500から開始して適当に補正掛けて計算したり、序盤は勝者同士マッチングでレーティングの収束を早めるためにK値を大きくしたり、そういった事をやっている可能性が比較的高そうには見える。しかしここで問題が出てくる。

レジェンド到達難度は総試合数とレーティング平均値で決まる

・1人あたりの総試合数は2500(バトルデイ込みでこのぐらい)
・全員毎日フルマッチ

上記の前提条件を置いた場合、レーティング平均値(=ランク1時点の内部レーティング)が2000の場合はGBLプレイヤーのうち10%強がレジェンドに到達できる計算になるが、もしもこれがレーティング平均値1500だった場合、GBLプレイヤーの2%弱しかレジェンドに到達できないことになる。

実際には各自の得意リーグの有無で勝率はシーズン通じて大きく変動すること、上位ほどマッチングしにくく格差マッチングを落とすリスクが高くなることなどから話は単純ではないが、基本的な考えとしてはレーティング平均値が下がれば下がるほどレーティング3000という閾値との乖離が大きくなり、ある時点でのレーティングの分散においてレーティング3000以上の集団に属する人数は減少する。

過去からずっとそうだったとは言え、Nianticのさじ加減一つでレジェンドの難度は激変する。そして今も多くのプレイヤーがレジェンドに到達できず、またポケモンGOのPvPは育成が死ぬほどマゾくて実生活への影響が大きいのは周知の事実。

この凶悪なコンテンツに対し、どの程度の努力をすれば報われるのかに直結する情報を頑なに出さず、数々のサイレント修正でむしろ必要な努力の量を平気で変動させるNianticはやはりおかしい、というか酷いと言わざるを得ない。

下当たりの影響

GBLを長くプレイしていると、3-2で7程度しかレーティングが増えず、逆に2-3で20近くレーティングを溶かしてしまうという経験をしたプレイヤーは多いと思う。リーダーボード帯に至っては3-2で下がるという報告が珍しくもなんともない。

これはイロレーティングがK値✕(1-勝者の勝率)という計算式でレーティングの変動値を出し、それを勝者に加算して敗者から減算するという計算をしているからになる。

例えばレーティングが2500のプレイヤーは2400のプレイヤーに対して64%程の勝率のため、2500のプレイヤーが勝った場合のレーティング変動値はK値28ならば小数点以下切り上げで11となる。逆に落としてしまえば変動値は18にもなる。そのためもしも5戦連続で同じ程度の下当たりを引いてしまった場合、GBLの計算方式では全試合2500 vs 2400のレーティング計算が適用されるため、3-2してもレーティングの収支は11✕3-18✕2=-3となり、勝ち越しているのにマイナスになる。

ここまで極端でないにしてもレーティング差70ぐらいのマッチングは珍しくもない。レーティング差で70というのは勝率でいうと約60%と相当大きな数字になる。同じような戦績のプレイヤーのレーティングが著しく異なる理由の一つはこのためで、さらにGBLにおいてはパーティ相性の影響が極めて大きいため、格差マッチングでも勝率通りの結果にはなりにくい。

思ったよりもレーティングが伸びていないな?と思うことが多い人は、格差マッチングの下当りを落としている可能性が高い。(後はランク20までに無駄勝ちが多いとか。)逆に言えば格差マッチングで上当たりを喰えれば美味しいという事になり、実際シーズン9の俺は結構上当たりを多く取って美味しい思いをしていたようだ。

レーティングの底上げ?根拠を出せ、根拠を

GBLについて度々流れてくる言説に以下の2つがある。

・バトルデイなどでみんなが多くの対戦をすればレートの総量が上がってレジェンドに行きやすくなる。
・全体のレーティングが上がった後半の方が、レーティングを上げやすい。

上記2つは観測される結果とは実は大きく矛盾はしないのだが、GBLのレーティング戦が非対称レーティングでないシステムであると仮定した場合、論理展開としては間違っているというか不正確甚だしい。

通常はレートの総量は一定

先に書いた通り、イロレーティングにおいてレーティングの計算はK値と勝率から変動値を割り出し、勝者に加算、敗者に減算という処理を行う。この過程において、レーティングの総量は一切変わらない。(当たり前)

勿論世の中にはレーティングが上がりやすく下がりにくい非対称レーティングを採用したゲームがあるのは確かではあるが、GBLがそのようになっているようには見えない。少なくとも、エースからレジェンドまでの期間において、K値28のイロレーティングでの計算で近似できる以上は非対称レーティングにはどうにも見えない。

ではなぜ多くのプレイヤーが対戦を多くこなせばレジェンドに到達しやすくなるかと言えば、それは試行回数が増えれば増えるほどレーティングの分散が広がるためである。ここでは1人のプレイヤーが1シーズンに行う対戦数を2500回として計算し、レーティング平均値1500の場合は2%弱のプレイヤーがレジェンドに到達できるという結果を得た。

もしもこれが1250回の試行回数となると、レジェンド到達者は全プレイヤーの0.12%程度になる。これは試行回数が少なくなった結果レーティングの分散が狭まり、結果としてレーティング3000という閾値がレーティングの分散において占める位置が引き上げられる事による。結論としてはレジェンドに行きたかったら対戦数を増やせというのは変わらないが、そのための理屈は前述の言説とは大きく異なる。

後半からの参戦の推奨=合成の誤謬

そして上記のレーティングの総量が一定であること、試行回数が増えれば増えるほどレーティングの分散が広がりレーティング3000という閾値が分散において占める位置が低下する事を踏まえると、「全体のレーティングの上がった後半から参加」という言説のいい加減さが分かる。

レーティングの分散が広がった後に本格参戦するという事は、その分強豪とのマッチングが少なくなる事を意味しはする。その結果、少ない試合数で適正なレート帯まで辿り着く事にはなる事が期待される。

ただしこれには他の多くのプレイヤーが多くの試合数を重ねてレーティングが十分分散していることが前提になっている事は少し考えれば分かることであり、もしも多くのプレイヤーがこの選択肢を選んだ場合、レーティングの分散が十分に広がらないため、結果としてレジェンド到達の難度は高くなる。極端な話、全プレイヤーが半分の期間しか参戦しなかった場合、それはつまりレジェンド到達者は全体の0.1%程度になる事を意味する。

前述の通りGBLが本当に育成がしんどいコンテンツである以上、他人に戦略をアドバイスするような立場の人間は合成の誤謬ぐらい気にしてくれというのが正直なところである。

省エネレジェンドというハッタリ

シーズン9の終盤で、最後の2週間ぐらいで省エネレジェンドと称してレジェンドに行こうとした(そして失敗した)プレイヤーが良くも悪くも一部で話題になったが、ここまでの話を読めばやってる事はレーティングの分散が進んだ終盤において自分の適正レート帯までを少ない試合数で到達しようとした、悪く言えば他のプレイヤーたちの試行回数にフリーライドしようとしただけ、という事が分かる。

そのプレイヤーは環境読みも外した上に他のプレイヤーの全体的な技術向上も計算していなかったようなので目標の遥か手前でギブアップしていたが、あれで自分を凄いと思わせようとしていたなら単に無知なプレイヤーへのハッタリに過ぎないし、ここまで書いたレーティングの仕組みがわかっていなければ単に頭が悪い。

勿論極端に試行回数を減らすことには大きなリスクがある事は事実だが、GBLのゲーム性の性質上、それは困難へのチャレンジというよりは丁半博打のようなものだということは理解しておく必要がある。

GBLのレーティングについての考察はこれで一段落。結局の所Nianticがよくわからん査定でランク20時のレーティングを出しているせいで、どの程度の努力がレジェンド到達までに必要なのかが極端に見えにくいのは本当によくない。そしてNianticはこの事をまったく問題視していないように見えるし、なんならシーズン6からシーズン10まで同じ基準でランク20時のレーティングが出ているとも思えない。

シーズン10でバグが余計に増えた事もそうだが、もう少し競技ゲームというものに誠実に向き合って貰いたいのだが……。

ギフトサポートする

Chikara Kuwata@Return0 Records
その他の投稿
GBLシーズン9振り返り、あるいはマジでいい加減にしろNiantic