はじめに
皆さんは作業をするとき、何回の作業を入れますか。作業を1回入れてドキドキしながら結果を確かめるのは楽しいですが、手間がかかります。多くの人はまとめて作業を入れるでしょう。50回作業しかやらないぜ!という方も多いのではないでしょうか。
今日は、まとめて作業をしていると気付かない「1回作業生産数の分布」について考えてみました。
読みづらくだるいので先に結論を書いておきます。
1回作業の生産数は、屋外レシピ作業である「豊かなる角なし」では正規分布に従い、屋外公式作業である「ハードに乳を搾る」では正規分布に従っているとは言えませんでした。
2022/2/23修正
正規分布に従っていないとは言えません、正規分布に従うとは言えないと、表現を修正しました。
今はこの差が何故生まれたのかは分かりません。作業難易度、職種レベルや生産量アップ条件に起因しているのかもしれません。
あ、私の酪農家職種レベルは12ね。今回の検証中ずっと12ね!
ドムラちゃんの分布を調べる
私の屋外作業レシピ、ドムラちゃんこと「豊かなる角なし」の1回作業を120回繰り返し、生産数を記録しました。このレシピは成果数大量でありながらバラつきも小さく、観測しやすい特徴がありました。
ドムラちゃんは大量、難しいの屋外(草)酪農家レシピです。
詳細はレシピ番号#4001をご覧下さい。
また、公式作業の「ハードに乳を搾る」作業も258回繰り返し、結果を比べました。
ハード搾り生産数は倉庫のミノタウロス数により変化しますので、今回は倉庫のミノタウロス数を500に揃えておきました。
こちらは大量、一般的の屋外(ミノタウロス量)酪農家公式作業です。
なんでそんなことするの?
私自身がよく知りたかったからです。
情報屋やtwitterで聞いてみてもよく分かりませんでした。
Loading from twitter
で、どうだった?
ドムラちゃん1回作業での各生産数の出現回数は以下のとおりです。
ドムラちゃん
ドムラちゃん生産数 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
出現回数 | 1 | 6 | 6 | 15 | 14 | 16 | 22 | 19 | 12 | 5 | 3 | 0 | 1 |
平均 | 標準偏差 | 最小 | 最大 |
9.39 | 2.32 | 4 | 16 |
ハード搾り
ハード搾り1回作業での各生産数の出現回数詳細は省略します。
平均 | 標準偏差 | 最小 | 最大 |
43.47 | 14.27 | 20 | 70 |
ドムラちゃんとハード搾りの生産数出現傾向
上記のグラフから、ドムラちゃんは生産数の出方が中心に寄っているようです。
ハード搾りは偏りが分かりませんでした。
ドムラちゃんは正規分布と呼ばれている大変代表的な分布に従っていそうなので、2つの方法で確かめることにしました。
1つは視覚的に確かめるQQプロット。
もう1つは統計的な検定、母集団の正規性についてのw/s検定(critical values of w/s for the normality test、以下w/s検定)です。
正規分布に従うかどうかを調べる検定法はいくつか存在しますが、特別なソフトウェアを必要としない「w/s検定」を採用しました。
QQプロットで視覚的に確かめる
まずはグラフを描いて視覚的に状況を確認しましょう。観測値を正規分布にしたがう場合の期待値をX軸にとって観測値そのものをY軸にとったグラフを描いてみます(QQプロット)。点が真ん中の直線に近ければ正規分布に従うと視覚的に分かります。
ドムラちゃんの場合
グラフが階段状なのは、生産数の幅が非常に狭いことによるものです。滑らかではありませんが、きちんと中心の直線に寄っているため正規分布だろう推察出来ます。
ハード搾りの場合
ハード搾りをQQプロットすると曲線を描いています。これでは正規分布に従うとは言えません。一様分布の際はこのような曲線になります。本当にそうかは確かめていませんけどね。
ハード搾りの生産数を小さい順に並べると、ほぼ一直線になるため、一様分布が支持されました。
w/s検定で統計的に確かめる
ドムラちゃんとハード搾りの両方をw/s検定しました。
具体的な計算方法
検定量=数値の幅/標準偏差
だけです。簡単でしょ!
後は出てきた検定量がw/s検定表の範囲(α<検定量<β)に入るかどうかです。
αβの範囲内に入れば95%の確率で正規分布に従います。
一例
商品を1回作業で50回繰り返して結果を記録し、最大値と最小値を抜き出します。
最大値最小値から数値の幅を計算します。
標準偏差を計算します。
あとは50サンプルサイズなので、計算で出した統計量がα(3.83)~β(5.35)の間に入れば正規分布(に非常に近い分布)とみなせます。入らなければ95%の確率で正規分布ではありません。
ね?簡単でしょ!?
検定表
有意水準0.05
サンプルサイズ | α | β |
10 | 2.67 | 3.685 |
20 | 3.18 | 4.49 |
30 | 3.47 | 4.89 |
50 | 3.83 | 5.35 |
80 | 4.16 | 5.73 |
100 | 4.31 | 5.90 |
150 | 4.59 | 6.18 |
200 | 4.78 | 6.39 |
500 | 5.47 | 6.94 |
出典:Sachs,1972より一部抜粋
ドムラちゃんの検定結果
サンプルサイズ=120
標準偏差=2.32
数値の幅=13(=16-4+1)
検定量=13/2.32
=5.60
サンプルサイズ100のαβ(4.31~5.90)にも150のαβ(4.59~6.18)の間にばっちり入っています。つまり、ドムラちゃんの分布が正規分布であるという帰無仮説を否定出来ず、正規分布(に非常に近い分布)に従うことが分かります。95%の確率でね。
ハード搾りの検定結果
サンプルサイズ=258
標準偏差=14.27
数値の幅=51(=70-20+1)
検定量=51/14.27
=3.57
サンプルサイズ200α(4.78)~500α(5.47)よりも小さい値(棄却域)であるため、正規分布であるとは言えないと結論付けられます。これも95%の確率でね。
ドムラちゃんは正規分布に従い、ハード搾りは正規分布に従いませんでした。
検定の信頼度は95%です。私の信頼度を引いてもまあまあな数値になるんじゃないでしょうか。
考えられること
正規分布に従う作業と、そうでない作業がありそうだということが分かりました。
(未発表ですが、別の屋外レシピ作業は正規分布に従いました。)
作業難易度、職種レベル、屋内屋外作業、あるいは公式、レシピの違いにより分布の形状が異なるのかもしれませんが、現状ではこの差が何故生じたか分かりません。
今後の課題
私が考える今後の課題は、主に2つです。
難易度、屋内屋外、職種レベルの検討
同様の方法をいくつかのアイテムで試してみたいです。
難易度や屋内、屋外作業の差があることで結果が異なるかもしれません。何かしらの傾向を見出すには数多くのデータが必要です。
私の酪農家職種レベルは12ですが、下げることが出来ないので1人では職種レベルによる検討は出来ません。
獲得量アップ条件
屋外作業には特有の変数が存在します。獲得量アップ条件です。私の店舗の周囲にはドムラちゃん獲得量アップ条件である「草原」が広がっています。しかし、効果範囲全てが草原ではありません。これが一部もしくは全部の数値を低くしている可能性がありました。
周囲の屋外作業に影響するマスは赤枠に囲まれた45マスです。
このうちほとんどが草原で38マスで、次いで多い湿地帯が4マスです。
残りは他店が2マス、自店舗が1マスです。
地形名 | 草原 | 湿地帯 | 他店 | 自店舗 | 計 |
マス数 | 38 | 4 | 2 | 1 | 45 |
湿地帯は草資源を多く持っていますが、最大値ではありません。今後はこのあたりを調べることが出来ればいいなあと思っています。
あとがき
私の最終的な目標は、販売業者が少なく、生産者ばかりに偏ってしまっている現状を少し変えてみたい、それだけです。
数少ない販売特化店舗のうち、多くの店舗は改装ループを使って多くのアイテムを作り出して販売しています。自己完結した非常にクローズドな経済構造は、他者と関わりが薄くなり、ゲーム自体の楽しみが減ってしまうのではないかと考えています。これを少しだけ変えてみたいのです。
遠大な目的のため、業種レベルの変化が自身にどう影響して利益をもたらすのか(あるいは何も変わらないのか)が知りたいのです。
その基礎固めに隠しパラメーターである「アイテムレアリティの推定」、のための「アイテムの生産数」を固める必要がありました。
正直、住民が購入する際に参照するアイテムレアリティは(業種レベルの効果も)公開しちゃってもいいんじゃないか?とすら思います。
皆さんが何処まで知っていて、何処から知らないのかが分からないので最初の1歩を踏み出してみましたが、如何でしたか。
質問や疑問、つっこみは出来る限りお答えします。ルビー街やtwitterでお気軽に話しかけてみて下さい。
最後に、ラブリードムラちゃんをよろしくね!トワリズムさんが描いてくれました!ウッシッシ!
参考文献:G・Kカンジ(2009)『逆引き統計学』(池谷祐二ほか訳)講談社
コメント
コメントにはログインが必要です