しゅれでぃんがーの、ぬこ。

どこにでもいて、どこにもいない。

統計検定2級に合格したのでやったことを書く

 

 

この記事はFUN Advent Calendar 2020 4日目の記事です。

adventar.org

 

こんにちは、しゅれぬこ(@syurenuko)です。

2020年9月に受験した統計検定2級(cbt方式)に合格したので、合格するまでにやったことを書いていきたいと思います。

統計検定2級の受験を考えている方々の参考になれば幸いです。

 

 

統計検定2級とは

www.toukei-kentei.jp

 

統計検定は、日本統計学会が実施している統計に関する知識や活用力を評価する全国統一試験です。

その中でも2級は「大学基礎統計学の知識と問題解決力」を対象としています。

 

あくまで個人的見解ですが、2級は「"統計的"にデータを見ることができる」と胸を張って言える最低限のラインだと思います。

(ある確率分布に従うデータから適切な検定方法を選んで検定を行う問題など2級から本格的に出題されるのがその理由です)

 

また試験方式は2級の場合だとcbt方式とペーパー方式の2種類があり、合格点はcbt方式が60%以上でペーパー方式が70%以上の点数、合格率は大体45%前後です。

 

大まかな対策

受験を決めたのが8月初旬だったので約1ヶ月程の準備期間でした。

統計検定2級は確率分野3割、統計分野7割の割合だと言われています。

 

とりあえず初見で解いてみた過去問は20~30%くらいの点数。

確率には自信があったので捻った問題じゃなければまず解ける、データ分布などの高校の数A範囲に入る問題も一応解けるといった感じです。

統計分野に関しては特に検定などはほぼ手付かずなのでほとんどゼロからのスタートといった感じでした。

 

とりあえず過去問で傾向を掴んで、良さそうな参考書等で合格点に必要なレベルに近づけていく戦略です。

 

使った参考書

この2冊です。

f:id:syurenuko:20201204144507j:plain


 まずは過去問集です。これが無いと始まりません。 

日本統計学会公式認定 統計検定 2級 公式問題集[2017〜2019年]

 

ペーパー方式で実施された過去問3年分計6回の過去問が解答解説付きで載っています。

解説が充実してるのでこの本に関しては困ることは無いと思います。

  

2冊目は「基本統計学(第3版)」です。

基本統計学(第3版)

  

この本がなければ合格レベルに達することができなかったと言っても過言ではないくらい良い参考書でした。

何が素晴らしいのかと言うと、「標本分布→推定→検定」と明確に順序立てて内容が進んでいくことです。

 

この順番で学習することで例えば仮説検定の場合だと、単にp値やt値の大きさで採択棄却を判断する作業的なものだという認識では無くなります。

 標準化した検定統計量が例えばZ>1.96かZ<-1.96の範囲にあれば帰無仮説を棄却し対立仮説を採択する、というのが仮説検定のセオリーかと思いますが、機械的なこの作業のみだと仮説検定が何をやっているのかという全体像が非常に見えにくいです。

 

仮説検定は、帰無仮説が正しいという確率分布である事象が起きる時それは信頼区間から外れているかどうか、帰無仮説が正しいのに帰無仮説を棄却(第一種の過誤)してしまう確率が十分に低いかどうかということを判断しているんですよね。

そんなの当たり前じゃん、という話ですがこれを感覚的に掴むのは私にとって非常に難しいものでした。標本分布を頭の中(もしくは紙の上)に描き、面積と確率と統計量を対応させて考えることで初めて理解しました。

すると「あれ、この数字よりも大きい時が棄却だっけ採択だっけ?」みたいに悩むことが無くなりました。

 

当然これらのことは一朝一夕では身につくものではないので、「標本分布→推定→検定」のサイクルを何度も繰り返し自分のものにしました。反復は力です。

 

またこの本は演習問題も充実しているので問題不足に悩むこともありません。

本当に素晴らしい参考書です。

強いて欠点をあげるなら演習問題の解答を出版社HPからダウンロードするタイプってことですかね、、、(巻末付属にして欲しかった)

 

当然この本以外にも良書はあると思うので「あっ、この本良さそう!」と思ったら迷わず買って読んでみるべきです。

(重要なのは今の自分に実力レベルに合った本を探し、それを自分のものにすることだと思います。)

 

確率分野ですが、前述の通り確率は自信があり対策はあまり必要ないと感じたので、「基本統計学」で申し訳程度に割かれている確率の項目の練習問題を少し解いて対策は終わりにしました。私と同じように確率に自信があるならば後述する統計Web等などでサラッと勉強して試験に臨むのもアリだと思います。

(確率分野には有益な助言ができないので対策法は他の方の記事をお願いします)

 

各所でおすすめされている統計Webです。自分もおすすめです。

bellcurve.jp

 

2級範囲はほぼ網羅されている他、練習問題も解答解説付きで公開されています。

さすがにこのWebページだけで合格するのは厳しいと思いますが、統計検定2級の相場感を掴むのには最適だと思います。(実際はこれよりもう少し踏み込んだ内容)

今回使用した参考書の「基本統計学」には2級出題範囲の分散分析に関する記述が無かったので、自分はこのWebサイトで勉強しました。

 

勉強のコツ

検定統計量、任意のX%の信頼区間を即座に出せる(導出の方針が立つ)というのが合格のカギです。これができなければ試験本番で合格点に持っていくことは難しいと思います。

これには対象となるデータの平均と分散がいくつでどのような分布に従うのかを理解しているというのが前提条件です。

 

このデータは平均がいくつ、分散がいくつで、、、、

確率分布は正規分布に従うのか、自由度いくつのt分布に従うのか、それとも別の分布に従うのか、、、、

 

ということを常に意識して問題に取り組む必要があります。

 

また標本分布を頭の中に思い描き、与えられた分布表から任意の区間の確率をすぐに出せるようにしておく必要があります。即席で書いたので雑ですがイメージです。

(光源どうなってんねん)

f:id:syurenuko:20201204171735j:plain

まずは標本分布と確率、統計量の関係に存分に親しみましょう。時間をたっぷりかけるべきです。

推定、検定はその延長線上にあります。

 

また回帰の問題ですが、回帰係数等を計算しなさいという問題ではなく、統計ソフトウェアの出力結果を見せられて適切な選択肢を選べというのが中心になってくるため、統計検定のためだけの独自の対策が必要です。

対策ですが単回帰、重回帰分析の知識をある程度入れた後、過去問を数年分解いて傾向を掴み、足りないと思った部分を参考書ウェブサイト等で学習するのが近道だと思いました。過去問重視です。自分にはこれ以外の有効な対策が思いつきませんでした。

ここら辺に関してはあまり捻った問題は出さない(というか出題される問題のレパートリーがそこまで多くない)ので頑張れば得点源になると思います。 

 

受験当日

ここまで書いて書き忘れてましたが、統計検定は電卓の持ち込みが可能です。

(よほど計算に自信があるという人でない限り電卓の持ち込みは必須です)

 

自分はこれを機にマイ電卓を購入しました。

高いものを買う必要はないですが、分散から標準偏差を出す時など√計算を多用するので√計算機能があるものがいいと思います。

f:id:syurenuko:20201204151556j:plain

 

問題を解いていて感じましたがペーパー方式の過去問と若干の傾向の違いは感じました。

細かく書くと問題の形式が一部違ったり、知識問題がペーパー方式よりも幾分か多かった気がします。 ですが、きちんと対策しているなら気にならない程度の差異です。

 

解いている中でどう検定統計量を出したら良いのか検討もつかない問題などがありましたが、統計検定は2割ほど難問が紛れてるというので難しいのは後回しにしてできる問題中心に解き続けました。

 

問題数の割に90分の試験なので時間が余るかな、と初めは思っていましたが計算ミスや読み違いは無いかなど慎重に解き進めていったため見直しも含めて90分で丁度良い時間に終わりました。

 

結果

cbt方式なので結果はすぐに出ます。

f:id:syurenuko:20201204171053j:plain


合格しましたが、結構ギリギリの点数でした。

1ヶ月程度の勉強だと理解が粗い所もあったのでまぁ妥当な結果かなと思います。

 

反省点ですが、知識問題は確実に取れるようにしておくべきですね、、、

 

合格後

合格から3ヶ月ほど経ちましたが、統計に関する勉強は続けています。

勉強するたびに多くの発見があり、あぁ受験した時には本当に理解が足りなかったんだなぁと思わされる日々です。

(上述した勉強のコツなどは当時の自分に足りなかったことなどの反省点も踏まえて書いています)

 

今2級の問題を解けば8割以上は安定して取れるくらいには成長したのでは(と思いたい)

 

あと統計が楽しいです。

 

後期に入り大学の講義で実験があったのですが、レポートで実験結果を元に検定しなさいと指示があった時「これは試行回数が多いから正規分布と近似して平均値の差の検定やればいいのか」とすぐに見通しを立てられましたし、

回帰係数に関する内容のレポートが出た時には、決定係数の知識を用いて「この回帰モデルは実験で得られたこのデータにこれだけ当てはまりがいいです」と定量的に示せた瞬間は気持ちよかったです。

 

どれも初歩の初歩ですが、これは統計検定2級レベルの知識がなければ確実に苦手意識を持っていた分野だろうと思います。

  

今後ですが、時系列解析とノンパラメトリック分析に興味があるのでそれらに繋がるようことをやっていきたいです。

次は準一級ですが、多分受けると思います。

 

終わりに

統計は数学とはまた違う非常に独特な世界だと思います。

かなり抽象的で掴みにくいですが、統計は非常に優れたツールです。

 

一度腰を入れて勉強すると世界の見え方が変わってくる...とは言い過ぎかもしれませんが広範囲の分野にそれくらいの影響を与える力を持っているのが統計学

 

あなたも統計検定をきっかけに統計の世界に足を踏み入れてみませんか?というお誘いの記事でした。

 

 

合格から1ヶ月半後に来た賞状

f:id:syurenuko:20201204171153j:plain