Yukihy Life

ゆきひーによる日常生活をアウトプットするブログ 映画・TOEIC・教育ネタとだいぶ物理とWeb制作

キーワードプランナーの数字から検索順位を仮定して記事を書いた後のPV数を推定する式をつくってみた

スポンサーリンク

注:先に言っておきますがわりとゲスい内容なので純粋にブログを楽しんでいる方はブラウザバックをお願いします(ゲス顔)。

言い方は悪いですが、このブログをある程度効率的に運営したいなと思っていたので、Googleアナリティクスを見たりしていろんなデータを見てきました。

運営していく中でかなり欲しかったと思うのが「Googleキーワードプランナーの数字から、実際にどれくらいのPVが見込めるのか」ということでした。いろんなWebマーケティングの本やブログを読みあさっても、「キーワードプランナーでボリュームを見よう!」ということは書かれているのですが、どれくらいアクセスに繋がるのかの指標がなかなか見つけられませんでした。

そこで、昨年の秋ごろに「Googleのキーワードプランナーの数字から、実際に記事を書いた際にどれくらいのページビュー数が見込めるのか」を卒論の合間に見てたりしました。

最近就活関係でいろんな方と話すことがあるのですが、「こういったことをしてきたんです」と話すと、「それ絶対ネタになるよ!」と言っていただけたので、せっかくなので記事にしたいと思います!

キーワードプランナーの数値から記事を書いたときの推定PVを見込む式

先に方程式を書いておくと、こんな感じになりました。

 \displaystyle y = \sum_{i} \frac{a_i}{x_i}

ここで、

  •  yが推定PV
  •  aがキーワードプランナーの数字
  •  xが検索順位

となります。 iはカッコつけて入れただけです。i番目という意味です。

 \sumは複数の検索ワードで順位が狙えるときに単純に足しているだけなので、ざっくり言えば反比例です。えっ、反比例!!?そんな単純なんかよ!?と思いましたが、実際僕も組み立ててみてびっくりこきました。

もうちょっと正確に言えば

 \displaystyle y = \sum_i \frac{0.9528a_i}{x_i^{0.9445}}

という数字になったのですが、データの数も含めてもともとそこまで厳密な数字を求めていたわけではないので、良いかなと思っていました。

(他の人のを見てないのでわかりませんが、)おそらく係数の数字が個人によって結構変わってくるのではないかというところです。導出方法は下に書いてあるので、ご自身のデータと比べて係数をざっくりとでも決まれば、けっこう良い指標になるのでは?と思います。

式の使い方

上の式の使い方を簡単に説明しておきます。

狙いたいワードをキーワードプランナーで打ち込む

まずは自分が狙いたい検索ワードをキーワードプランナーで打ち込み、検索数を調べます。今回は「英語の勉強法」についての記事を書いたとします。

f:id:ftmaccho:20160320231142j:plain

すると、月間検索ボリュームが22000ぐらいだなというのが分かります。

ただ、実際に記事を書くときに、単独のワードを狙っていくことは稀だと思います。「英語 勉強法」以外にも、例えばTOEICについて言及していれば、タイトルにも「TOEIC」をいれて「TOEIC 勉強法」でも狙いにいくかもしれません。

こんな感じで、タイトルを決めるときって「あ〜、この記事は他の検索ワードも狙えるな」と考えると思います。だいたいそういうのを、3つか4つくらい出して同じように検索ボリュームを出します。

f:id:ftmaccho:20160320231527j:plain

「TOEIC 勉強法」はだいたい18100くらいになってます。

式に当てはめる

そうすると、だいたいこんな感じになります。

キーワード 検索ボリューム(a) 検索順位(x) 推定PV
英語 勉強法 22000
TOEIC 勉強法 18100

自分がやってみた感じですと、2〜4つくらいのワードでやると良いです。また、検索ボリュームが4000を下回ると精度が落ちます。検索ボリュームが多い方が当てはまる印象でした。

この後は、仮に記事を書いたときに取れる検索順位を入れていきます。これは実際に書いてみないと分からないものですが、そもそも今回の目的はページビュー数を推定することなので、「1位とれたらどれくらいなんかな〜」って感じで入れてみてもOKです。

仮に「英語 勉強法」で2位、「TOEIC 勉強法」で5位が取れるすんばらしくすごい記事が書けたとします。

キーワード 検索ボリューム(a) 検索順位(x) 推定PV
英語 勉強法 22000 2位
TOEIC 勉強法 18100 5位

そうすると、 \displaystyle y = \sum_{i} \frac{a_i}{x_i}の式から、推定PVはaをxで割れば良いので、割ります。

キーワード 検索ボリューム(a) 検索順位(x) 推定PV
英語 勉強法 22000 2位 11000(=22000/2)
TOEIC 勉強法 18100 5位 3620(=18100/5)

最後に推定PVを足せば、その記事自体の推定PV(y)がでてきます。

ということで、「英語 勉強法」で2位。「TOEIC 勉強法」で5位を取得した記事は、推定14620PV/月 となりました。1記事でこれはかなり多いですね!

(あくまで経験ベースですが、この値が見込みPVの下のラインになることが多いです。実際はもう少し多くを見込めることが多いです。)

式の導出

上の式をどうやって導出したのかを一応書いておきます。かなり長くなるので、面倒な方は飛ばしてください。

アバウトでも良いから出したい

そもそも今回のは、ざっくりとで良いからキーワードプランナーを見てPVを推定したいというものでした。SEOは時間がかかるので、推定PVが分かればその後収益を推定したり、いくらでもつなげることができるからです。

キーワードプランナーの数字から、実際のPVまでの間には、例えばこういった要因があります。

  1. そもそもキーワードプランナーの月間検索ボリュームと、実際の表示回数が当たっているのかの前提条件の検証(これがダメだったら、そもそもキーワードプランナーの値はほぼ当てにならないことが確定してしまう)
  2. 掲載順位とクリック率(CTR)の比較
  3. Google以外からの検索(主にYahoo!)の補正
  4. セッションとPVの差(いわゆるセッション/PV)

といった感じで行いました。

1. そもそもキーワードプランナーの月間検索ボリュームと、実際の表示回数が当たっているのかの検証

最終的には「キーワードプランナー」の数字を見て、「月間検索ボリューム」を予測する訳ですが、これがすでにかなりアバウトなものであったら、推測も何もないじゃないか!ということで最初にキーワードプランナーの数字は実際の表示回数に対応しているのかを確認しました。

結論から言うとこれが実は結構微妙でした。つまり、キーワードプランナーの数字はボリュームの傾向は表していますが、そこまで正確ではないということです。

やり方は、最初にGoogleサーチコンソールの「検索アナリティクス」からデータを最大の999に表示をして、

  • クリック数
  • 表示回数
  • CTR
  • 掲載順位

のすべてにチェックを入れてダウンロードをします。

f:id:ftmaccho:20160326134256j:plain

するとこんな感じで表になっています。クエリに関してはすみません、伏せます笑。(ちなみに、昨年10月に行ったものなのでデータも昨年10月のものです)

f:id:ftmaccho:20160326134552j:plain

そしてこの後にCTR(=クリック数/表示回数)と掲載順位を比較するのですが、その際、掲載順位が10位よりも下のものはCTRが正しく反映されないため、「掲載順位」でソートをかけて10位よりも下のものはデータを消去します。

f:id:ftmaccho:20160326135012j:plain

また、同時に「ゆきひー」や、「Yukihy Life」など、明らかにこのブログを目指してきているのもCTRが正しく反映されないので見つけ次第消去します。

次にこれがかなり面倒なのですが、表示回数の左の部分に「月間検索ボリューム」という欄を作って、「キーワードプランナー」を使って実際に調べ、検索ボリュームをちまちまと入れていきます。

f:id:ftmaccho:20160326135308j:plain

本当は全部やろうと思ったのですが、もう無理だと思いだいたい100個ぐらいまでしかやりませんでしたw。

そしたらここから、このB列のキーワードプランナーから得た「月間検索ボリューム」と、C列のGoogleサーチコンソールから得た「表示回数」を比較します。

ここから

  • (キーワードプランナーから得た)月間検索ボリューム→A
  • (Googleサーチコンソールから得た)表示回数→B

として進め、仮定としてAのまわりにBがいる確率の分布がガウス関数になるとします。

そうするとBの値とAの値の違いを、相対的な意味合いで比べるために

 \frac{B-A}{A}

といった形で計算します(相対誤差)。そしてそれを二乗して平均をとれば、「分散」が求まり、それの平方根をとることで標準偏差が求まります。

f:id:ftmaccho:20160326142605j:plain

標準偏差の下の「相対誤差の平均」は、(B-A)/Aの平均です。平均が0でないことから、すでにAとBがずれていることが分かります^^;。今回の計算式ではAの方が大きくなるので、不等号をメモしています。

これにより、Aのキーワードプランナーの数字をそのまま使うのではなく、

 A+(-0.276A)=0.724A

と7がけくらいで目安にしなければいけないことが分かりました。「うおい!7がけって!どんだけ盛ってんねん!」と思いましたが、これはあくまで僕のデータの、しかも一部しか使ってないので、この値を何ヶ月も出してけば傾向がわかるかもしれません。

(実際、この値は月によってかなり変わります。なので決まった値で補正をすることは難しく、あくまで「キーワードプランナーの値は、そこそこの精度でしかない」ということが分かるだけでした。)

ちなみにデータの確かさで言うと、計算は省略しますがr値はだいたい0.772ぐらいになりました。一般的にはかなり相関があると言われている値です。

2.掲載順位とCTR(クリック率)の関係

このデータに限れば、実はネット上にたくさん転がっています。しかし見る記事によって値がかなり違くて、「本当にあってるのか?」とちょっと疑っていました。

実際には最初にダウンロードしたデータの「掲載順位」と「CTR」でグラフを作れば良いので簡単です。こんな感じになりました。

f:id:ftmaccho:20160326144645j:plain

データ数は約1000個 R値で言うと「多項式」で近似したほうが高いのですが、ほとんど変わらなかったのと式が

 y = 0.4886x^{-0.9445}

ってほとんど反比例じゃん!っと研究室の友人とテンション上がってハイタッチしたので、その後の計算も楽になるしもうこっちでいくことにしました。

3. Google以外からの検索(Yahoo!など)

これ全体ではGoogle検索でしか入っていなく、Yahoo!経由でくる人もいるのでざっくりと見なければいけません。

自分の流入を見ると、だいたいGoogle:Yahoo!が2:1ぐらいでした。

f:id:ftmaccho:20160326151127j:plain

なので先ほど出した式に、Yahoo!の分を入れるために1.5倍して、

 y=0.7329x^{-0.9445}

となりました。(もはやこのあたりから、個人のブログによるところが大きくなってきます)

4.セッションとPVの差

最後に、今まで出したのはセッションなので、それをPVにします。僕のはだいたい1.3なので、それをかけて

 y=0.9528x^{-0.9445}

となり、最初に出した式の完成です。最初にやった7掛け補正は、月によって大きく変わるため入れることができませんでした(標準偏差を利用し、「◯◯〜◯◯に入る確率が68%になるようにする」といったようなことはできますが、面倒なのでやめました)

最後に

自分が行った感じ、5回中4回は当てはまるぐらいの形になりました。また、ほとんどの場合計算した値よりも実際のPVの方が多くなったので、「だいたい最低でもこんぐらいはくるだろう」といった目安になると思います。

基本的に、検索ボリュームが多いキーワードでやったほうが、正確に反映される傾向があります。

タイトルのつけ方だったり、他にも出したらきりがないくらいパラメーターがあるので、参考程度にしていただけるとといった感じです。

教授が帰った後に研究室のホワイトボードを広々と使う様子

f:id:ftmaccho:20160326205945j:plain