昨日の記事
2019.7.11 http://o-tsu.seesaa.net/article/467840797.html
の続きです。
第3に、過去12年分の記事を調べたので、時間的変動についても検討してみました。
1年ごとに区分して、各ブログ記事が検索できたか否かを数えました。2回検索した場合は1回目だけを対象としました。Yahoo! と Google のどちらかで検索できた場合は○としました。
結果は、以下の通りです。
西暦 ○ ×
─────────
2019 4 2
2018 9 3
2017 8 4
2016 9 3
2015 9 3
2014 7 5
2013 8 4
2012 9 3
2011 6 6
2010 6 6
2009 7 5
2008 8 4
2007 4 3
─────────
合計 94 51
この結果から、記事が書かれた年代は検索の可否とほぼ無関係であることがわかります。
合計で 94:51 ですから、オーツが書いたブログ記事のほぼ3本中の2本は検索できると言っていいでしょう。
時間的変動がないことは、実は困ったことになります。なぜ、一部の記事は検索でき、一部の記事は検索できないか、合理的な説明ができないからです。
結論がない話ではありますが、とりあえず、これ以上のことはいえない段階です。
この件は、さらに追加していろいろ調べてみたいと思います。
検索エンジンのアルゴリズムがこのようなことであることは了解しています。
ただし、今回の一連のブログ記事は、あるキーワードを入れて検索したときに、オーツの記事のランクがどうなるかを知ること(さらにはそのランクを上げること)が目的ではなく、仮にランクが低くても、検索できるかどうかを調べることが目的です。
目的が違います。
> 2015.10.15 [飲食物] 第3のビールでおいしいものはどれか
> "第3のビール" "おいしい" "どれ" "オーツ" → ××
これが出ないのは「オーツ麦」を含むページに食われた結果で、
> 2018.11.15 [ニュース時評] 消費税の軽減税率の議論
> "消費税" "軽減税率" "議論" "オーツ" → ××
これが出ないのは「ボーモル=オーツ税」なるものに食われた結果のように思われます。
興味深いコメント、ありがとうございます。
この点、さらに考えてみたいと思います。
検索エンジンのアルゴリズムにも直接関わる話ですね。
文字数が少ないページなのに指定キーワードを含むというのも評価のポイントになり得ると思いますが、経験上やはりキーワードを多数回含むページのほうが有用であることのほうが多いように思います。
再度のコメント、ありがとうございます。
この問題、なかなか悩ましい問題です。
月単位のページが検索されるほうが望ましいという考え方もあるとは思いますが、であるならば、いつも月単位のページが(単独のページよりも)優先されて表示されてしまいそうです。現実は、そうはなっていません。
月単位のページだけが検索されて、個別の記事が検索されない例はあまりありません。
このあたり、再度検討してみたいと思います。