2019年07月12日

検索エンジンでブログ記事が検索できるのか(5)

 昨日の記事
2019.7.11 http://o-tsu.seesaa.net/article/467840797.html
の続きです。
 第3に、過去12年分の記事を調べたので、時間的変動についても検討してみました。
 1年ごとに区分して、各ブログ記事が検索できたか否かを数えました。2回検索した場合は1回目だけを対象としました。Yahoo! と Google のどちらかで検索できた場合は○としました。
 結果は、以下の通りです。

西暦 ○  ×
─────────
2019 4  2
2018 9  3
2017 8  4
2016 9  3
2015 9  3
2014 7  5
2013 8  4
2012 9  3
2011 6  6
2010 6  6
2009 7  5
2008 8  4
2007 4  3
─────────
合計 94 51

 この結果から、記事が書かれた年代は検索の可否とほぼ無関係であることがわかります。
 合計で 94:51 ですから、オーツが書いたブログ記事のほぼ3本中の2本は検索できると言っていいでしょう。
 時間的変動がないことは、実は困ったことになります。なぜ、一部の記事は検索でき、一部の記事は検索できないか、合理的な説明ができないからです。
 結論がない話ではありますが、とりあえず、これ以上のことはいえない段階です。

 この件は、さらに追加していろいろ調べてみたいと思います。
posted by オーツ at 03:22| Comment(6) | パソコンとIT | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
直接は関係ないかもしれませんが、検索エンジンのアルゴリズムの参考まで。
Posted by anut at 2019年07月12日 12:11
anut 様
 検索エンジンのアルゴリズムがこのようなことであることは了解しています。
 ただし、今回の一連のブログ記事は、あるキーワードを入れて検索したときに、オーツの記事のランクがどうなるかを知ること(さらにはそのランクを上げること)が目的ではなく、仮にランクが低くても、検索できるかどうかを調べることが目的です。
 目的が違います。
Posted by オーツ at 2019年07月13日 04:58
記事が検索に出ない原因の1つは、「オーツ」というキーワードの他との競合にありそうです。

> 2015.10.15 [飲食物] 第3のビールでおいしいものはどれか
> "第3のビール" "おいしい" "どれ" "オーツ" → ××

これが出ないのは「オーツ麦」を含むページに食われた結果で、

> 2018.11.15 [ニュース時評] 消費税の軽減税率の議論
> "消費税" "軽減税率" "議論" "オーツ" → ××

これが出ないのは「ボーモル=オーツ税」なるものに食われた結果のように思われます。
Posted by 98 at 2019年07月13日 21:30
98 様
 興味深いコメント、ありがとうございます。
 この点、さらに考えてみたいと思います。
 検索エンジンのアルゴリズムにも直接関わる話ですね。
Posted by オーツ at 2019年07月14日 04:36
それから、月単位のページが表示される場合も検索できていると考える必要があるように思います。と言うのは、単独の記事のページとそれを含む月単位のページとでは、当然後者のほうが指定したキーワードを多く含みますから、そちらのほうが検索者にとってより有用という可能性があり、したがって、検索から漏れているわけではないと思うからです。

文字数が少ないページなのに指定キーワードを含むというのも評価のポイントになり得ると思いますが、経験上やはりキーワードを多数回含むページのほうが有用であることのほうが多いように思います。
Posted by 98 at 2019年07月14日 07:04
98 様
 再度のコメント、ありがとうございます。
 この問題、なかなか悩ましい問題です。
 月単位のページが検索されるほうが望ましいという考え方もあるとは思いますが、であるならば、いつも月単位のページが(単独のページよりも)優先されて表示されてしまいそうです。現実は、そうはなっていません。
 月単位のページだけが検索されて、個別の記事が検索されない例はあまりありません。
 このあたり、再度検討してみたいと思います。
Posted by オーツ at 2019年07月15日 04:41
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。