Noriyasu_Katano's blog

脳科学や量子力学、政治や戦争に関して、日々の感じた雑感を書いていきます。

「はてなブログで関連記事を表示する」をパワーアップ

power

 

前回作成した関連情報は最新の記事を表示させるものでした。なので、関連というより新着情報でしたが、今回そのスクリプトをパワーアップして、タグの関連度により、表示内容を変える様に設定してみました。
noriyasu-katano.hatenablog.com

 jQueryの設定は前回同様で、今回は記事に使用しているタグを抽出し、さらにRSSで配信されている記事のタグと比較して、使用しているタグが多い順に表示する様にしています。

詳しくはこちらの記事で紹介しています。

qiita.com

今回の関連度はタグというものを比較することで、その記事と比較対象の記事の関連度を計測しています。記事を書いているのが私一人で書いているので、タグ自体に含まれるなんとなくのメタ情報は統一されています。なので、おおよそその記事の関連度は近いものだと言えますが、それでもその日の気分であったり、情報の齟齬は多少発生していると思います。

記事の関連度を考える

記事の関連度を正確に考え、その記事の内容と他の記事の内容の関連性がどのくないなのかを計測するのは簡単な様で、非常に難しく奥の深いことだと言えます。

例えば、単純なところで「ペイビング」の記事も挙げていますが、私のブログでは、「ペイビング」というアーカイブがなく「DIY」でまとめている。これではペイビングを見に来た人にはあまり興味のない話題がまとまってしまっている。

記事を読んだ後でも、この関連性では、ユーザー心理とはかけ離れた関連性になり記事間の回遊度も低いと言える。今回改善した関連情報表示は、前回よりも改善しているが、回遊性の向上を目的に考えると、かけ離れていると言える。

次回の改善点

改善点ではどの様にした方が良いのか。私のブログでは、検索エンジンからの流入が半数以上になります。つまり、何か気になっているキーワードから流入していると思います。とすると、そのキーワードに関連する情報をユーザーは探しているので、もしかしたら、タイトル通しの関連度の方が重要なのかもしれません。

となると、次回の改善点としては記事タイトルのキーワードを比較して関連度を数値かする方が良いかもしれません。

ビッグデータを活かす 技術戦略としてのテキストマイニング

ビッグデータを活かす 技術戦略としてのテキストマイニング