1. SIS Lab
  2. >
  3. Blog
  4. >
  5. 文書推薦

文書推薦

更新日:2019.04.27 作成日:2016.08.12

Hugoで関連記事を表示させるためは、ある記事がどの記事と似ているかを機械的に処理する必要があります。では、この判断をどのようにすればいいのでしょうか?

この記事に書いてあること

  • 関連記事を出すために考えること
  • 文書推薦のための手法(コンテンツベース、協調フィルタリング)
  • 実装方法
  • word2doc

word2doc

名前は聞いたことがあったが、なんのためにどうやって使うのか全然わからなかった。

文書推薦とは?

  1. コンテンツベース
  2. 協調フィルタリング

コンテンツベースとは、文章の内容を元に判断するアルゴリズムであり、

協調フィルタリングとは、Amazonのレコメンドエンジンのように誰々がオススメするものみたいなイメージを持ちました。

TF-IDFによる文書推薦

以下の「プログラマのための文書推薦入門」は、分かりやすかったので一読をお勧めします。

プログラマのための文書推薦入門

あとは、以下のブログで、コードを見ながら雰囲気を掴みました。

Pythonでcos類似度とTF-IDFを用いた文章の類似度算出 - 元理系院生の新入社員がPythonとJavaで色々頑張るブログ

スポンサーリンク

Related contents

TECH

2016.09.18

building machine learning systems with python

TECH

2016.09.06

Hugoで人気記事を表示するためJSONを返すAPIサーバを作りData-driven Contentを試してみた

TECH

2016.08.13

PythonでTF-IDFによる文書推薦

TECH

2016.08.11

Hugoで関連記事を表示する方法

TECH

2017.06.18

EDINETとXBRLとは何か?Pythonで財務諸表のデータを取得する

TECH

2012.01.28

短縮URLを展開する

TECH

2011.11.21

Pythonのループの書き方いろいろ

TECH

2011.11.15

Pythonでスクレイピングに挑戦。〜mixiの日記をEvernoteへ放り込みたい〜