このノートブックでは、完全に私たちの追求に基づいてヒント N の投稿を提案する簡単なアルゴリズムを作成するための理想的な戦略をたどることができます。 これを再度実行するために必要な手順は次のとおりです:
- HN API から N 個の投稿を蓄積し、チェックリストにまとめます。 -reminiscence
リストをベクトル化し、レイズフレーズを押しのけてガイドラインを浄化します Get a TF-IDF (term frequency inverse yarn frequency) の構成に従う行列
- virtualenv ml
- インストールに必要なもの
pip setup -r necessities.txt
ノートをざわざわ
)
jupyterノートブック
すべてのセルを順次啓発し、最後のセルは多くの場合 UI です。 優勢なセルは、API から結果全体を取得することを選択する可能性があります (巨大な最適化ではありません)
結果をキャッシュするためにそのセルを一度高速化する必要があるため、将来のクエリは簡単に実行できます。