2019-02-27から1日間の記事一覧

日本語テキストをif-idf+cos類似度で類似文章検索

はじめに 日本語文章の類似度検索をする機会があったのでここにまとめます。 やったこととしては日本語文章でのtf-idfベクトル化、cos類似度を使いました。 日本語文章にはlivedoor ニュースコーパスを使います。 実施手順 日本語文章の取得 tf-idfベクトル…