『YahooキーフレーズAPI』を活用して不毛なタグ付けを自動化する

そのような単純作業には、YahooキーフレーズAPIを利用すれば幸せになれる。

『Yahooキーフレーズ抽出API』は、日本語文を解析し、特徴的な表現(キーフレーズ)を抽出するAPI

via: テキスト解析:キーフレーズ抽出 - Yahoo!デベロッパーネットワーク 1

キーフレーズ抽出API

例えば、以下のような名言データがあったとして。

嘘をついた途端に、良い記憶力が必要になる。ピエールコルネイユ

これにAPIを適用した結果↓キーフレーズが抽出される。

ピエールコルネイユ
良い記憶力
途端

そしてその抽出されたキーフレーズをタグとすればいい。

嘘をついた途端に、良い記憶力が必要になる。ピエールコルネイユ#ピエールコルネイユ#良い記憶力#途端


これで仮にデータが数万行あったとしても、その行数だけ処理をぶん回せば...

高笑いをする海原雄山

その他にも...

記事のタイトルから抽出

例えば、ニュース記事のタイトルからキーフレーズを抽出。

朝日新聞、靖国問題で社内乱闘…40代社員が暴行

社内乱闘
朝日新聞
靖国問題
暴行

ちょっとした文章から抽出

リクエストの最大サイズが100KBとのことなので日本語で50文字くらいまでの文章なら無問題。

彷徨う夢の天神に生温さを望み行交う人の大半に素早く注目をさせ其の欲が満たされたあたしの眼にも果てることない夢映されるのか

天神
大半
あたし
夢
注目
欲
眼