かわみのメモ帳

趣味に関するメモを書いていきます。

普通の文章から川柳を自動で見つけよう その3(実行結果編)

おはようございます。かわみです。
実際に川柳の自動検出器を実装して、試してみました。その結果報告です。
というわけで川柳の自動検出ですが、この章で一旦区切りとなります。かわみ先生の次回作にご期待ください。

では早速実行結果を見ていきましょう、といきたいところですがまずは新たなルールの説明から。

新たなルール

前回の予告通り、制定すべき新たなルールが見つかりました。
川柳や俳句は「上五・中七・下五」という三つのパーツによって構成されますね。今回、それぞれのパーツの冒頭に助詞が来る場合を除外しました。 前回までに出した例などでは、それぞれのパーツがそもそも助詞から始まっている場合もあったんですがね。弾いたほうが綺麗になりました。 というよりかはむしろ弾かなければ綺麗でなかったのです。

実行結果

さて、お待ちかねの実行結果です。どんな川柳が検出されたのでしょうか。

走れメロスより川柳検出

自然言語処理系の実験台として度々登場する(?)「走れメロス」より川柳自動検出を行いました。

図書カード:走れメロス

f:id:kawamix:20170328155923p:plain

ざっとこんな感じです。
「おまえらは わしの心に 勝ったのだ」 なんて格好良くないですか。これも川柳になってます。

日本国憲法より川柳検出

特段政治的意図はありませんが、川柳が検出された場合におけるギャップを考えて日本国憲法からも川柳検出を行なってみました。

f:id:kawamix:20170328160519p:plain

この辺の「〇〇の 自由はこれを 保障する」ゾーンとか好きです。これも五七五になってます。

まとめ

このシリーズに記した方法で、ひとまず川柳の自動検出はできました。 ただし、それぞれの句のはじめに動詞の活用形が来ている場合など、まださまざまに検討できる部分はあるでしょう。 そういったものも、人間の読み方次第でちゃんと川柳っぽくなるので、このシリーズはこの章でいったん区切りです。
またこのシリーズでは形態素分割に基づいた方法をご紹介しましたが、文節に基づいた検出方法など様々にあると思います。 よって皆さんも革新的な川柳自動検出方法をお考え下さい。考えた暁にはご一報ください。

おまけ

私のクローンのTwitterアカウントで、私のTLに流れてきたツイートから川柳自動検出を行なっていました。色々な川柳が検出されましたので、気になる方は そちらもどうぞご覧あれ。

twitter.com