Japan Blog
Google のサービスや技術に関する最新情報が気になる方へ
川柳の自動生成アルゴリズムの紹介(どうしたら 機械で川柳 詠めるかな)
2009年4月3日金曜日
2009年4月3日
Posted by 大倉 務, 淺川 浩紀 (ソフトウェアエンジニア)
こんにちは。エイプリルフールに 1 日だけローンチした
Google 川柳
、お楽しみいただけましたか?エイプリルフールが終わってしまったのでサービスはもうありませんが、せっかくなのでその裏側をすこしご紹介します。
今回は、Google が人工知能 CADIE を開発し、その CADIE が世界中で面白いサービスを提供するという設定で Google 川柳を提供しました。人工知能 CADIE は架空のものですが、コンピューターによる川柳の自動生成を行ったのは、ウソではありません。
ここでは、その川柳をコンピューターに生成させた手順を簡単にご紹介します。
1. 川柳とは何かを学習する
まず、本物の川柳/俳句を Web 上から集めました。集めた作品を解析し、俳句/川柳にありがちな品詞の並びパターンを学習しました。
2. 「瞬間」を切り取る
川柳/俳句には、「話題」が必要になります。これは、Web ページからランダムに文を抽出し、その中から川柳を生成することで実現しました。
3. 「瞬間」から川柳を切り出す
抽出した文のサブシーケンスのうち、5, 7, 5 の形にマッチするものを川柳の候補とし、学習した川柳パターンを元に俳句らしさを計算しました。
4. 世の中の興味にマッチさせる
ここまでの段階で生成された川柳について、中に含まれている単語が 1 日に何回検索されるかを推定しました。これにより、できるだけ一般的な単語を用いた川柳を選びました。
4 月 1 日にお見せした川柳は、こうして生成されたものから、ユーザーの皆様にお見せするのが憚られるものを人手で除いたものです。また、たまたま表示された際に喜べるように、表示される川柳を 400 種弱に制限しました。(200 個以上見つけた方がいて驚きました!)
この Google 川柳は、昨年のエイプリルフールでご提供したダジャレサーチと同じように、Google の「20% ルール」からスタートしました。昨年の秋にエンジニアリングチームで実施した、Tokyo Engineering Hackathon という 2 泊 3 日の開発合宿で、淺川、大倉が開発しました。「俳句って、いかにも機械が苦手そうだよね?」という話からはじまり、行きのバスの中で俳句/川柳の作り方の本(もちろん人間が詠むためのものです)を読み、3 日間試行錯誤を繰り返して作りました。その後、エイプリルフールに向けていくらかの調整を行い、今回の公開となりました。
川柳の品質を改善するためのアイディアはまだまだたくさんあるので、また何か機会があればより品質を向上させた川柳を皆様にお披露目したいと思います。
ラベル
.org
Accessibility
AdSense
AdWords
AI
Android
Android One
Android Pay
API
AR
Blogger
Browser
campaign
Chrome ウェブストア
Chromecast
CM
COVID
CS Edu
Design
Developer
DevFest
Devices and Services
Doodle
Doodle 4 Google
DoubleClick
Driving Directions
Earth
Engineering
Enterprise
Fitbit
Gboard
Gears
GEO
Glass
Gmail
GNI
Google Account
Google Apps
Google Assistant
Google Buzz
Google Chrome
Google Cloud
Google Code Jam
Google Developer Day
Google Earth
Google for Work
Google Home
Google Home app
Google Maps
Google Now
Google One
Google Pay
Google Photo
Google Play
Google Science Fair
Google SketchUp
Google Translate
Google Wallet
Google アートプロジェクト
Google アシスタント
Google クライシスレスポンス
Google ショッピング
Google で、もっと
Google ニュース
Google プレイス
Google マップ
Google 検索
Google 日本語入力
Google+
Googleレンズ
gTLD
Hardware
HTC
iGoogle
JAXA
MBG
Meet
Motion Sense
MUM
Nest
news
Nexus 7
Nexus Player
OpenSocial
Picasa
Pixel
Pixel 4
Pixel 7a
Pixel Buds
Pixel feature drop
Pixel Fold
Pixel portfolio
Pixel Tablet
Pixel Watch
Playground
Search
Security
SHARP
Soli
Sustainability
Tensor
Tool bar
toolbar
Trend
Wear OS by Google
Women
Women Will
Work Smart
Workspace
YouTube
イノベーション東北、復興支援
イベント
インターンシップ
ウェブレンジャー
エンジニア
エンタープライズ
おみせフォト
カルチャー
クラブ活動
グループ
ごちそうフォト
さがそう
サンタ
ストリートビュー
スペシャルコレクション
スポーツ
セールス
セキュリティ
ツールバー
ディスプレイ
デスクトップ
デベロッパー
ドメイン
トレッカー
パートナー
パートナープログラム
ブラウザ
プログラミング
ヘルプ
マイマップ
モバイル
モバイル Google マップ
モバイル検索
ランキング
リッチ スニペット
音声検索
画像検索
学生
京セラ
教育
検索
広告
高校生
採用
女性の活躍
小笠原諸島
乗換案内
政治・選挙
節電
地図
中学生
東日本大震災
富士山
翻訳
未来へのキオク
未来への働き方コンソーシアム
過去の投稿
2023
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
2022
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2021
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
2020
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2019
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2018
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed
Follow @googlejapan
Follow
メディア関係者向けお問い合わせ先
メールでのお問い合わせ:
pr-jp@google.com
メディア関係者以外からのお問い合わせにはお答えいたしかねます。
その他すべてのお問い合わせにつきましては、
ヘルプセンター
をご覧ください。