4月 « 2017 « shell-mag

機械学習で石川啄木を蘇らせる　最終回（vol.46掲載）

投稿日：2017.04.25　｜　カテゴリー：　記事

written by 高橋光輝

様々なアルゴリズム・機械学習をスマートに組み合わせて未完の短歌の補完を目指した人気連載「機械学習で石川啄木を蘇らせる」。シェルマガでは同人誌から手法を発展させ、新たに記事を書き起こしてもらいました。

連載全体を俯瞰するまとめ回となった最終回を公開します。ぜひお楽しみください！

本連載のもとになった同人誌の内容は、以下のURLから閲覧が可能です。（編集部）
https://sunpro.io/c89/pub/hakatashi/introduction

遂に、機械学習で石川啄木が帰り来れり

こんにちは。高橋光輝（HN:博多市）です。今回は連載「機械学習で石川啄木を蘇らせる」の最終回として、今までに生成した、「啄木の短歌」と「ダミーの短歌」の素性ベクトルをもとに、「啄木らしさ」を学習します。その後前々回作成した「最後の一首」候補の短歌を分類器にかけ、最も「啄木らしさ」の高い一首を、復元された「最後の一首」とします。
さて、前回までの作業で「啄木の短歌」と「ダミーの短歌」の素性ベクトルを抽出し、それぞれの短歌が持つ特徴を100次元のベクトルデータに変換することができました。このように入力データを正規化し形式を揃えることによって、機械学習にとって扱いやすいデータになります。今回は「啄木の短歌」と「ダミーの短歌」を正確に分類できる分類器を作成することによって、擬似的に「啄木らしさ」の学習を行っていきます。
以前お話したとおり、分類問題は機械学習の最も基本的なタスクです。機械学習の草創期から現在に至るまで非常に多くのモデルが提唱されてきました。この連載のもととなった記事では多項ナイーブベイズ分類器を用いて分類を行いましたが、今回の連載では線形サポートベクトルマシンを用いた分類器を使用することにしました。一般に機械学習においてどのようなタスクにどのような手法が向いているのかというのを理論的に示すのは難しく、パラメーターの調整次第でいくらでも性能が変化しうるというのが機械学習の難しい部分です。今回の場合も理論的にどうこうというよりは試行錯誤を重ねたうえでの選択となっていますので、このあたりの説明の足りない点はどうかご容赦ください。

SVMをこのごろ気になる

さて、サポートベクトルマシン、略してSVMというのは少しでも機械学習を齧ったことがある方なら一度は聞いたことのある名前でしょうが、あらためて軽く解説を行いたいと思います。
SVMはおそらく、数ある機械学習のモデルの中でも特に直感的に理解しやすいモデルです。図1のように、ベクトル空間上に分類したい2種類のデータが点在する状況を考えます。これらのデータを元に未知のデータに対して分類を行うには、ベクトル空間のどの部分がどの種類のデータの領域なのかを定める境界面、つまり識別面が必要になります。

図1：SVMによる識別面の設定
SVMはこの識別面を、それぞれのクラス中で最も識別面に近いデータまでの距離、つまりマージンが最大化されるように線を引きます。この識別面の具体的な引き方を計算するには線形代数の知識が必要であるためここでは省略しますが、通常のデータでは入力されたデータからこのような識別面の解を一意に求めることができます。これが線形サポートベクトルマシンにおける「学習」です。
こんな単純なモデルで本当に「啄木らしさ」が学習できるのかと疑問に思うかもしれません。実際、線形SVMによる分類は名前の通り線形であり、非線形な処理を含まないため単体では表現力に乏しいとされています。しかし、今回分類するデータは、word2vecとsentence2vecを用いてベクトルに落とし込む段階ですでに言語の意味論的な部分をベクトル空間上に抽象化していると考えられるでしょう。word2vecによる事前学習を行ったデータがSVMやK-meansなどの比較的単純な手法でも非常に高いスコアを上げることはword2vecを提唱した論文でも示されており、これが今回のケースにも当てはまります。つまり、単語からベクトル空間へのよく学習された写像関係においては、たかだか100程度の次元で言語が持つ複雑な意味論的モデルを十分に表現できるということであり、この点からもword2vecの優秀さを伺うことができます。

SVMにさはりてみるかな

さて、話は脱線しましたが、ここからは実際にSVMを用いて「啄木の短歌」と「ダミーの短歌」を分類する分類器の学習を行いましょう。今回はscikit-learnというライブラリを使用します。scikit-learnは、機械学習の様々なモデルや、機械学習をする上で便利なツールが1つのパッケージに実装したライブラリであり、多種多様な機械学習を手軽に試せるため、機械学習の定番的なライブラリとなっています。一方、速度などの点では他のライブラリにやや劣っていますが、今回は学習するデータ数が比較的少ないため問題にはならないでしょう。
scikit-learnをインストールするために、次のコマンドを打ち込んでください。

$ pip install scikit-learn

1	$ pip install scikit-learn

では、コードを書いていきます。いつも通り、Makefileの最初にリスト1のような行を加えてください。

.PHONY: print-predicted-tanka
print-predicted-tanka: predict_takuboku_tanka.py tanka-dummy-vectors.txt tanka-takuboku-vectors.txt tanka-vectors.txt
	$(PYTHON) $^

.PHONY: print-predicted-tanka

print-predicted-tanka: predict_takuboku_tanka.py tanka-dummy-vectors.txt tanka-takuboku-vectors.txt tanka-vectors.txt

$(PYTHON) $^

そして、predict_takuboku_tanka.pyというファイルを作成し、次のように記述します。

# -*- coding: utf-8 -*-

import sys
import csv
from sklearn.svm import SVC
from sklearn.model_selection import cross_val_score
import numpy as np

# 引数の数をチェック
if len(sys.argv) != 4:
    print('This program must be called with 4 arguments')
    sys.exit()

# 引数からファイル名を取得
[this_file, dummy_vectors_file, takuboku_vectors_file, tanka_vectors_file] = sys.argv

# ファイルから短歌のベクトルデータを読み取る
dummy_vectors = np.loadtxt(dummy_vectors_file, delimiter=' ')
takuboku_vectors = np.loadtxt(takuboku_vectors_file, delimiter=' ')
tanka_vectors = np.genfromtxt(tanka_vectors_file, delimiter=' ', dtype=None)

# ダミーの短歌と啄木の短歌を結合して入力データとして整形
X = np.concatenate((dummy_vectors, takuboku_vectors))
y = np.concatenate((np.zeros(len(dummy_vectors)), np.ones(len(takuboku_vectors))))

# 学習精度を測るための分類器を用意
pre_classifier = SVC(kernel='linear')

# 5分割交差検定で学習精度を計測
scores = cross_val_score(pre_classifier, X, y, cv=5)

# 計測したスコアを報告
print('SVM Score:', scores.mean())

# 同じパラメータで今度はすべての入力データを用いて学習を行う
classifier = SVC(kernel='linear', probability=True)
classifier.fit(X, y)

# 「最後の一首」候補の短歌をラベルデータとベクトルデータに分割
tanka_vectors_labels = np.array([list(row)[0] for row in tanka_vectors])
tanka_vectors_data = np.array([list(row)[1:] for row in tanka_v
ectors])

# 分類器を用いて学習し、それぞれの「啄木の短歌らしさ」を推定する
proba = classifier.predict_log_proba(tanka_vectors_data)

# 「啄木の短歌らしさ」の高い順に並べる
sorted_proba = np.array(sorted(zip(proba, tanka_vectors_labels), key=lambda r:r[0][1]))

# 上位30件を報告
print('\n'.join(['{0:>2}. {1}'.format(i + 1, p[1].decode("utf-8")) for i, p in enumerate(sorted_proba[:30])]))

# -*- coding: utf-8 -*-

import sys

import csv

from sklearn.svm import SVC

from sklearn.model_selection import cross_val_score

import numpy as np

# 引数の数をチェック

if len(sys.argv) != 4:

print('This program must be called with 4 arguments')

sys.exit()

# 引数からファイル名を取得

[this_file, dummy_vectors_file, takuboku_vectors_file, tanka_vectors_file] = sys.argv

# ファイルから短歌のベクトルデータを読み取る

dummy_vectors = np.loadtxt(dummy_vectors_file, delimiter=' ')

takuboku_vectors = np.loadtxt(takuboku_vectors_file, delimiter=' ')

tanka_vectors = np.genfromtxt(tanka_vectors_file, delimiter=' ', dtype=None)

# ダミーの短歌と啄木の短歌を結合して入力データとして整形

X = np.concatenate((dummy_vectors, takuboku_vectors))

y = np.concatenate((np.zeros(len(dummy_vectors)), np.ones(len(takuboku_vectors))))

# 学習精度を測るための分類器を用意

pre_classifier = SVC(kernel='linear')

# 5分割交差検定で学習精度を計測

scores = cross_val_score(pre_classifier, X, y, cv=5)

# 計測したスコアを報告

print('SVM Score:', scores.mean())

# 同じパラメータで今度はすべての入力データを用いて学習を行う

classifier = SVC(kernel='linear', probability=True)

classifier.fit(X, y)

# 「最後の一首」候補の短歌をラベルデータとベクトルデータに分割

tanka_vectors_labels = np.array([list(row)[0] for row in tanka_vectors])

tanka_vectors_data = np.array([list(row)[1:] for row in tanka_v

ectors])

# 分類器を用いて学習し、それぞれの「啄木の短歌らしさ」を推定する

proba = classifier.predict_log_proba(tanka_vectors_data)

# 「啄木の短歌らしさ」の高い順に並べる

sorted_proba = np.array(sorted(zip(proba, tanka_vectors_labels), key=lambda r:r[0][1]))

# 上位30件を報告

print('\n'.join(['{0:>2}. {1}'.format(i + 1, p[1].decode("utf-8")) for i, p in enumerate(sorted_proba[:30])]))

ここで、分割交差検定と呼ばれる方法を用いてSVMの精度を測定しています。分類器の精度とはすなわち分類の正確さであり、既知のデータに対してどれだけ正確に分類を行えるかを計測することによって測定できますが、このとき学習に用いたデータを測定に使用しないよう注意が必要です。学習に用いたデータは学習機にとっても既知のデータであり、正確に分類を行えるのはある意味当然であるので、精度測定が不正確になるおそれがあります。そのため、通常はデータセットを学習用のデータとテスト用のデータに分割して使用するのですが、このときの分割の仕方によって精度測定に影響が出る可能性があるため、学習用のデータとテスト用のデータを互いに入れ替えながら何度も測定を行うことがあります。これが分割交差検定です。

図2：5分割交差検定の例

今回の測定では5分割の交差検定を行っています。つまり、入力データの5分の1をテストデータに使用する測定を5回行っているということです。この測定結果は環境や乱数によって多少変動するでしょうが、おおむね97～98%程度の数値が出ると思われます。これはこの連載の元となった記事での93.3%という精度と比較しても非常に高いスコアであり、「啄木の短歌」と「ダミーデータ」との違いがよく学習ができていることが期待されます。
プログラムではその後、あらためてすべての入力データを用いてSVMの学習を行い、本命の「最後の一首」の候補を分類するための分類器を学習します。そして、それが終わったら実際にこれまでの連載で作成してきた「最後の一首」候補の短歌のベクトルデータを分類器に入力し、「啄木の短歌らしさ」の数値を推定します。これによって最もスコアが高かったものが、復元された「啄木の最後の一首」ということになります。

大跨に椽側を歩けば……

長い道のりでしたが、ようやく復元結果の発表です。それではもったいぶらずに発表しましょう。機械学習の力を借りて現代に蘇った石川啄木の最後の一首、その内容はこちらに決定しました。

大跨に椽側を歩けば、
うしなひしをさなき心
寄する日ながし。

……いかがでしょうか? 実のところ生成時に関係するさまざまな環境や乱数によって生成される短歌が異なる可能性があるので、これが唯一の解答というわけではありません。読者の皆さんが試した結果はこれとは異なる可能性があります。それぞれにそれぞれの復元結果があるということです。
「啄木らしさ」が高いと判定された短歌がどのようなものか確認するために、スコアの高かった上位30件を順に見てみましょう。

 1. 大跨に椽側を歩けばうしなひしをさなき心寄する日ながし
 2. 大跨に椽側を歩けば生命が身によりかかり眼閉ぢ眼をとづ
 3. 大跨に椽側を歩けばうしなひしわが来しかたのをかしく悲し
 4. 大跨に椽側を歩けば呆れ喉かなしみたる気自分の主筆さ
 5. 大跨に椽側を歩けばこれ見よと鳴きて走らせし母としたしむ
 6. 大跨に椽側を歩けばこれ見よと入日うつれるかなしき日ながし
 7. 大跨に椽側を歩けばのめる時とつたへと銭のなかのなつかし
 8. 大跨に椽側を歩けばおのづから目さまして見る玩具の機関車
 9. 大跨に椽側を歩けばむなしきつつつき鉢寒き煉瓦何かな
10. 大跨に椽側を歩けば字に四百いひ出でかかり初雪心
11. 大跨に椽側を歩けば煙草のみ考へるわれのこころ冷たし
12. 大跨に椽側を歩けば胸いたみ春の多きこと聞けばおとなし
13. 大跨に椽側を歩けば逃げてゆきしわが来しかたのをかしく悲し
14. 大跨に椽側を歩けばこの前をとづ高きなき出さより眠る
15. 大跨に椽側を歩けばこれ見よとかしこみて見る玩具の機関車
16. 大跨に椽側を歩けばおのづから目さませばからだ痛くてみたし
17. 大跨に椽側を歩けばうしなひし草稿の字の読みがたさかな
18. 大跨に椽側を歩けば今日とわかれ読む度ところ従兄ぬ
19. 大跨に椽側を歩けば泣いてゆきしわが来しかたのをかしく悲し
20. 大跨に椽側を歩けば誦しなしの夜目には軽くかろく眺むる
21. 大跨に椽側を歩けばうしなひし大という字の読みがたさかな
22. 大跨に椽側を歩けばこれ見よとかしこみて見る玩具の機関車
23. 大跨に椽側を歩けば高く笑ひ身をば寄せたる淡き見覚え
24. 大跨に椽側を歩けばいつ見つつわれよりえらく見ゆる日ながし
25. 大跨に椽側を歩けば煙草かな寝つ起きつし後酒に射し入る
26. 大跨に椽側を歩けば友なみだ垂れ手にためし雪のあけぼの
27. 大跨に椽側を歩けば病人の目さましてやや長きキスをやる
28. 大跨に椽側を歩けばなつかしき降れ年深夜の煙かくしは
29. 大跨に椽側を歩けばかなしきに穿く鳥口を人すこし寝り
30. 大跨に椽側を歩けば住みとるる問ふを見口に力し泣き読む

1. 大跨に椽側を歩けばうしなひしをさなき心寄する日ながし

2. 大跨に椽側を歩けば生命が身によりかかり眼閉ぢ眼をとづ

3. 大跨に椽側を歩けばうしなひしわが来しかたのをかしく悲し

4. 大跨に椽側を歩けば呆れ喉かなしみたる気自分の主筆さ

5. 大跨に椽側を歩けばこれ見よと鳴きて走らせし母としたしむ

6. 大跨に椽側を歩けばこれ見よと入日うつれるかなしき日ながし

7. 大跨に椽側を歩けばのめる時とつたへと銭のなかのなつかし

8. 大跨に椽側を歩けばおのづから目さまして見る玩具の機関車

9. 大跨に椽側を歩けばむなしきつつつき鉢寒き煉瓦何かな

10. 大跨に椽側を歩けば字に四百いひ出でかかり初雪心

11. 大跨に椽側を歩けば煙草のみ考へるわれのこころ冷たし

12. 大跨に椽側を歩けば胸いたみ春の多きこと聞けばおとなし

13. 大跨に椽側を歩けば逃げてゆきしわが来しかたのをかしく悲し

14. 大跨に椽側を歩けばこの前をとづ高きなき出さより眠る

15. 大跨に椽側を歩けばこれ見よとかしこみて見る玩具の機関車

16. 大跨に椽側を歩けばおのづから目さませばからだ痛くてみたし

17. 大跨に椽側を歩けばうしなひし草稿の字の読みがたさかな

18. 大跨に椽側を歩けば今日とわかれ読む度ところ従兄ぬ

19. 大跨に椽側を歩けば泣いてゆきしわが来しかたのをかしく悲し

20. 大跨に椽側を歩けば誦しなしの夜目には軽くかろく眺むる

21. 大跨に椽側を歩けばうしなひし大という字の読みがたさかな

22. 大跨に椽側を歩けばこれ見よとかしこみて見る玩具の機関車

23. 大跨に椽側を歩けば高く笑ひ身をば寄せたる淡き見覚え

24. 大跨に椽側を歩けばいつ見つつわれよりえらく見ゆる日ながし

25. 大跨に椽側を歩けば煙草かな寝つ起きつし後酒に射し入る

26. 大跨に椽側を歩けば友なみだ垂れ手にためし雪のあけぼの

27. 大跨に椽側を歩けば病人の目さましてやや長きキスをやる

28. 大跨に椽側を歩けばなつかしき降れ年深夜の煙かくしは

29. 大跨に椽側を歩けばかなしきに穿く鳥口を人すこし寝り

30. 大跨に椽側を歩けば住みとるる問ふを見口に力し泣き読む

全体としての印象は、「かなしき」「うしなひし」「むなしき」「痛く」「冷たし」といった陰的な形容が目立ちます。この点は非常に興味深いです。以前紹介した復元結果「大跨に椽側を歩けば、板軋む。／かへりけるかな――／道広くなりき。」では「椽側を歩く」という表現から「板軋む」「道広く」といった意味的な共起表現を拾っており、この点で以前の結果は優れていましたが、一方で詩的表現の手段としての言語をあまりにも字句的に捉えすぎているという指摘も受けました。今回の結果は前回よく見られたような「板」や「道」のような前半と関連する表現は見受けられませんが、代わりにこのような精神的な表現の傾向が陽に現れたことは、ある種前回の壁を乗り越えられたといえるのではないでしょうか。
また、「眼閉ぢ眼をとづ」や「軽くかろく眺むる」といった同じ単語の繰り返しのパターンが現れているのも興味深いです。三十一文字の中で同じ表現や単語を繰り返すのは特に前期啄木に見られる技法であり、「なみだなみだ／不思議なるかな／それをもて洗へば心戯けたくなれり」「はたらけど／はたらけど猶わが生活楽にならざり／ぢっと手を見る」といった歌にみることができます。この結果に出てきている用例はかなり露骨でありあまり高く評価はできませんが、もしかしたらこのような表現パターンを入力データから学習しているのかもしれません。
というわけで、今回の復元結果はこのようになりましたが、この結果は学習のパラメータや手法次第で大きく変わる可能性があります。読者の皆さんはぜひ、各種パラメーターを変更して、より望ましい結果が得られるように調整してみてください。たとえば、

・形態素解析に用いる辞書データの変更
・RNNLMやマルコフ連鎖で生成する短歌の数の変更
・マルコフ連鎖で用いるn-gram辞書のnの値の変更
・RNNLMに渡す各種パラメーター
・分類器のパラメーターの変更、もしくは探索※2

などは試してみる価値があると思います。

ひよつとした事が、思ひ出の種にまたなる

さて、こうして無事石川啄木の最後の一首を復元することができたので、おさらいをする意味も込めて本連載の流れをもう一度最初から振り返ってみましょう。

第1回（編：本誌 vol.38掲載）では、イントロダクションとして、本連載の中心人物である石川啄木の紹介、そして石川啄木の未完の「最後の一首」の解説を行いました。
第2回（vol.39）では「最後の一首」復元の第一歩として、青空文庫から原本となる啄木のテキストを取得し、短歌の部分を切り出してパースする処理を行いました。
第3回（vol.40）では、第2回でパースしたデータを形態素解析にかけ、短歌がどのような語句で構成されているのかを解析しました。
第4回（vol.41）では、第3回で形態素解析したデータを元にマルコフ連鎖を行い、文章としての繋がりを重視するプローチから「最後の一首」候補を作成しました。
第5回（vol.42）は第4回と並行する形で、今度はRNNLMを用いて「最後の一首」候補を作成しました。こちらはどちらかというと文脈を重視したアプローチになります。
第6回（vol.43）では、第4回と第5回で作成した「最後の一首」候補から、短歌の形式をとっているものをフィルタリングする処理を行いました。ここで単語列を文節に分けるテクニックを解説しました。
第7回（vol.44）では、短歌形式を取っている「最後の一首」候補を、word2vecとsentence2vecを用いて素性ベクトルに変換し、機械学習で扱いやすい形に変換しました。
第8回（vol.45）では機械学習による分類を行うための前準備として、「石川啄木らしくないデータ」、つまりダミーデータを生成する処理を行いました。また実装は行いませんでしたが、類似技術であるGANについても同時に解説を行いました。
そして第9回となる今回では、第8回で生成したダミーデータと啄木の短歌を正確に分類するSVMを学習し、それを用いて第7回で生成した啄木の「最後の一首」候補の「啄木らしさ」を推定し、もっとも「啄木らしさ」の高い一首を復元された「最後の一首」としました。

こうしてみると、「石川啄木の最後の一首を復元する」という一つのタスクに対して、様々な技術が複雑に関係していることがわかります。啄木の歌集の校訂者に端を発し、形態素解析器、マルコフ連鎖、RNNLM、word2vec、SVMと、どれも偉大な先人が築き上げてきた技術の集大成です。現代に生きる我々の使命は、折りに触れてなるべく広範な知識を身に着け、こうして巨人の肩の上に立ち、その上でどれだけ新しい価値を生み出せるかということに懸かっていると思って止みません。みなさんもこの連載記事を通じて、石川啄木や自然言語処理、さらに機械学習に興味を持って頂けると幸いです。
それでは、以上で連載「機械学習で石川啄木を蘇らせる」最終回とさせていただきます。9回の長い間お付き合いくださりありがとうございました。また機会があればどこかで会いましょう。

あなたにとっての技術が、物語のよき隣人でありますように。

本記事は、シェルスクリプトマガジンvol.38～vol.46に掲載された連載の最終回です。それぞれの技術の詳細については、該当のバックナンバーをご参照ください。（編集部）

ITエンジニアのサボりに強い味方現る！シェルスクリプト製ライフゲーム

投稿日：2017.04.18　｜　カテゴリー：　記事

written by シェルスクリプトマガジン編集部

（本記事はWeb版シェルスクリプトマガジン独自記事です）

USP研究所技術研究員ナカムラ氏謹製の、シェルスクリプト製ライフゲーム・シミュレータをご紹介します。
インストール・設定・操作・実行のすべてがターミナル画面上で完結するので、上司の目が厳しいエンジニアの皆さまも、いかにも「仕事中です」という顔をしながら暇つぶしに勤しめます。

ライフゲームとは

ライフゲームは、1970年にJohn Horton Conwayが発明したコンピュータ・ゲームです。
マス目（セル）のオンオフを生命（例えばシャーレ上に培養される微生物）に見立て、単純な規則により時間経過による生命の繁殖を表現します。
自分の周り八方のセルの密度が適度なら次のターンに培養される、過疎もしくは過密の場合は死滅します。

ルールは簡単ですが、初期状態からは想像もつかない形へと発展していく面白さがあります。。

例：代表的なパターン「グライダー」。 4世代ごとに縦横1マスずつ移動しながら元の形に戻ります。

→ → → →

ライフゲームのルール（引用元：「ライフゲイムの宇宙新装版」ウィリアム・パウンドストーン著有澤誠訳、日本評論社）

Wikipedia「ライフゲーム」などもご参照ください。

遊び方

インストール

コードはGitHub上に公開されています。

https://github.com/kaznak/ConwayGoL.sh

ターミナル画面上で $ git clone https://github.com/kaznak/ConwayGoL.sh.git とすることでインストールできます。

$ git clone https://github.com/kaznak/ConwayGoL.sh.git

Cloning into 'ConwayGoL.sh'...
remote: Counting objects: 245, done.
remote: Compressing objects: 100% (59/59), done.
remote: Total 245 (delta 30), reused 0 (delta 0), pack-reused 181
Receiving objects: 100% (245/245), 32.93 KiB | 0 bytes/s, done.
Resolving deltas: 100% (103/103), done.
$

$ git clone https://github.com/kaznak/ConwayGoL.sh.git

Cloning into 'ConwayGoL.sh'...

remote: Counting objects: 245, done.

remote: Compressing objects: 100% (59/59), done.

remote: Total 245 (delta 30), reused 0 (delta 0), pack-reused 181

Receiving objects: 100% (245/245), 32.93 KiB | 0 bytes/s, done.

Resolving deltas: 100% (103/103), done.

ConwayGOL.sh/ のディレクトリに移動し、初期化コマンド . rc を打ち込むことで準備が整います。

サンプルパターンを実行してみよう

ライフゲームの面白さは、初期のセル配置パターンからは想像もつかない発展をとげることです。

ConwayGoL.sh/example-pattern/ に、特定の動きをする代表的なパターンが収録されています。

まずはそれらのサンプルパターンを実行してみましょう。

例えばさきほど紹介した「グライダー」を見たいときは、 ConwayGoL.sh/ ディレクトリで以下のコマンドを実行します。

$ ido 3 3 example-pattern/glider | conwaygol | play-screen

1	$ ido 3 3 example-pattern/glider \| conwaygol \| play-screen

上司に見つかりそうになったら Ctrl-C を長押しすれば終了できます。

また、一世代ごとの移り変わりを確認したいときには、conwaygolコマンドにオプションをつけます。

$ ido 3 3 example-pattern/glider | conwaygol - 2 10 10

1	$ ido 3 3 example-pattern/glider \| conwaygol - 2 10 10

conwaygolの後に続くオプションのうち、

最初の「2」は初期状態から２世代後まで（計３世代）を表示することを示します。

後ろの 10 10　は、セル全体の大きさの指定を示します。

自分で作ったパターンを実行してみよう

サンプルパターンを動かしてみたら、いよいよ自分で初期パターンを作り、実行してみましょう。

まずはテキストエディタを使って、ConwayGoL.sh/example-pattern/ に初期状態のファイルをつくってみましょう。

オンのセルはX(半角の大文字X)で、オフのセルは半角スペースで打ち込みます。

それではこいつを実行してみます。

題して、「ライフゲームで占うシェルマガの未来」。

（GIFファイルです）

実行当初からどんどん形が崩れていきます。あははは、これは愉快だ。

途中からは、文字の区切りの痕跡すら残っていません。

（GIFでは飛び飛びですが）約300世代後、ふたつのパターンを繰り返す定常状態になりました。

シェルマガがこれからどんどん広まり、vol.300近くまで続くというお告げでしょうか。素晴らしい。

おわりに

というわけで、USP研究所ナカムラ氏謹製　シェルスクリプト版ライフゲームのご紹介でした。

みなさまの、仕事してるフリをしながら適度にサボる、豊かなITエンジニア・ライフのお役に立てますと幸いです。

詳しい操作の仕方については、インストール後 readme もご参照ください。

シェルスクリプトマガジンは、明日すぐには役立たないけれども数年後の自分の血となり肉となる、ITエンジニアの教養満載でお届けしています。

データ分析、IoT、PM、ネットワークなど、新しい勉強を始める春にぴったり！最新号vol.47はこちらから！

「無意味な行動をとらせる力」を使え！　環境ITベンチャーピリカのつくりかた

投稿日：2017.04.4　｜　カテゴリー：　記事

本記事は、シェルスクリプトマガジンvol.47掲載「技術者哲学ピリカのつくりかた」のダイジェスト版です。

株式会社ピリカは、『科学技術の力であらゆる環境題を克服する』と謳い、ポイ捨ての解決をビジネスにしているITベンチャーです。
実際に彼らのゴミ拾いアプリ【ピリカ】を使ってみると……

　「ゴミが落ちてるぞ！」

「拾って写メを撮って…」

「ピリカに投稿だ」

「拾ったゴミはゴミ箱へ」

（数時間後）「お、【ありがとう】がたくさんついてる。いいことした気分！またゴミが拾いたくなってきた」

と、一見結びつきそうにない【IT】と【環境問題】と【ビジネス】が、たしかに融合していました。

この秘密を探るべく、編集部は開発元の株式会社ピリカを訪れました。

インタビューに応えてくれたのは代表の小嶌不二夫さんとCTOの高橋直也さん。起業に至った経緯、環境問題にIT技術ができる貢献、そして今後の展望を伺ってきました。
（聞き手・まとめ　シェルスクリプトマガジン編集部）

ピリカができるまで

―今日はよろしくお願いします。まずは、小嶌さんが「IT技術で環境問題を解決するビジネス」を始めるに至った経緯を聞かせていただけますか。

小嶌：僕が環境問題に興味を持ったのは、小２のときに読んだ、ポプラ社の「地球の環境問題」シリーズがきっかけです。図書室の隅っこにあったこのシリーズに異常にハマって、同じ本を何度も借り直した記憶があります。その頃の僕は「大きな問題を解決する」ことに魅力を感じたのでしょう。もちろん、大人になってから勉強し直すと当時とは状況が変わっているわけですが、最初のきっかけはこのシリーズでした。

―環境問題の解決に取り組むうえで、起業という形をとったのは何故ですか？

小嶌：大学に入った頃は研究者を希望していました。でも、学部四年で研究室に配属になったら、二週間くらいで「これ、全然面白くないな」と思ってしまい、そこで研究者の道は諦めました。割り当てられた研究が合わなかったということもありますし、「研究者として」環境問題にアプローチするのは、自分の場合はちょっと違う、とも思い始めたからです。当時の僕の視点からは、研究とは「人生を賭けてひとつのテーマをひたすら深掘りする」ものに見えたのですが、そうすると、僕が小学生の頃読んだ本の「一冊分」は解けるかもしれないけれども、「残りの分」が解けないじゃないですか。

―たしかにそうですね。

小嶌：一方で、「お金」だったら全てのことに使えますよね。ひとつの事業で得たお金を他の分野に転用していくことができますから。そこで、学部四年で「研究面白くないぞ」と感じてからは、自分で事業を立ち上げるのか、それとも仕事を学ぶためにまずは企業に就職するのか、大学院でのモラトリアムの間に自分の道を決めることにしたんです。だから、大学院に入ってからは海外で働いてみたり、色々な国を旅してみたりしました。

―なんとなく大学院に進んでモラトリアムを過ごす、という人は多いですが、小嶌さんは環境問題にどう取り組むべきか見定めるために、モラトリアムを「積極的に取りにいった」わけですね。その結果「ゴミ問題」を選んだのは何故ですか？

小嶌：ひとつはお金の問題です。環境問題の範囲はとても広いわけですが、多くの問題は解決に莫大なお金がかかりますよね。浄化フィルターひとつ開発するのにも何千万円もかかってしまう。だから「安く始められること」が絶対条件だったんです。
一方で、安く始められたとしても「汚染を除去するフィルターの、この一部分だけを作りました」で終わっては悲しいですし、全体の問題の解決には到底達しません。そこで、「将来的には大きな広がりを持っているけど、入り口は小さい」テーマとして、ゴミ問題に取り組むことにしたわけです。

―なるほど。

小嶌：世界一周旅行をしていた当時、100くらいアイデアをメモ帳に書きためたんですが、結局「これだったらいけるかもしれない」と思えたアイデアは、その中の3つくらいを組み合わせた1つだけでした。
それは「Googleマップのような地図に、色々な環境問題の情報を載せ込む」ことです。
これまでにも、様々な自治体さんや団体さんが地域の問題解決をしようと努力されていますが、その中には、「『○○川を綺麗にしよう』という活動が盛んだが、実際にはその隣の川の方が汚い」のような状況が結構ありますよね。そういう状況に対して、位置情報付きで環境問題の見える化をすることで、環境問題を解決しようとしている人の行動を最適化したり、関わる人を増やしたりできるのではないかと思ったんです。

―最初のアイデアは「環境問題のマッピング」だったんですね。スマホにピリカをインストールすると、道端でゴミを見つけたときに自ずと拾いたくなってしまうので、よく出来た仕組みだと感心しています。この効果は狙って設計したんですか？

小嶌：まさに、世界の国を旅している間にそれと同じ体験をしたんです。iPhoneを持って旅に出たんですが、スマホの位置情報をオンにして写真を撮ると、現在地がマップにピン留めされるじゃないですか。アフリカの街にいるときに、ピンがもう世界を半周していることに気がついて、「おっ、これは面白いな」と思ったんです。なにか、色々な街を征服したみたいで。そこからは無意識に、新しい街についたら意味もなく、位置情報をオンにした状態で写真を撮るようになっていきました。部屋の隅とかでもとりあえず撮るんですよ、位置情報を刺したいから。

―「ピンを刺すこと」自体が目的になってしまったんですね。

小嶌：後から振り返ってみると、「なにこの無意味な写真」って思うわけですが、これって、要はゲーム性とか面白さによって人に「無意味な行動」をとらせているってことですよね。

―たしかにそうです！

小嶌：人にこういう無価値な行動をとらせられるなら、もしかしたら情報くらい送ってくれるかもしれないし、ゴミくらい拾ってくれるかもしれない。「位置情報付きで写真を撮ること」にそういう力があるのなら、これを使って面白いことができるかもしれないと思ったんです。

環境問題をビジネスにする

―大学院での経験をヒントにして始まったピリカですが、株式会社ピリカが現在展開されている事業を紹介していただけますか？

小嶌：現在はスマホアプリ「ピリカ」を使ったゴミ拾い支援事業と、画像認識システム「タカノメ」を使ったポイ捨て調査事業の二本立てです。ゴミ拾い事業の収益は、様々な企業さんからの広告・協賛と、ピリカの仕組みを使ってくださる地方自治体さんからのシステム利用料です。タカノメによる調査では、案件ごとに調査面積に比例した調査費用を頂き、得られたデータを基にした研究成果に対しても研究費用を頂いています。

―どんな組織がタカノメによる調査・研究のクライアントになるのですか？

小嶌：協賛企業でもあるJTさんを例に挙げて説明しましょう。タバコのポイ捨てはJTさんにとってもデメリットですよね。ポイ捨てがあまりに酷いとクレームが来たり、場合によっては自治体に喫煙所を作らせてもらえなくなったりしますから。ですから、喫煙所をどうデザインすれば地域のポイ捨てを抑制できるのか、喫煙者・非喫煙者双方にとって暮らしやすい町や制度を作れるか、ということを研究する動機がJTさんにはあるわけです。このケースでは、自治体・JT・ピリカで協定を結び、データと費用を頂いて調査を行っています。

―タカノメによる調査費用は調査面積に比例するとのことですが、どのようにサービスの価格を決めたのですか？

高橋：タカノメに関しては、面積に原価が比例するのでそこに値段つけたということですね。

小嶌：買い手のことを考えると、自ずと売り方が決まってくるという面もあります。環境問題のビジネスとしての特殊性は、直接的なお客さんであるゴミや大気、川や海からはお金をとれないことですよね。

―そうですね。

小嶌：だからその代わりに、問題を抱えている「人の問題」として売るしかない。「ポイ捨ての問題」では売れないので、見方を変えて「地域の美化」の問題として扱って自治体の地域美化の担当者さんに買ってもらう、河川の問題として切り分けて、喫煙所の問題として切り分けて……という発想に、どうしてもなります。そこで、ときには相手に尋ねながら「買ってくれる方法」を探すわけです。例えば自治体を相手にするなら、議会を回さずに使える予算はそれぞれの市区町村によって違いますから、それらに柔軟に対応でき、なおかつ予算に合わせて調査規模を拡大できるような売り方になります。

環境ベンチャーのエンジニア

―現在CTOとして開発を担当されている高橋さんは、どのような経緯でピリカにエンジニアとして参加されたのですか？

小嶌：システム開発の会社に就職した大学時代の友人に「ピリカを作っていく上でどうしてもエンジニアが必要なので、周りで一番優秀な人を紹介してもらえないか」と頼んだら、その場で電話をかけて、同僚だった高橋さんを紹介してもらったんです。

―え、そんな簡単に決まったんですか？

高橋：参加といっても、最初の３年間は週に２時間くらいでした。普段の仕事とは別のことに関わっていたいという希望はその前から持っていましたし、実際にピリカに関わる２時間がいい気分転換になって、普段の仕事でも楽しくいられたんです。ピリカをやっている間にも、もう一社並行でやっていたこともあります。ピリカにフルタイムで関わるようになったのは、私も東京に出て来てからですね。

小嶌：高橋が参加した当時は二人とも関西にいましたが、それからすぐ僕は東京に出て来ました。なので、遠隔でのやりとりの期間が長かったですね。現在でも、当時の高橋のように他の仕事をしながら関わってくださる方や、北海道やアメリカなど遠隔で関わってくれる方がいまして、30名近い方の力を借りて事業を行っています。

―アイデアを出す小嶌さんと、それをシステムで実現する高橋さんは、どういう関係で仕事を進めているのでしょうか？

高橋：自分が関わる部分については、割とやりたいようにやらせてもらっています。基本的に、作りたくないものを作ったことはないはずで、「何を作るか」を決める時点で自分の意見をある程度反映させています。

小嶌：例えばタカノメは、そもそものサービスの構想自体が高橋の発案です。私が持っていたのは「ゴミの種類と数を、安く、正確に、そして様々な場所で同じ基準を適用して調査したい」という方針だけでした。それを人力でやるにはお金もかかるし、限界もある。なによりも面倒な作業ですから、やる方が幸せになれないですよね。その解決のために「スマホで写真を撮って、画像解析でゴミを見つける」というシステムの大枠を考えたのは高橋なんですよ。

シェルスクリプトマガジンvol.47に掲載の本記事ロング・バージョンでは、科学技術・ITが環境問題にできる貢献について小嶌さんが考える「ピリカの基にある哲学」を、よりつっこんで伺っています。

shell-mag ブログの 2017年4月のアーカイブを表示しています。

-->

機械学習で石川啄木を蘇らせる 最終回（vol.46掲載）