読者です 読者をやめる 読者になる 読者になる

きっと、ずっと、会議は踊る

エンジニアリングとアイドルとロックンロール

-- しゅう (@shoe116) の徒然なる物思い --

愛と偏屈にまみれたHadoopの話(前編)

engineering

はじめに:危険なのでマサカリは投げないください

昨年末、久しぶりに技術的なテーマについてのエントリ

shoe116.hatenablog.com

を書いて、個人的には結構自信作だったんだけど案の定そんなにPV*1は伸びなくて、ちょっと拗ねた。でも、まぁ別に多くの人に読んでもらうことを目的に文章を書いてるわけじゃないし(もちろんPVは多ければ多いほど嬉しい)、今回も懲りずに技術的なエントリでも書いてみようと思う。ただし、マサカリを投げる*2のは危険なのでやめてほしい。この文章は僕が僕の理解の中で時分の思考を整理するために書いているのであって、僕が知らないこと・間違ってることもいっぱいあるのは自覚しているので、こちらまでご連絡くだされば謹んで訂正いたします。

1. Hadoopって?

最近*3地上波でも良く耳にするようになったDeep Learningに代表される機械学習には、途方もないほど膨大なデータと、それを扱うためのストレージ、そして計算環境が必要だ。

"Hadoop"はそんな場面で使える、気持ちの悪い黄色いゾウさんが目印の「膨大なデータを扱えるファイルシステム兼計算フレームワーク」で、その実装はインターネットに全公開されている*4。ちなみにその全貌を理解しなくてもとりあえずは使えるし、このエントリを読むのに何の支障もない。ただ、こんな章を作ってなんだが、以降の話は"Hadoop"を知らない人には完全にちんぷんかんぷんな内容になってしまっていると思うので、そのことについては先に謝っておきたい。

2. HDFS(GFS)と広義のMapReduce

Hadoop、つまりHDFS(GFS)とMapReduceとは?」という議論は、ぶっちゃけGoogle様の10年以上前の以下の論文

  1. The Google File System
  2. MapReduce: Simplified Data Processing on Large Clusters

 が全てで、それ以上でも以下でもないのだろうけど、それぞれのAbstractに

We have designed and implemented the Google File System, a scalable distributed file system for large distributed data-intensive applications. 

 MapReduce is a programming model and an associated implementation for processing and generating large data sets. 

と明記されているとおり、これらは実装*5についての論文なので、"そもそもHadoopが、どんな課題をどうやって解いたのか?"というアイディアの部分は(少なくともコンピュータサイエンスを体系的に学んだことのない僕にとっては)それほどわかりやい説明がされていたわけではなかった。なお、このエントリでは以降"MapReduce"と言う言葉を、現在のApache HadoopにおけるMapReduceの実装ではなく、上記論文で述べられた

Users specify a map function that processes a key/value pair to generate a set of intermediate key/value pairs, and a reduce function that merges all intermediate values associated with the same intermediate key.

という広義の意味で用い、Apache TezApache SparkのDAGも含む概念とする。

3. Hadoopの解いた課題とアプローチ

さて、「なぜHadoopが必要なのか?」という問いに対してよくなされる返答は

テラバイト(1兆バイト以上)からペタバイト(1,000兆バイト)におよぶデータを高速・効率的に処理するために、新たな手法が必要となりました。(中略)そこで考えられたのがデータを分散並列処理する手法です。つまり、データを複数のサーバに分散させ、各サーバに計算処理させることで、1台のコンピュータでは難しい大容量データの高速分析処理を行おうというものです。  (ストレージ Hadoopとは - Fujitsu Japan

というものだが、この「そこで考えられた」というのが、「何を、どう考えたのか」というのを僕は恥ずかしながら最近まで全く理解できないでいた。ここではそれについ僕の理解を書いておく。

まず、上記論文が発表された2003年当時、Google様が見ていた課題やそのアプローチは「データ量が増えすぎて既存のストレージだと、もうどうにもならない」というような、(一般的な企業でのHadoop導入事例でよく見られる)対処療法的なものではないと僕は思っていて、おそらく以下の2点だと推測している。

  1. ムーアの法則は終焉が近く、集積回路の進化はサチる
  2. 処理すべきデータは、指数関数的に増え続ける

つまり、「計算リソースの進歩のスピードが処理すべきデータ量の伸びに追いつかない」という状況が避けられない中、そのソリューションとして作られたのがGFSとMapReduceだ(当然これは僕の憶測で、ソースを出せと言われても困る)。

Hadoopが採った方法は非常にシンプルで、上記の通り並列分散処理なのだが、結局これはどういうことなのか?というのはあまり語られていない気がしている。これはあくまでも僕*6の独断と偏見に基づく解釈だけれど、すごく簡単に言うと「単体の計算リソースの伸びはもう期待できそうにないから、ネットワークでなんとかする」ということなんだと思う。もう少しエンジニアっぽくかっこよく言えば、「短期的には解決しそうのないCPUバウンドの課題を、ネットワークを含めたI/Oバウンドに置き換える」というアプローチだ。

こう考えてみると、Hadoop上のファイルが都度圧縮・解凍するのを前提に作られている一方で、RAIDより保存効率の悪い3レプリカがデフォルトになっているのもしっくりくる。圧縮の目的はストレージの節約というよりI/Oの削減で、3レプリカは出来る限りネットワークを介したファイルの転送を抑える工夫だ(もちろん冗長性の確保もあるが、それだけならRAIDでいいはずだ)。Hadoopは「ネットワークは常に詰まっているが、CPUは暇している」前提で設計・実装されていて、逆に言えばシステムのボトルネックを意図的にI/Oに寄せてあるのではないだろうか。

さいごに:後編のプロミス

泣く子も黙るSIerの雄、NTTデータ様の解説ページ「分散処理技術「Hadoop」とは:NTTデータのHadoopソリューション」に記載されているHadoopの特長は

  • 単純なサーバの追加によってスケーラビリティを実現
  • 非定型データの格納を想定した処理の柔軟性を実現
  • コモディティ品を利用した基盤構成・対象外性

 で、この手の説明を見たり聞いたりすることがとても多いのだけれど、たぶんこれは2011年(Apache Hadoop 1.0.0の時代)当時の話であって、今ではもう時代遅れなものだと思っている。最近そのことについて結構大掛かりなイベント*7で話す機会があって、資料もわりとちゃんとつくったから、後編はその話を書こうと思う。

ただ、昨日見に行ったツアーファイナルがあまりに良くて、頭の中が完全にBiSHにそまっていて、心の底からのプロミスはできないのだけれど。

www.youtube.com

 

 

注釈等

*1:Page Viewsのこと。細かいことを言わなければ、つまり“何回に読まれたか”

e-words.jp

 

*2:「技術的に鋭いツッコミをすること」と説明されることが多いが、無駄なマウンティングが含まれない限り、そうは呼ばれない気がしている。投げられたマサカリは大抵無益な2次災害を引き起こすので、周りの安全が確認できない場合(当然オンラインの場合は全てそうだ)は自重したほうが世界のためだとは思う。

*3:それほど最近でもない気がするが、僕みたいな機械系卒のWeb系という畑違いも良いとこのエンジニアがDeep Learningの“破壊的イノベーション”っぷりを知ったのがILSVRC2012なので、かれこれ5年くらいか・・・

*4:いわゆるOSSというやつで、気になる人はGitHubを御覧いただきたい

*5:この「実装」という言葉に馴染みが無くて、かつ興味がある稀有な方は是非以下のエントリを読んでいただければと思う。

shoe116.hatenablog.com

*6:一応、事前に友人のカイ君

twitter.com

にレビューをお願いしたが、文責は全て僕にある

*7:"Battle Conference U30"なる、若手エンジニア向けのイベント。かってに緩いLT大会だと思いこんでゆるふわなフォントでスライド作って持っていったら、サイバーエージェントと社長とかも話すすごいちゃんとした会で、少々反省した。

battleconference-u30.connpass.com

職業プログラマの僕の残業が減らないたった1つの理由

0. はじめに

お久しぶりです、しゅうです。今年も気ままに更新します(といってる間に2月に・・・)。前回のエントリ人工知能ポエムとシンギュラリティについてのエッセイで、ライブ告知をしなかったら「ライブ告知なかった」というありがたいコメントを世界のI先生に頂いたので、今日はライブ告知から入ります。

僕とカツくんとで細々やってる「しゅうかつ」という安直な名前のフォークデュオで、名古屋のライブカフェで歌います。

2人で音源作りもしました(が誰も聞いてくれないので一応晒しておく)。

カツくんはギターと歌とフィドルバイオリン)、そしてコーラスを担当します。相変わらず彼はとても上手です。

ということで、今日は僕の残業が減らない愚痴を書きます。ただし、僕の残業時間は、比喩的じゃない意味で致命的じゃない*1し、法的にも全く問題ない範囲であることを先に断っておきます。

1. 僕は今日も早く帰れない理由

1.1 知的労働なブルーカラー

 僕はインターネットの会社でプログラムを書くことで給料をもらっていて、みんな大好きドラッカー氏が言うところの知的労働者(Knowledge worker)だ。一方でプログラマ

仕事のスケールやコストが土木などと同様の人月計算による日数と必要人数の掛け算という単純な数式によって算出される (ブルーカラー - Wikipedia

 という意味で完全なるブルーカラーだが、同時に『人月の神話』で有名なフレデリック・ブルックス

この本は「ソフトウェア工学バイブル」と呼ばれている。なぜなら、誰もがこの本を読んでいるが、誰もこの本で述べていることを実践しないからである。

 と言っている程度にはこの分野の人月計算(簡単に言うと見積もり)は機能していない*2。だから、「予定通りに仕事が進まないから残業する」と言ってしまえばそうなんだけど、あまりにも元も子もないからもう少し掘り下げて考えてみる。

1.2 知的労働者の残業が減らない理由

よく考えたら僕の知り合いにはエンジニア以外の会社勤めも結構いて、その人達はソフトウェア開発をしてるわけでもないし、人月計算も(多分)されていないホワイトカラーだ。でも、知的労働者である点と、「結構遅くまで残って仕事をしている日もある」という点は共通だ。となると「人月計算がうまくいかない」というのは、(ここでは比喩的な意味で)致命的な問題ではない気がしてくる。ここでは、もう少し話を広げて"知的労働者"が残業してしまう理由について考えてみたい。

1.1.1 知的労働とその評価について

僕の見ている限り、職種にかかわらず以下の3点は共通している。

  1. 作業開始・終了のオーバーヘッドを考えると「時間ぴったりで帰る」ことは現実的でない
  2. 業務の引き継ぎや作業分担は、タスクの難易度によらず相当のコストがかかる
  3. 目標設定・タスクの要件定義時にアウトプットの質を定義されることは稀である が、アウトプットの質は社内外問わず常に評価の対象になる

短期的に見れば、「今日もうちょっとやってから帰ろう」は非常に理にかなった判断だ。

1.1.2 知的労働における残業の理由

冷静に考えたら、残業は2パターンしか思い当たらない。

  1. 進捗が思わしくない場合、残業してスタックしたタスクを消化する
  2. 進捗に余裕がある場合、残業してアウトプットの質の向上を測る

なるほど、たしかに進捗具合に関わらず残業する(評価の対象になるという意味で)真っ当な理由が存在する。

2. 今日も残業する僕のジレンマ

せっかくだから、会社とか国とか"組織的"に知的労働者の残業時間を減らそうとするとどうなるかについても妄想してみよう*3

1.2.2で述べたように、知的労働において「アウトプットの質の向上」を始めると無限に残業できる状態に陥ってしまうので、とりあえずこれを避ける必要がある。そうすると「タスクに求める質を事前に要件化し、求められる質に対する充足具合と完了速度でアウトプットを評価する」みたいな、偉い人はみんな大好き"生産性で評価"メソッドが適用されることになるはずだが、これはつまり「組織全体のアウトプットの質を下げる代償として残業を減らすこと」を意味する*4。アウトプットの質の低下はそのまま顧客満足度を下げることに等しいので、当然ながら組織的に相当のリスクを負うことになる・・・というか少なくとも僕の働くインターネットの業界だと(比喩的でない意味で)致命的だ。残業はしたくないけど、会社が潰れる(というか給料がもらえなくなる)のはもっと困る。

 そしてもう1つ、「アウトプットの質の向上」の作業というのは、辛く悲しい会社勤めの知的労働者の数少ない楽しみというか、個々の裁量とか仕事への拘りが宿る唯一の部分だといってよいと思う(少なくとも僕にとってはそうだ)。これを組織的に許さなくなってしまうと、これまた偉い人がみんな大好き"イノベーション"が起こることを阻害する要因になる気がしてならないし、とりあえず今以上に労働がつまらないものになるのは間違いない。

あ、理由が2つに…まぁ、でも、とりあえず僕はいつだって早く帰りたい。

3. さいごに

なんか思ってた以上に組織的に残業減らす施策は大変そうで、でもそんなことは関係なく僕は自分だけは毎日早く帰りたい。だから、今日も、天気が良すぎて気が滅入る。

とりあえず、名古屋近郊にいる人、2/12の夜は今池で飲みましょう*5。今日は当然ながらこの曲で。初期 the Beatlesのアイドル感はすごい。

www.youtube.com

注釈等

*1:よくわからないけど、勤務時間だけが(ここでも比喩的じゃない意味で)仕事を理由に死にたくなるだとは思わない。残業してなくても死にたくなることも結構ある気がする。少なくとも僕はそうだ。それにしたってこのtogetterは、見るたびに絶望的な気分になる。

togetter.com

*2:こう言うと怒られそうだけど、この本分厚い上に読みにくくて僕自身はパラパラ流し読みした程度で挫折した。流石バイブル。

*3:個人的には「繁忙期は100時間、月平均60時間を上限」と言うのは、上限としては現実的でよいラインなんじゃないかと思う。日常的に異常が発生するシステムのアラートは、最終的に誰もキャッチしなくなる。

headlines.yahoo.co.jp

*4:例えば、こち亀が最終的に「毎週安定してまあまあのクオリティ」な漫画に落ち着いたのは、秋本治さんが定時稼働の有限会社"アトリエびーだま"を作ったためだと僕は信じて疑わない

*5:しつこくもう一回

人工知能ポエムとシンギュラリティについてのエッセイ

無駄に難しい考え事 datascience

はじめに:人工知能ポエムについて

そもそも僕のブログは"無責任なエッセイ"でしかありえないのだけれど、今回わざわざタイトルに含めたのには、最近巷で流行っている"人工知能ポエム"と明確に区別するためだ。ちなみに、この"人工知能ポエム"というのは、僕が勝手に作った人工知能についての記事のラベル*1で、"技術に明るくない人たちが、その叙情感を楽しむ、人工知能についての良質な散文"を意味し、このあたりが該当する(僕がポエムと呼んでいるのは記事そのものであって、決してこれらの記事で扱われている方々の発言そのものではない点に注意されたい)。

gendai.ismedia.jp

www.sbbit.jp

japan.cnet.com

せっかくなら僕もこの流行に乗ってみようと頑張ったのだが、圧倒的に文章の才能が足りず挫折、残念ながらいつも通りエッセイ風になってしまった*2。どうしても理屈っぽくなってしまって、狙った叙情感が出せなかったのだ(ああ、才能がほしい)。

 人工知能とシンギュラリティと生産性

多分この人工知能(AI)とかシンギュラリティ(技術的特異点)とかいうキーワードが、俳句でいう"季語"みたいに叙情感を醸し出す強力な助けになるので、ポエマー界隈で人工知能ポエムが盛り上がっているのだと思うのだけど、ここでは彼らとはちょっと違う観点でこれらについて考えてみたいと思う。

道具の発展と生産性の歴史

人工知能と言っても所詮はヒトの"道具"なので、人と道具の歴史をざっと振り返ってみる。

  • 3,000,000年前、道具を使い出す
  • 300,000年前、言葉を使い出す
  • 3,000年前、文字を使い出す
  • 500年前、 科学を使い出す
  • 50年前、コンピュータを使い出す
  • 今年、囲碁でヒトがコンピュータに負ける
  • 30年後、シンギュラリティ(予定)

これら道具の恩恵を受けながら、ヒトという種は他の動物と一線を画し繁栄しているのだが、下*3に示すように「道具の発展の歴史」はそのまま生産性の向上の歴史*4だ。

f:id:shoe116:20161127161518p:plain

ビッグデータ機械学習、そして予測制御と生産性の爆増について

上の図を見ると、シンギュラリティの少し手前から異常とも思えるような生産性の爆増が起こる事になっているが、これはそれほど不可解なことではない。観測・予測制御の技術的革新によって生産性が飛躍的に上昇することはこれまでも度々起こっていて(農耕の開始とか産業革命なんかがその好例だ)、今まさにその技術革新真っ只中なのだから。

予測制御とは、簡単に言うと

  1. 観測(状態の取得)
  2. 観測に基づく予測
  3. 予測による制御

によって状態を制御する方法だ。現代制御の世界では常識だけれど、「可観測(見える)」であることと「可制御(動かせる)」であることは全く別の問題で、でも「その系が安定(頑張れば思い通りに動かせる)」であるためには「可制御かつ可観測」であることが必要条件だ*5

世に言われているシンギュラリティ(技術的特異点)は、「人より人工知能が賢くなること」みたいに説明されて、そこにビッグデータ機械学習が絡まって叙情感のあるポエムが量産されているけれど、この観点でみると結構スッキリ解釈できると思っていて、今この界隈で騒がれている、ドイツ政府の言うところの「第4次生産革命」は、つまりこういうことだ。

  1. 観測できる情報の量と質が劇的に向上した(俗に言うビッグデータ
  2. 情報技術の革新と統計処理の進歩で予測が高精度になった(Hadoopや深層学習)
  3. 生産性が爆増する(シンギュラリティ?)

3については幸か不幸かまだあまり実感がないけれど、1, 2に関しては信じられないような速度で進捗しているのは、みんななんとなく感じているところだと思う。

ヒトの仕事と人工知能

さて、人工知能を語るときにこのは話題を出さない訳にはいかないだろう。繰り返しになるが、AIの恩恵を受けられる(ネガティブに言えばAIに奪われる)仕事は、今のところ「観測をもとに予測制御できる仕事」に限られる。現在ヒトが手に入れた機械学習ベースの人工知能は、つまるところ観測と統計処理に基づく予測制御機にすぎないからだ*6。オックスフォードのオズボーン准教授ははっきりそう言っていて、だからこそ観測技術の重要性を解いているのだが、どういうわけか前述の記事ではあまりそれが伝わってこない(たぶんポエムの叙情感の犠牲になったのだ)。

上記で紹介した3作品に限らず、ポエマー界隈では「単純な作業はAIの独壇場になり、ヒトはもっとクリエイティブな仕事をすることになる」と語られることが多い気がするが、これはもう根本から間違った議論だ。そもそも、コンピュータと人間の脳は思考のプロセスがまったくもって異なるので、人間にとって"単純な作業"がAIにとって簡単とは限らないし、逆に"クリエイティブな仕事"がAIに難しいとも限らない。将棋のAIが強くなるずっと前から、最終盤で詰みをよむこと(これは人間にとって単純な作業ではない)は人間を凌駕していたし、序盤に誰も見たこともない構想を見せたりしていた(強くなった昨今の将棋AIは、むしろ人間の真似ばかりしている)。その一方で、手書きの数字を人と同レベルに識別できるようになったり、猫を猫とわかるようになったのは、つい最近のことだ。

まとめ:所詮生産性が上がるだけ

これだけ人工知能がもたらす生産性の向上について書き進めてきて、こうまとめてしまうのもアレだとは思うが、個人的には"特定分野の生産性の向上"、つまり部分的に効率が良くなることで解決する問題なんてたかが知れていると思っている。

かつての産業革命が世界平和に全く寄与しなかったように、シンギュラリティも世界平和や領土問題にそれほど貢献するように思えないし、子育てとか介護は"予測制御できない"のが恐らく根本的な問題だ。手紙→電話/メール→LINEと手段の進歩で確実にコミュニケーションコストは減っているのにもかかわらず、恋愛の難しさ自体はほとんど変化していない(と思う、もし簡単になっているんだとしたら、昔の人には尊敬の感情しかない)。つまり、今本当に解決しなきゃいけない問題に関しては、ほとんど無力なんじゃないだろうかとすら思える。

だから何だってことなんだけど、便利になる自体は喜ばしいことなので、あんまり心配しないでとりあえずベイビーレイズ JAPANを聞いたらいいんじゃないかな、暦の上ではディセンバーだし。

www.youtube.com

 

注釈等

*1:正確に言うと、中山ところてん (@tokoroten)さんが機械学習ビジネス研究会の参加者募集時に“機械学習ポエム”という単語を使用されており、それに影響されたものだ

*2:ちなみに、この文章はちょうどいいタイミングでお仕事で流用する運びとなり、そちらのほうが先に展開されてしまった。こちらがオリジナルで、あっちがコピペなので色々見逃してほしい

*3:日経新聞の記事から引用。この記事はポエム度が低い。

vdata.nikkei.com

*4:この文章を書くうえで、この"What Happened Before History? Human Origins"という動画には大いに影響を受けた

www.youtube.com

*5:現代制御は観測(計測)とセットで初めて成り立つのは、計測自動制御学会という学会があることからも明らかだ

*6:あくまでも"現時点では"だ。このフレームワークを外れるAIが作れたら話はひっくり返る

"手に入れられなかった青春の偽装"としてのアイドル論

idol 徒然なるままに

はじめに

最近(と言っても数ヶ月前だけど)、敬愛するアイドルヲタの先輩の結婚をお祝いする機会があって、その先輩とかなり前(と言っても1年くらい前だけど)に偶然同じ現場*1に居合わせて、そのまま飲んだ際に語られたアイドル談義を今日は頑張って文字に起こそうと思う。

ということで、ここに書く“アイドル論”や青春の思い出話は確かに僕個人のものだけれど、”偽装”という表現は、その先輩のものだということを先に断っておく。

「青春」について考える

Google先生に、青春の意味を尋ねたところ

若い時代。人生の春にたとえられる時期。希望をもち、理想にあこがれ、異性を求めはじめる時期。

という理想的な回答(もちろん、このエントリ的に、という意味だが)を頂いたので、今日はこれを青春の定義にさせてもらう。

どう冷静に思い返しても、僕には純粋な意味で「希望をもち、理想にあこがれ、異性を求め」た時期が存在しない。あだち充先生のマンガ*2の中に描かれる"青春”に、中学〜高校時代に心酔した僕は、たぶん当時から”青春”に憧れながらも、そんな立場にいられるほどクラスのヒエラルキーの上位にいなかったのだろう。当時の僕にとって、青春は同世代の限られた人たちに与えられた特権でしかなかった。この「限られた」というのが、どれくらい限られているのかと言うのが、とても重要な論点になるのは当然僕も理解しているが、そんなもの調べたり考えたりしたら、間違いなく憂鬱な気分になるので、見逃してほしい。

ちなみに、僕の人生の暗黒期は間違いなく某高校に通った3年間*3だが、その高校は「文武両道」を掲げていて、当時から"文に全振り"していた僕に上昇のチャンスが来るはずもなかった。

手に入れられなかった青春の偽装

とりあえず僕が言いたいのは、いわゆる青春時代に「希望をもち、理想にあこがれ、異性を求め」られるのはスクールカーストの上位層だけで、僕みたいな輩にはそんな権利がなかったということだ。そして、僕(と、最近結婚した先輩)がアイドルに求めているのは、紛れもなく「希望をもち、理想にあこがれ、異性を求め」る青春の疑似体験であり、これを「手に入れられなかった青春の偽装」と名付けたい。

夢に向かってがむしゃらで、涙ながらに希望と理想が語られて、でも才能と比較して圧倒的に情熱過多な空気感。女の子に「かわいい」と伝えて、気持ち悪がられるどころか「ありがとう」と返されるプロトコル。時間的・経済的に、そして精神的にも自分のキャパの中で自分の居場所が確保できる、非常に良くできた青春の偽装*4。これが、不遇な高校時代を過ごすした僕にとってのアイドルだ。

さいごに

 考えてみれば、僕の「青春の偽装」は今に始まったわけではない。あだち充先生と吉住渉先生のマンガを自分のバイブルに据えたのも、ゆずと19に憧れてアコギとハーモニカを練習したのも、気づいたらブルーハーツが好きになったのも、思い返せばどれもある種の「青春の偽装」だ。今はただ、その青春が、自分の社会的地位と関係なく、もう手の届かない過去になっただけで。

 ということで、今日の〆はこの曲で。BiSH 星の瞬く夜に!

www.youtube.com

最近はアコギばっかり持ってるけど、やっぱり程よく歪んだエレキギターは正義。青春の音がするね。

あ、過去に書いたアイドルについてのエントリもせっかくなんで晒しておきます。気になったら読んでみてください。

 

shoe116.hatenablog.com

 

shoe116.hatenablog.com

 

*1:アイドルヲタはライブ会場のことをこう呼ぶ。ちなみにその日はサーキットイベントで、僕がその先輩を見かけて声をかけたのは大森靖子さんを下北沢GARDENで見た直後で、そういう意味では純粋なアイドル現場ではない。

ちょうどその時の動画がyoutubeにupされていたので参考までに貼っておく。

www.youtube.com

*2:リアルタイムなのはH2だけど、ラフにも相当感化された。短編集のショート・プログラムも好きだった。

*3:大学も大学院も、そして今の生活もこの3年間を思い返せば圧倒的なイージーモードだ。何と言っても、そこまでの配慮なく自分から話かけても、特に問題ない相手が常時存在しているのだから。

*4:完成度が高いという意味で“良い”といっているのであって、コスパの観点でよくできているかどうかは、よくわからない

『君の名は。』における、圧倒的なノスタルジーの実装について(ネタバレを恐れない新海誠賛歌)

無駄に難しい考え事

 はじめに

ようやく秋っぽい毎日が続いているので、久しぶりにBlogでも書く(書こうかなぁとは常日頃思っているが、こうやってエディタを開くところまで行かない*1)。今回は、新海さんの映画『君の名は。』が、相変わらずノスタルジックで最高だったという話を。別に、映画のレビューが書きたいわけでもないので、ネタバレ前提で好きに書く方針です、ごめんね。「興味ある人はもう見てるよね?」くらいのつもりで。公開から十分経ってるずれてるし、TVでもめっちゃ特集してるし、もういいかなぁと(僕は公開初日に見に行って、最近もう一度見た)。

僕にとって新海誠監督の映画は、少なくとも前作までは「圧倒的な完成度で実装された、映像美に基づくノスタルジーこそが魅力で、シナリオ自体はそれほど」だったのだけど、今回はシナリオの妙が、効果的にノスタルジーのインプリ(実装)に貢献していたので、自分の思考の整理のために、僕も僕なりの『君の名は。』賛歌を書いてみたい。

設計と実装について

何かを作る工程は設計(design)と実装(implementation)に分けられる。どういうわけか「デザイン」は一般的な日本語として通用しているのに、「インプリメンテーション」のほうはほとんど使われていない気がするので、実装 - Wikipediaからありがたく引用させて頂く*2

実装というのは、理念的段階にとどまる何らかの機能を、具現化させること(実際に動く具体的なものとして現実世界に出現させること)である。
「設計と実装」は対で語られることが多い。何らかの機能を実現するための方法や枠組みを決定する抽象的な作業(別の表現で言えば、紙の上での作業や、モニタ上での作業)を設計と呼び、その機能を実際に動作させるための具現化(具体化)作業を実装と呼ぶ。

「機能」と書かれてしまうとピンとこない人は、「楽譜と演奏」とか「レシピと料理」を思い浮かべてもらえれば良いと思う。同じ楽譜でも、演奏者や指揮者によって全く違う解釈・演奏が生まれるし、同じレシピから作った料理が、どれも同じ味になることはありえない*3

そして、これがとても重要なポイントなのだけれど、素晴らしい演奏や美味しい料理があるのと同様に、実装には「良い実装」と「悪い実装」があり、それは設計の良し悪しとは独立に、重要かつ致命的だ。結局のところ、モノのクオリティは実装によって支配される。

ノスタルジーを実装するということ

新海誠監督の作る映画に対する僕の感想は、いつだって決まっていて、「懐かしい、ただただ圧倒的に懐かしい」と言うものだ。『君の名は。』も、期待通り(と言うか期待以上)に、「ノスタルジー」という概念が的確に実装されていた。

背景と挿入歌にみるノスタルジーの実装

描きこまれた美しい背景は、いつも通り最高に懐かしかった。朝の満員電車や深夜のコンビニの雰囲気、自動販売機でところどころ明るい夜の帰り道、夕日に浮かぶ東京タワー。これらは、平成を生きる僕らにとっての紛れもない日本の原風景だ。トトロや三丁目の夕日に描かれる、「古き良き日本」より、ずっとリアリティのある、でも同じくらいノスタルジックな光景。もっと言えば、今作で効果的に使われていた「スマホのアラームで起きる」なんていうシーンすら、僕には懐かしく愛おしい。

RADWIMPSの挿入歌にしたってそうだ。

君の前前前世から僕は君を探し始めたよ
そのぶきっちょな笑い方を
めがけてやってきたんだよ

RADWIMPS『前前前世』

www.youtube.com

この世界観と音作り。誤解を恐れないで言えば、「完全にあの頃のBUMP」だ。ここで僕が言いたいのは、「RADWIMPSBUMP OF CHICKENに似ている」とかそういうことではなくて、「もしあの頃(感覚的には中高生の頃だと思う)この映画が作られていたら、絶対BUMPが主題歌唄ってるな〜」と思わずにはいられないということだ(わざわざ書くまでもないことだとは思うが、歌っているのではなく、唄っているのだ。大きな声でりんりんと*4)。

これはどちらも、設計は明確で、そして僕を感傷的にするには十分効果的な「良い実装」だった。

シナリオに巧妙に描かれたノスタルジー

君の名は。』は、簡単にいえば「由緒ある宮水神社の巫女三葉が、(本人は自覚がないまま)糸守とそこに住む人々を彗星から守るために彗星落下後を生きる瀧くんと入れ替わり、糸守を救う」という、ちょっと複雑なタイムリープもの*5だ。

“瀧くんモードの三葉”は、言っていしまえばドラゴンボールZのセル編における未来のトランクスとほぼ同じ役回りだが、『君の名は。』は本人たちが入れ替わっていることに気づいても、時間軸が違うことにしばらく気づかないというシナリオの妙がある。だからこそ2人は純粋に惹かれ合い、1200年周期でやってくる彗星から糸守を守るという神社に生まれた宿命*6的な恋をする。これを可能にしているのは、言うまでもなく“3年”という微妙な時間軸の移動を伴う“都会と田舎”という空間の移動だ。瀧くん(そして映画を見ている僕ら)だって、"入れ替わってる!?"の相手が3年前の東京の女子高生だったら当然瞬間的に理解するはずだ、これが過去であると*7

そして、この設定こそが「ノスタルジーの実装」において何よりも重要だ。糸守の日常に描かれる異常な懐かしさは、気づいてしまえばむしろ当たり前のもので、つまりあれはちょっと前の僕が日々目にしていた日本そのものだ。“ちょっと前”とぼかしたのは、そこに描かれている日本の空気感はむしろ3年より少し前、具体的に言えば「3.11以前の日本」を僕が感じているからだと思う(というとカッコいいが、僕の最初の違和感は“三葉たちの持つスマホが、やたら小さい”ということだった、職業病)。お昼のTVは「いいとも」だし、自然災害なんてみんな忘れているし、JUMPにはこち亀が載っていて、SMAPだって解散の気配すら見せない、そんなちょっと前の日本。残念だけど僕の拙い表現力ではこの感覚を具体的な言葉で伝えることはとても不可能で、それでも「泣きそうになるくらい懐かしい、ちょっと前の日本」が圧倒的な完成度でそこにあった。

つまり何が言いたかったか

君の名は。」最高だから、みんな見たほうが良いよ(ネタバレ思いっきりしたあとで言うのもアレだけど)。あ、あと実装力は正義

今日の1曲は、もちろんこれです。RADWIMPSの『前前前世』。

www.youtube.com

 

 

*1:前回のエントリ

shoe116.hatenablog.com

 を眺めて驚愕した。

 このエントリ、多分次回に続きます

(前略)ということで今日はここまで、きゃりーぱみゅぱみゅさんの「ファッションモンスター」でお別れです。なんとか整理できたらきっと続き書きます。

うん、続きませんでした。忘れてましたw

*2:ちなみにWikipediaは僕が能動的に寄付している、ほとんど唯一に近いNPO団体。Wikipediaはインターネットと人類の夢だと思う。

*3:ちなみに、僕の唯一名前を覚えているクラッシックの指揮者でアルトゥーロ・トスカニーニという人がいる。学生時代、地元の図書館でドサッと借りてきたCDに偶然数枚彼の指揮するNBC交響楽団紛れ込んでいて、それがとても好みだったのだ。簡単に言うと、アップテンポかつ派手で、聞いていて全然退屈しない。

*4:みんな大好きBUMP OF CHICKENガラスのブルース』より引用

*5:クライマックスのシーンは当然パラレルワールドの描写で、つまり瀧くんと三葉は僕らが知っている2人ではないのだが、他の人に話を聞くとそれがあんまり伝わってない気がした。ちなみに、タイムリープものは最終的にパラレルワールドか無限ループのどちらかに帰着する

*6:個人の見解ですが、瀧くんが守りたいのは、三葉というより糸守そのものな気すらしている。つまり、それも結び。

*7:もっというと、瀧くんがiOS、三葉がAndroidというのもそれにとても貢献していて、映画館で「おお!なるほど!」って言いそうになったが自重した。職業病・・・

かわいいの分類学(facebookがおっさんにまみれた、たった1つの理由 前編)

徒然なるままに 無駄に難しい考え事

はじめに

「書きたいことは結構あるのに、いざ書こうと思うと何となくめんどくさくて書かない」日々が続いていました。そんな僕がブログを書くということは、そういうことです。ギターをもって歌うので、お暇でしたら遊びに来てください。

ちなみに、今日は女の子のファッションについて触れるけど、僕自身は全然おしゃれじゃないし、“Tシャツにジーンズとコンバース”が似合う女の子が好きで、それが「スタイルが良くて顔がかわいい子が好き」と公言していることとほとんど等価であることは自覚している*1。なお、このエントリ中に登場する「女の子」は、アイドルにあふれる僕のTwitterInstagramのタイムラインと、小学生の頃から蓄積した少女漫画から得た知識をもとに僕が1人で構築(人はこれを妄想と呼ぶのかもしれない)した、偶像的なものであることをはじめに断っておく。

かわいいの分類学

「モテ」と「かわいい」について

僕は、世間一般の同世代の男性と比べて、圧倒的に“かわいい”について考えている時間が長いと思う。僕がこのエントリで1番伝えたいのは、女の子のいう「かわいい」と「モテ」は全く違う価値基準であるということだ。僕は長い考察と注意深い観察の末、下記の結論に達した。

  • モテ:有限なリソースの奪い合い
  • かわいい:新しいリソースの創出

リソースという言葉がわかりにくければ、「ヒト・モノ・カネ」といっても良い。「モテ」が、有限なリソースの奪い合いであることは、誰もが実体験を持って理解できるはずだ。モテは、残酷なまでのゼロサムゲームであり、あなたがモテるということは、僕がモテないことと等価である。対して、彼女たちの言う「かわいい!」という言葉は、創出された資源に対する感謝・賞賛の声として解釈できる。

かわいいを分類する

概念の理解する際、役に立つのが分類である。なぜなら、概念とは

①同類のもののそれぞれについての表象から、共通部分を抜き出して得た表象(岩波 国語辞典

であり、「同類のものをまとめ、全体を幾つかの集まりに区分する」という分類作業と表裏一体の関係にあるからだ。概念の理解と分類が限りなく近い問題であることは、Deep Learning(深層学習) の定番サンプルがMNISTと呼ばれる、手書きの数字(0 - 9)データセットの分類であることからも分かる通りであり、連続的な光のスペクトルであるはずの虹の色を、赤橙黄緑青藍紫の7つに分けられる理由もこれだ。

 ところで「かわいい」の分類には定番のものが既に存在しており、つまり女性ファッション誌でいう「赤文字」と「青文字」がそれだ。ご存じない方もいると思うので、簡単にWikipediaを引用する。

「赤文字系」は明確に定義が決まっている

JJ、ViVi、Ray、CanCamの4誌、またはそれらにPINKYを加えた5誌を指す。各誌とも題字が赤またはピンクなどの赤系色であることからこの名称がつけられた。(中略)

いずれもコンサバファッションを扱っており、また各誌ともファッション・メイク・ヘア関連のみならず、芸能、グルメ、旅行、就職、恋愛など、この年代の女性の関心の高い情報の掲載も力を入れている。

赤文字系雑誌 - Wikipedia

対して、青文字系には諸説あるが、下記に説明が一番都合がいいので今回はこの定義に従う。

「青文字系」という言葉はアソビシステム株式会社代表の中川悠介が命名した。同社が主宰する原宿系イベントがテーマにするファッション性を、赤文字系と区別するために便宜上名付けたのが起源といわれている。

引用:青文字系雑誌 - Wikipedia

つまり、“青文字 = not 赤文字”だ。僕は以前勘違いしていたのだけれど、女の子にとってこの2つのファッションはattributeではなくoccasionであり、様々な外部要因や気分によって適切に使い分けるものらしい。例えば青文字の代表格であるきゃりーぱみゅぱみゅすらCanCamの表紙を飾るとこうなる(左・赤文字)。参考までに、Zipper(右・青文字)の彼女を上げておく。

f:id:shoe116:20160702020031p:plain

どちらのきゃりーちゃんもとても“かわいい”のだけれど、そのかわいさは全く異質であることがわかっていただけると思う(引用:初の赤文字系ドキドキ|きゃりーオフィシャルブログ)。

僕は赤文字のファッションの根底にあるのは、紛れも無く「モテ」であると思っている。青文字は前述のとおりモテ以外のすべてを含む、すべての「かわいい」を指すが、1つの大きな基底要素はおそらく自己表現*2。保守的な女性らしいかわいさと、現代的な自分らしいかわいさと言い換えることもできるだろう。

f:id:shoe116:20160706080628p:plain

重要なのは、最終的に「かわいい」に昇華される必要があることであり、モテ・自己表現のそのものは「かわいい」ではないという点だ。隠蔽されないモテは攻撃的で恐怖・嫌悪の対象であり、むき出しの自己表現は往々にしてイタいと嘲笑される。

このエントリ、多分次回に続きます

実のところ、このエントリの当初のテーマは「かわいいの分類」ではなく、facebookがおっさんまみれになった理由の考察であった。フェイスブック:「おじさん」が穴埋め? 10代が45%から27%に減少 - 毎日新聞 というような記事を引用する必要もないくらい、実感としてfacebookのニュースフィードにはおっさんが溢れているし、ネット上では多くの人がその理由を分析・解説している。僕個人としては、「モテたいおっさんが増えすぎた」のが最大の理由だと思っていて、なんとか言語化しようと頑張ったんだけれど、かわいいの話(というかかわいいとモテは違うという話)をしたところで力尽きてしまった。

ということで今日はここまで、きゃりーぱみゅぱみゅさんの「ファッションモンスター」でお別れです。なんとか整理できたらきっと続き書きます。7/10のお昼のライブ*3よろしく、遊びに来てね!

www.youtube.com

 

*1:僕が一番かわいいと思っている女の子として、映画「好きだ、」宮崎あおいさんと「100万円と苦虫女」蒼井優さんを上げておこうと思う。興味があったら是非見てほしい。

*2:僕はその代表格が、休刊してしまったオリーブ(Olive)だと思っている

*3:しつこいようだが、詳細を。

相関と因果のがいねんと、マーケティングとの関係について、わかりやすい例を上げて考えてみた

datascience 徒然なるままに

とりあえず

この前は最後にしたけど、とりあえず告知的なのを最初に書いておく。告知することがないと、blogを書く気にならないのは自分でもどうかと思うが、まあ仕方がない。

  • 日時:2016.04.22(金) 
  • 値段:¥1,000 + Drink (2D ¥1,000/飲み放題 ¥2,000)
  • 場所:高円寺CLUB LINER
  • その他:ローストビーフ丼とお菓子が食べれるらしい。多分僕は20時くらいからだけど、飲み放題だから、適当に来てずっと飲んでいればいいと思う。

「金曜日だから」「酒飲みたい」くらいの、各人にとって都合のいい理由で遊びに来てくれたら泣いて喜ぶ(出演者も飲み放題っぽい、ただただ楽しみw)。

はじめに:“がいねん”について

「数式を並べるんじゃなくて、概念を説明してほしい」的なことを言われた経験がある、いわゆる理系な人は僕だけじゃないはずだ。概念の辞書的な意味は

①同類のもののそれぞれについての表象から、共通部分を抜き出して得た表象
②対象を表わす用語について内容がはっきり決められ適用範囲も明確な意味

(岩波 国語辞典)

なので、一般化された数式ほど概念を伝えるのに適した表現方法もないのになぁとずっと不思議だったのだけど、就職活動をしている辺りで僕は気づいた。どうやら、「概念を説明して欲しい」というのは、「抽象化された数式は難しくて理解できないので、具体例を上げて説明してほしい」という意味で日本のサラリーマンの中で用いられる隠語だ。初めて見る数式を、すぐに理解できないことなんて、(少なくともそんなに数学が得意じゃない僕にとっては)日常茶飯事のことなのに、なんでこんなわかりにくい表現を使うんだろ?バカだと思われるのが嫌なのかなぁ・・・?誰もそんなこと思わないと思うんだけど。

ということで、不幸な誤解を避けるために、この隠語を以後“がいねん”と表記し、辞書的な意味である概念とは明確に区別することにする。とても大切なことなのでついでに書いておくと、数式の「見た目の難しさ」と「(辞書的な意味での)概念の難しさ」は何の関係もない。特殊相対性理論の質量とエネルギーの等価性を示す、"E=mc^2"の見た目はとても簡単だけれど、その概念を僕は理解できない。

マサカリを投げられても困るのではじめに断っておくが、僕は数学的に正しく伝える気は全く無い。ちゃんと概念を理解したい人は、数式が載っている本なりwebページを参考にしてほしい。

相関と因果の“がいねん”について

相関と因果の関係

このエントリでは、「片方の数値が変化すると、もう一方の数値も変化する」関係を相関と呼ぶことにする。また、「片方の数値の変化が原因で、もう一方の数値が変わる」という関係を因果と呼ぼう。

こう書くと、紛らわしいし、相関と因果って似てるのかな?と思う人がいるかもしれないが、この2つは全く別の関係だ。簡単な例を出して説明したい。

「傘を持って家を出る人の割合」と「その日の降水確率」

 この2つには、相関がある。傘を持って家をでる人の割合が多い日は、降水確率がきっと高い。逆に、降水確率が高ければ高いほど、多くの人が傘を持って家を出るだろう。因果かどうかは、傘を持って家を出る人の割合を増やしたらどうなるかを考えればよい。もし「因果かも!」と思えた人は、一刻も早く「世界の水不足に悩む地域で、傘を持って家を出る人を増やす」という活動をはじめていただきたい。勘違いのしようがないくらい、相関と因果は異質なものだ。

ちなみに、「相関関係であって、因果関係ではない」ということはとても簡単に起こる。例えば、「同じように増加する2つの指標」には全部相関がある。ちょうどいい例があったので載せておく*1と、「自閉症(Autism)とオーガニックフードの売上(Organic Food Sales)」には以下の様な関係がある。

f:id:shoe116:20160419215833p:plain

相関係数(どれくらい相関があるか、という数字。1に近ければ近いほど相関がある)は0.9971。素晴らしい。なんでこんな相関があるかは分析するまでもなく、つまり偶然だ

因果は相関と別にある

せっかくなので、今度はマーケティングに役立ちそうな例題でも考えてみよう。

[問1]

ある広告と、ある商品の購買に相関がありました。その商品をもっと売るには、どうすればいいでしょう?

 

[問2]

あなたは居酒屋の店長さんです。常連さんを観察したら、あるメニューが大人気であることがわかりました。

そのメニューをお客さんみんなにオススメしたら、常連客は増えるでしょうか?

何も考えずに、「相関があるから簡単だ!」と思ったマーケッターのみなさんは、明日にでも「世界の水不足に悩む地域で、傘を持って家を出る人を増やす」というキャンペーンを始めてほしい。大丈夫、きっとうまくいかない*2

大切なのは、問題の難しさを理解することだ。散々書いてきたように、相関は因果を教えてくれない。月の満ち欠けと潮の満ち引きに相関があることは昔から観察結果として知られていたが、それが万有引力で説明された*3のはずっと後のことだ。ここで重要なのは、ニュートンが見ていたのは“木から落ちるりんご”であって、月でも潮でもないということだ(ここでは文章のテンポとリズムを優先して、こういう書き方をしているが、正直なところこの表現は僕の真意ではない*4)。相関から因果関係を説明するには“明確な理由”が他に必要で、「相関があるから」と言うのは理由にならない。広告と購買にも、常連さんに人気なメニューも、何か別の理由で因果を説明できてしかるべきだ。例えば「カメラを構える宮崎あおいがかわいい」とか、「そのメニューが安くて美味しい」とか。

 最後に

結局のところ何が言いたかったというと、僕がブログを書く頻度と、歌を人前で歌う日程*5には相関があるということだ。

新譜も出るみたいなので、今日は相対性理論の「LOVEずっきゅん」でお別れです。

www.youtube.com

 

*1:以下よりありがたく引用させていただく。

boingboing.net

 こんなのもあった。海賊の減少が、地球温暖化の原因という説があるらしい。さすが空飛ぶスパゲッティ・モンスター教は奥が深い。

www.venganza.org

*2:かつてないほど煽り口調なのは、某K氏から、前回のエントリ

shoe116.hatenablog.com

 について「大人しすぎる」「もう少し煽ったほうが面白いのでは?」というありがたいfeedbackを頂いた事による。

*3:もしかしたら知らない人がいるかもしれないから、国立科学博物館の「宇宙の質問箱」を貼っておこう。対象読者をどれくらいの層に設定しているかわからないけれど、とても科学に対して真摯な説明だった。さすが。

国立科学博物館-宇宙の質問箱-月編

*4:言いたかったこと以上のことが

detail.chiebukuro.yahoo.co.jp

に記載されていたので、ここではこれをありがたく紹介するに留める。

*5:冒頭にも書いた。

  • 日時:2016.04.22(金) きっと20時くらい
  • 値段:¥1,000 + Drink (2D ¥1,000/飲み放題 ¥2,000)
  • 場所:高円寺CLUB LINER