book review

what you see is all there is

働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」

働きたくないイタチと言葉がわかるロボット  人工知能から考える「人と言葉」

働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」

☆☆☆☆

  • なぜ読んだのか
     言語によるコミュニケートの際に感じる理解の差異や,現在の自然言語処理の問題点等に関心があり,読了

  • サマリー
     著者は,「大量のデータからの機械学習」を使い,言葉を理解するために必要な条件(p.254)を機械に組み込もうとした場合の全体に共通する課題を3つ列挙(p.255)し, 現在主流の方法の延長線上で「言葉を理解する機械」を実現することは極めて難しく,まだまだ「課題の達成と、次の課題の発見」が繰り返されると推測する.

  • 発見

人間も機械も「言葉の聞き取り」をするときに発音された個々の「音声」を「音素」に結びつけることを必ずしなければならない.
音声 = ものが振動することで起こる物理的な波として私たちに向かって話され,私たちの耳に入る言葉
音素 =「物理的な音」ではなく,言葉を構成する「抽象的な音の単位」.私たちが言葉を聞き取る上で「同じ音」だと思っている音のまとまりのこと.「ん」や「い」,「う」のような,同じ種類とみなされる音声のカテゴリーのこと1
(p.23)

私たちがある言語の音を聞き取れるようになるには,その言語における「音声のカテゴリー化の仕方」が分かり,聞こえてくる個々の音,本当は声質や発音によって一つひとつ異なる音声に「カテゴリー」(音素)を結びつけることができる必要がある (p.24)

赤ちゃんが日本語環境にいる場合,6~8ヶ月の間に「l」「r」の違いが聞き取れなくなるのは,「日本語では無視していい音声の違い」を知り,日本語を理解する上で必要な「音声のカテゴリー化」,つまり「音声と音素の対応づけ」を学んでいることの表れ (p.30)

[赤ちゃんは機械と違い]単語の学習と並行して,学習した数少ない単語の中に表れる音声を分析して「音素」を学んでいる(中略)音声の分析・音素の学習と,単語の学習を同時進行で行い,互いに互いを利用していると考えることができる (p.30)

word2vecでは,「ベクトルの足し算と引き算が意味の計算に対応する」という現象が報告されている.例えば「王様」を表すベクトルから「男」を表すベクトル引き、「女」を表すベクトルを足すと、そのベクトルは「女王」に近くなる.他にも、「パリ」から「フランス」を引いて「イタリア」を足すと「ローマ」になるという例がある.つまり首都の関係をベクトルの計算で近似できる (p.200)

  • どう活かすか
    国語学習は,「音声と音素の対応づけ」を意識すると良さそうだ.

クリエイティブ・コモンズ・ライセンス


  1. 色の分類は 齋藤孝 『三色ボールペン情報活用術』 角川書店,2003年.を参考