2014/02/03

とっさに思い浮かべる光景は個人情報そのもの

去年、あるWEBサイトに掲載された『Facebookで何に対して「いいね!」を押すかによって、人種やIQ(知能指数)、性別をはじめとする個人データが明らかになる可能性がある。』という記事が話題になった。統計モデルを使った判定方法だ。

それに対抗するわけじゃないけれど、「だったら、こんな見方もあるんじゃないか?」と、思い当たることが幾つかあるので、これから何回かに分けて書いてみよう。


■とっさに思い浮かべる光景は個人情報そのもの
まずは、「小学校の授業中に、・・・」と聞いて思い浮かべる光景は何か考えてみたい。多くの人は、自分の母校か、子供がいればその学校を思い浮かべるだろう。日本人であれば、発展途上国の青空学校を、思い浮かべたりはしないはず。つまり、とっさに思い浮かべる光景や人間像は、自分自身あるいは自分の身近な人間に関わる事である可能性が高いということだ。

それを踏まえて、以下のコメント(facebookやyahooコメントより抜粋)を見てどう思うだろうか。

・最近、エクアドルで、日本人夫婦が殺傷されるという悲しい事件が起きた
コメントA】「エクアドルは日本とは違って治安が悪ことが考慮できておらず、無防備だったのではないか。」コメントB】「治安が悪いところに行くのだから、安全面については相当の対策をしていたはず。それでも事件に巻き込まれたのは、よほど想定外のことがあったのではないか。」

・毎日遅くまで残業をしている若者
【コメントC】「残業を強いられているのではないか。ブラック企業の規制を検討すべきだ。」コメントD】「その人は自分の好きな職に就けており、仕事が楽しく充実しているのではないか。」

・iPhoneを使っている人
【コメントE】「日本人は流行に従う傾向があるからね。」【コメントF】「APPLEのフィロソフィには人を引きつけるものがあるからね。」

・高級腕時計などを含む貴金属の売り上げが大幅に伸びた
【コメントG】「時計だけ高級でも、着ている洋服が安物ではダメだと思う。」【コメントH】「アクセサリーを上品に着けている人を見ると、自分も買ってみたいと思う。」


コメントAよりもBを書いた人のほうが治安の違いに対応できる人だろうし、コメントCよりもDを書いた人のほうが仕事がデキル人である可能性が高いと僕は思う。コメントE以降も同様。当然、100%そうだとは言い切れないけれども、傾向として。

コメントを書いた人がどんな人なのかを推測したり、あるいは、自分の書いたコメントが必要以上にパーソナリティをさらけ出していないかを確認するときに、この観点が役立つと思う。

2014/02/02

言語の効率性

観光地や空港など外国人が集まるような場所では、アナウンスが日本語だけでなく、英語、中国語、韓国語と、複数の言語で流れるのを聞いたことがある人は多いだろう。注意して聞いていると、言語によってアナウンスの流れる時間の長さが違うことに気付く。

例えば以下のセンテンスを比較をしてみる。

日本語
彼は来るのか来ないのか(カレハクルノカコナイノカ)
※()内は発音を表す。

英語
whether he comes or not(ウェザーヒーカムズオアノット)

中国語
他来不来(タライプライ)


中国語が一番短い。ここまで長さが違うとは衝撃的だ。最近中国語を習い始めて、常々感じていたことでもある。当然、言葉の内容によっては、長さに差が無かったり逆転することはあるが、総体的にみると中国語が短い傾向がある。


■長さの違いが与える影響とは?(予想)
ここで、コンピュータのチューニング(計算能力を向上させる方法)を考えてみる。チューニングするには様々なアプローチがあるが、その1つに、データのサイズを小さくする方法ががある。そうすることで、コンピュータ内の回路を流れるデータ量が減り、結果、単位時間内の計算量を増やすことができるというものだ。

これを人間の脳で考えてみると、1つの情報をより短い単語で表現できれば、何かを考えたりするスピードが上がると考えられる。その観点では、同じIQの日本人と中国人がそれぞれの母国語で何かを考えた場合、そのスピードは中国人のほうが早いのかもしれない。(人間の脳のなかで言葉を扱っているのは言語野と言われる一部分であることを考慮する必要はあるが。)