TED日本語 - レベッカ・クラインバーガー: 自分の声が嫌だと感じるのはなぜか

TED日本語

プレゼンテーション動画

TED日本語 - レベッカ・クラインバーガー: 自分の声が嫌だと感じるのはなぜか

TED Talks

自分の声が嫌だと感じるのはなぜか
Why you don't like the sound of your own voice
レベッカ・クラインバーガー
Rebecca Kleinberger

内容

私たちの声は、他人から見た私たち自身の印象と区別できせません。しかし、私たちと自分自身の声との関係は非常に不明瞭です。レベッカ・クラインバーガーは、私たち人間がどのように声を使い、どのようにして自分の声と他人の声を理解するのかを研究しています。このトークでは、自分の声が嫌いだと感じるのであればそれはなぜかなのか、「外向きの声」「内向きの声」「内声(心の声)」の違いとは何か、そして自分自身は気づかずに私たちが発している驚くべき情報について解説します。

Script

If you ask evolutionary biologists when did humans become humans, some of them will say that, well, at some point we started standing on our feet, became biped and became the masters of our environment. Others will say that because our brain started growing much bigger, that we were able to have much more complex cognitive processes. And others might argue that it's because we developed language that allowed us to evolve as a species. Interestingly, those three phenomena are all connected. We are not sure how or in which order, but they are all linked with the change of shape of a little bone in the back of your neck that changed the angle between our head and our body. That means we were able to stand upright but also for our brain to evolve in the back and for our voice box to grow from seven centimeters for primates to 11 and up to 17 centimetres for humans.

And this is called the descent of the larynx. And the larynx is the site of your voice. When baby humans are born today, their larynx is not descended yet. That only happens at about three months old. So, metaphorically, each of us here has relived the evolution of our whole species. And talking about babies, when you were starting to develop in your mother's womb, the first sensation that you had coming from the outside world, at only three weeks old, when you were about the size of a shrimp, were through the tactile sensation coming from the vibrations of your mother's voice.

So, as we can see, the human voice is quite meaningful and important at the level of the species, at the level of the society -- this is how we communicate and create bonds, and at the personal and interpersonal levels -- with our voice, we share much more than words and data, we share basically who we are. And our voice is indistinguishable from how other people see us. It is a mask that we wear in society. But our relationship with our own voice is far from obvious. We rarely use our voice for ourselves; we use it as a gift to give to others. It is how we touch each other. It's a dialectical grooming.

But what do we think about our own voice? So please raise your hand if you don't like the sound of your voice when you hear it on a recording machine.

(Laughter)

Yeah, thank you, indeed, most people report not liking the sound of their voice recording. So what does that mean? Let's try to understand that in the next 10 minutes. I'm a researcher at the MIT Media Lab, part of the Opera of the Future group, and my research focuses on the relationship people have with their own voice and with the voices of others. I study what we can learn from listening to voices, from the various fields, from neurology to biology, cognitive sciences, linguistics. In our group we create tools and experiences to help people gain a better applied understanding of their voice in order to reduce the biases, to become better listeners, to create more healthy relationships or just to understand themselves better.

And this really has to come with a holistic approach on the voice. Because, think about all the applications and implications that the voice may have, as we discover more about it. Your voice is a very complex phenomenon. It requires a synchronization of more than 100 muscles in your body. And by listening to the voice, we can understand possible failures of what happens inside. For example: listening to very specific types of turbulences and nonlinearity of the voice can help predict very early stages of Parkinson's, just through a phone call. Listening to the breathlessness of the voice can help detect heart disease. And we also know that the changes of tempo inside individual words is a very good marker of depression.

Your voice is also very linked with your hormone levels. Third parties listening to female voices were able to very accurately place the speaker on their menstrual cycle. Just with acoustic information. And now with technology listening to us all the time, Alexa from Amazon Echo might be able to predict if you're pregnant even before you know it. So think about --

(Laughter)

Think about the ethical implications of that. Your voice is also very linked to how you create relationships. You have a different voice for every person you talk to. If I take a little snippet of your voice and I analyze it, I can know whether you're talking to your mother, to your brother, your friend or your boss. We can also use, as a predictor, the vocal posture. Meaning, how you decide to place your voice when you talk to someone. And you vocal posture, when you talk to your spouse, can help predict not only if, but also when you will divorce.

So there is a lot to learn from listening to voices. And I believe this has to start with understanding that we have more than one voice. So, I'm going to talk about three voices that most of us posses, in a model of what I call the mask. So when you look at the mask, what you see is a projection of a character. Let's call that your outward voice. This is also the most classic way to think about the voice, it's a way of projecting yourself in the world. The mechanism for this projection is well understood. Your lungs contract your diaphragm and that creates a self-sustained vibration of your vocal fold, that creates a sound. And then the way you open and close the cavities in you mouth, your vocal tract is going to transform the sound.

So everyone has the same mechanism. But voices are quite unique. It's because very subtle differences in size, physiology, in hormone levels are going to make very subtle differences in your outward voice. And your brain is very good at picking up those subtle differences from other people's outward voices. In our lab, we are working on teaching machines to understand those subtle differences. And we use deep learning to create a real-time speaker identification system to help raise awareness on the use of the shared vocal space -- so who talks and who never talks during meetings -- to increase group intelligence.

And one of the difficulties with that is that your voice is also not static. We already said that it changes with every person you talk to but it also changes generally throughout your life. At the beginning and at the end of the journey, male and female voices are very similar. It's very hard to distinguish the voice of a very young girl from the voice of a very young boy. But in between, your voice becomes a marker of your fluid identity. Generally, for male voices there's a big change at puberty. And then for female voices, there is a change at each pregnancy and a big change at menopause. So all of that is the voice other people hear when you talk. So why is it that we're so unfamiliar with it? Why is it that it's not the voice that we hear? So, let's think about it.

When you wear a mask, you actually don't see the mask. And when you try to observe it, what you will see is inside of the mask. And that's your inward voice. So to understand why it's different, let's try to understand the mechanism of perception of this inward voice. Because your body has many ways of filtering it differently from the outward voice. So to perceive this voice, it first has to travel to your ears. And your outward voice travels through the air while your inward voice travels through your bones. This is called bone conduction. Because of this, your inward voice is going to sound in a lower register and also more musically harmonical than your outward voice. Once it travels there, it has to access your inner ear. And there's this other mechanism taking place here. It's a mechanical filter, it's a little partition that comes and protects your inner ear each time you produce a sound. So it also reduces what you hear. And then there is a third filter, it's a biological filter. Your cochlea -- it's a part of your inner ear that processes the sound -- is made out of living cells. And those living cells are going to trigger differently according to how often they hear the sound. It's a habituation effect. So because of this, as your voice is the sound you hear the most in your life, you actually hear it less than other sounds.

Finally, we have a fourth filter. It's a neurological filter. Neurologists found out recently that when you open your mouth to create a sound, your own auditory cortex shuts down. So you hear your voice but your brain actually never listens to the sound of your voice. Well, evolutionarily that might make sense, because we know cognitively what we are going to sound like so maybe we don't need to spend energy analyzing the signal. And this is called a corollary discharge and it happens for every motion that your body does. The exact definition of a corollary discharge is a copy of a motor command that is sent by the brain. This copy doesn't create any motion itself but instead is sent to other regions of the brain to inform them of the impending motion. And for the voice, this corollary discharge also has a different name. It is your inner voice.

So let's recapitulate. We have the mask, the outward voice, the inside of the mask, your inward voice, and then you have your inner voice. And I like to see this one as the puppeteer that holds the strings of the whole system. Your inner voice is the one you hear when you read a text silently, when you rehearse for an important conversation. Sometimes is hard to turn it off, it's really hard to look at the text written in your native language, without having this inner voice read it. It's also the voice that refuse to stop singing the stupid song you have in your head.

(Laughter)

And for some people it's actually impossible to control it. And that's the case of schizophrenic patients, who have auditory hallucinations. Who can't distinguish at all between voices coming from inside and outside their head. So in our lab, we are also working on small devices to help those people make those distinctions and know if a voice is internal or external.

You can also think about the inner voice as the voice that speaks in your dream. This inner voice can take many forms. And in your dreams, you actually unleash the potential of this inner voice. That's another work we are doing in our lab: trying to access this inner voice in dreams. So even if you can't always control it, the inner voice -- you can always engage with it through dialogue, through inner dialogues. And you can even see this inner voice as the missing link between thought and actions.

So I hope I've left you with a better appreciation, a new appreciation of all of your voices and the role it plays inside and outside of you -- as your voice is a very critical determinant of what makes you humans and of how you interact with the world.

Thank you.

(Applause)

人間が人間になったのはいつなのか 進化生物学者に尋ねたら 何人かはこう言うでしょう 「ある時点から 自身の脚で立つようになり 二足歩行動物になって 自然を支配するようになったのだ」 それまでと比較にならないほど 脳が肥大したおかげで はるかに複雑な認知過程を持つようになった と言う学者もいるでしょう 言語が発達したおかげで 種として進化できたのだと 論じる学者もいるかもしれません 面白いことに この3つの 現象はすべてつながっています どうやって どんな順序でかは わかりません しかし どれもが 首の後部にある頸椎の 形状変化に起因しています これにより 頭と体の間の 角度が変わったのです つまり 直立できるようになり さらに脳も後部で進化し それまでの霊長類の喉頭は 7センチメートルでしたが 11~17センチメートルにまで 大きくなりました

これが「喉頭降下」です 喉頭とは声が出る場所です 現人類の喉頭は 赤ん坊として 生まれた時点ではまだ下降していません 約3ヶ月齢になって初めて起こります 喩えるならば ここにいる私たち一人ひとりが 全人類の進化の過程を 自ら辿ってきているということです 赤ん坊といえば 胎児が母親の子宮の中で 成長を始めて 外の世界から来る初めて感覚 ― 受精からわずか3か月 小エビ程度の大きさしかない時です ― それは「触感」なのです 母親の声の振動から来るものです

お分かりのように 人間の声には とても意味があり 重要なのです 「種」のレベルでも 「社会」のレベルでもそうです 声とは意思疎通や 絆を築く方法です 「個人」や 「個人間」のレベルでも 私たちは声を使って 言葉やデータより はるかに多くを伝えます 要は 自分という存在を 表現するわけです そして 私たちの声は 他人から見た 私たち自身の印象と区別できません 私たちが社会の中で かぶっている仮面なのです でも 私たちと 自分自身の声との 関係は非常に不明瞭です 自分に向けて声を発することは滅多になく 他人に「与える」という形で使います 人と触れ合う方法が声なのです 猿の毛づくろいを 言葉で行っているわけです

でも 自分の声について どう思っていますか? 挙手でお答えください 録音された自分の声が 嫌だという人?

(笑)

ありがとうございます 実際 ほとんどの人が 録音された自分の声は嫌いだと言います どういうことでしょうか これからの10分で説明しましょう 私はMIT Media Labの研究員で Opera of the Futureという 研究室の所属です 私の研究では 人が自分の声や他人の声と どのような関係を持つのか 調べています 人の声を聴くことで 導き出せることを研究しています 関連分野は多岐にわたり 神経学 生物学 認知科学 言語学まで含まれます 私の研究室で開発している ツールやアクティビティを使えば 自分の声への理解が深まり 実生活にも役立ちます 先入観を軽減したり 傾聴力を伸ばしたり より健全な人間関係を作ったり ただ自分自身への理解を 深めたりなどです

そうするには「声」について あらゆる側面を考える必要があります 「声」について知識を深めるにつれ 何に使えるのか どんな意味合いがあるのか 色々と考えてみてください 「声」とは非常に複雑な現象です 体中の100種類以上の筋肉を 同時に動かす必要があります そして 声を聴くことで 体の内部で起こっているかもしれない 異変についてもわかるのです 例えば 人の声に表れる いくつかの非常に特徴的な乱れや 非直線性を聴き取ることで ごく初期のパーキンソン病を 発見するのに役立ちます これが電話でできるのです 声に表れる息切れを聴き取ることで 心臓病の発見に役立ちます それぞれの単語を発音する際の テンポの変化が 非常にはっきりした うつ病の兆候 であることもわかっています

人の声は ホルモンレベルとも 深く連動しています 女性の声を聴いた第三者が その女性が月経周期の中で どの時期にいるのかを ピッタリ当てることができたのです 聴覚情報のみからです そして今 テクノロジーは 常に私たちの声を聴いています だから Amazon Echoのアレクサが あなたの妊娠を あなた自身が気づく前に 推測できるかもしれないのです だから…

(笑)

倫理的な問題点も 考えてみてください また 声は人間関係の構築にも 深い繋がりがあります 人は話す相手が変わると それぞれに向けて違った声を出すんです あなたの声の 断片的なサンプルを分析すれば 会話の相手がお母さんなのか兄弟なのか 友人なのか上司なのかがわかります また あなたの「発声態度」を読むことで 将来の予測も可能です 誰かと話す時にどんな風に意識して 声を出しているかです 配偶者と話している時の発声態度から あなたが離婚するかどうかだけでなく いつ離婚するかまで予測できるのです

声から読み取れることは たくさんあるということです まずは 私たちが持っている声は 1つではないと 理解することから 始めなければいけません 私たちのほぼ誰もが持っている 3つの声について 「仮面」というモデルを使って お話ししますね 仮面というものは ある性格特性を反映しています 「外向きの声」と呼びましょう これは 声についての考え方としても 最も古典的です 声はその人自身を 世界に投影する方法なのです この投影の仕組みについては よく知られています 横隔膜が弛緩すると 肺から空気が押し出され その結果 持続的に声帯が振動して 音が生まれます 次に 口内の空洞を 開閉することで 声道が音を変化させるのです

この仕組みは誰でも同じです しかし声は 一人一人 大きく異なります これは 体格 生理機能 ホルモンレベル といった ごく僅かな違いにより 外向きの声に ごく僅かな違いが生まれるためです 人間の脳は 他人が発する外向きの声から この僅かな違いを感じ取るのに長けています 私の研究室では この僅かな違いを読み取れるよう 機械に教え込んでいます ディープラーニング(深層学習)を 即時話者識別システムに利用し 皆が共有する会話の場がどう使われているかの 意識向上に役立てています 例えば 会議中に誰が発言して 誰が黙っているのかなど 集団としての知性を高めるためです

ここで難しいのは まず 人の声は不変ではないということです 先ほど 話す相手によって 自分が出す声も変わるとお話ししましたが 人の人生の中でも 総じて 声は変化していきます この旅路の始まりと終わりでは 男性の声と女性の声は 非常に似ています 幼い女の子と幼い男の子の声を 聴き分けるのは非常に難しいものです しかし 幼齢と老齢の中間では 声は 移り変わるアイデンティティの標識となります 一般に 男性の声は 思春期に大きく変化します そして女性の声は 妊娠するごとに変化し 閉経時にも大きく変化します 今までのお話はすべて 周りの人々が聞くあなたの声についてです ではなぜ 私たちは自分自身の声に こんなにも馴染みがないのでしょう なぜ 自分自身が聞いている声は 外に出る声と違うのでしょう では 考えてみましょう

仮面を着けているとき その仮面は自分には見えません それを見ようとして見えるのは 仮面の内側です それが「内向きの声」です 違いの理由を理解するために まず 内向きの声を知覚する メカニズムを考えてみましょう 内向きの声が人体の中で通る フィルターの経路は 外向きの声とは違うからです 知覚するためには まず 耳に届かなければなりません 外向きの声は 空気中を伝わりますが 内向きの声は 骨を通って伝わります これを「骨伝導」といいます このため 内向きの声は 低い声区の中で響き また 外向きの声よりも 音楽的に調和が取れているのです 内向きの声が耳に伝わると 次は内耳に届きます そこで また違った仕組みが働きます それは機械的なフィルターで あなたが音声を出すたびに 内耳を保護しようと働く小さな仕切りです 聞こえるものの音量を 下げる機能もあります 3つ目のフィルターは 生物学的なフィルターです 内耳の一部にあり 音を処理する蝸牛という器官は 生きた細胞で出来ています この生きた細胞は 音が聞こえる頻度によって 異なる反応を起こします それは「慣れ」の効果です そういうわけで 自分の声は 人生の中で 最も多く聞く音でありながら 実際に聞こえる分は 他の音よりも少ないのです

最後4つ目のフィルターは 神経学的フィルターです 近年の神経学での発見によると 音を出すために口を開くとき その人自身の聴覚皮質は 停止するそうです つまり 自分の声が聞こえていても 実際は 脳はその声を 聴いていないという訳です まあ 進化の上では もっともなことかもしれません 自分の声がどう響くか 認知上では知っているからです そのシグナルを分析するのにエネルギーを 費やす必要はないのかもしれません これは「随伴発射」といって 体の動き一つひとつに伴って 起こるものです 「随伴発射」とは 正確には 脳が発する運動指令の複製で そのものは動作を起こしませんが その代わり 次に起こる動作は何かを伝達するため 脳の他の領野に送られます 声について言えば 随伴発射には 別の呼び名があります 「内声(心の声)」です

では ここまでをまとめます 人には仮面として 「外向きの声」があり 仮面の内側には 「内向きの声」があり さらに「内声」があります 内声とは 操り人形の糸を 操作している人のようなものです 内声が聞こえるのは 例えば 文を黙読しているときや 大事な話を頭の中で リハーサルしているときです 内声を断つのは時に難しく 母国語で書かれた文を見て 内声が読まないようにするのは 非常に難しいことです 頭の中で流れる下らない歌を 止めようとしても 止めてくれないのが内声です

(笑)

内声が 自分ではどうにもならない という人もいます 統合失調症患者の場合です 幻聴があり 自分の内声と外から来る声を 区別できません 私の研究室では こういった人たちが 内側から来ている声と 外側のら来ている声とを 区別するのに役立つ 小型デバイスを開発中です

内声はまた 夢の中で聞こえる声とも考えられます 内声には色々な形があるのです 夢の中では内声が秘める可能性を 解き放っているというわけです これが私の研究室での もう一つの研究で 夢の中で聞こえる内声に アクセスすることです 内声をいつも制御できるわけでは ありませんが 関わりを持つことは いつだってできます 内なる対話を通すのです さらに 思考と動作との 間に存在する繋がりが 内声であると考えられます

さて これで 自分が持つすべての声についてや それが自分の中と外で 果たす役割についての理解が 深まったのではないかと思います 声とは 人間を人間たらしめる 非常に重要な決定因子であり 世界と交流する方法なのです

ありがとうございました

(拍手)

― もっと見る ―
― 折りたたむ ―

品詞分類

  • 主語
  • 動詞
  • 助動詞
  • 準動詞
  • 関係詞等

関連動画