TED日本語 - スーザン・エトリンガー: ビッグデータにどう向き合うべきか?

TED日本語

TED Talks(英語 日本語字幕付き動画)

TED日本語 - スーザン・エトリンガー: ビッグデータにどう向き合うべきか?

TED Talks

ビッグデータにどう向き合うべきか?
What do we do with all this big data?
スーザン・エトリンガー
Susan Etlinger

内容

あるデータのおかげで、心地よい気持ちになれますか?より成功していると感じることができますか?だとしたら、あなたのそのデータの解釈は間違っている可能性が高いでしょう。この驚くほど心を揺さぶられるトークで、スーザン・エトリンガーは、より多くのデータを手にすればするほどに、私たちの批判的に考える能力もまた深められなければならない理由を説明してくれます。なぜなら、単に物を数えるところを超えて、それらを本当に理解するところまで到達するのは、とても難しいのです。

Script

Technology has brought us so much: the moon landing, the Internet, the ability to sequence the human genome. But it also taps into a lot of our deepest fears, and about 30 years ago, the culture critic Neil Postman wrote a book called "Amusing Ourselves to Death," which lays this out really brilliantly. And here's what he said, comparing the dystopian visions of George Orwell and Aldous Huxley. He said, Orwell feared we would become a captive culture. Huxley feared we would become a trivial culture. Orwell feared the truth would be concealed from us, and Huxley feared we would be drowned in a sea of irrelevance. In a nutshell, it's a choice between Big Brother watching you and you watching Big Brother. (Laughter)

But it doesn't have to be this way. We are not passive consumers of data and technology. We shape the role it plays in our lives and the way we make meaning from it, but to do that, we have to pay as much attention to how we think as how we code. We have to ask questions, and hard questions, to move past counting things to understanding them. We're constantly bombarded with stories about how much data there is in the world, but when it comes to big data and the challenges of interpreting it, size isn't everything. There's also the speed at which it moves, and the many varieties of data types, and here are just a few examples: images, text, video, audio. And what unites this disparate types of data is that they're created by people and they require context.

Now, there's a group of data scientists out of the University of Illinois-Chicago, and they're called the Health Media Collaboratory, and they've been working with the Centers for Disease Control to better understand how people talk about quitting smoking, how they talk about electronic cigarettes, and what they can do collectively to help them quit. The interesting thing is, if you want to understand how people talk about smoking, first you have to understand what they mean when they say "smoking." And on Twitter, there are four main categories: number one, smoking cigarettes; number two, smoking marijuana; number three, smoking ribs; and number four, smoking hot women. (Laughter)

So then you have to think about, well, how do people talk about electronic cigarettes? And there are so many different ways that people do this, and you can see from the slide it's a complex kind of a query. And what it reminds us is that language is created by people, and people are messy and we're complex and we use metaphors and slang and jargon and we do this 24/7 in many, many languages, and then as soon as we figure it out, we change it up.

So did these ads that the CDC put on, these television ads that featured a woman with a hole in her throat and that were very graphic and very disturbing, did they actually have an impact on whether people quit? And the Health Media Collaboratory respected the limits of their data, but they were able to conclude that those advertisements -- and you may have seen them -- that they had the effect of jolting people into a thought process that may have an impact on future behavior. And what I admire and appreciate about this project, aside from the fact, including the fact that it's based on real human need, is that it's a fantastic example of courage in the face of a sea of irrelevance.

And so it's not just big data that causes challenges of interpretation, because let's face it, we human beings have a very rich history of taking any amount of data, no matter how small, and screwing it up. So many years ago, you may remember that former President Ronald Reagan was very criticized for making a statement that facts are stupid things. And it was a slip of the tongue, let's be fair. He actually meant to quote John Adams' defense of British soldiers in the Boston Massacre trials that facts are stubborn things. But I actually think there's a bit of accidental wisdom in what he said, because facts are stubborn things, but sometimes they're stupid, too.

I want to tell you a personal story about why this matters a lot to me. I need to take a breath. My son Isaac, when he was two, was diagnosed with autism, and he was this happy, hilarious, loving, affectionate little guy, but the metrics on his developmental evaluations, which looked at things like the number of words -- at that point, none -- communicative gestures and minimal eye contact, put his developmental level at that of a nine-month-old baby. And the diagnosis was factually correct, but it didn't tell the whole story. And about a year and a half later, when he was almost four, I found him in front of the computer one day running a Google image search on women, spelled "w-i-m-e-n." And I did what any obsessed parent would do, which is immediately started hitting the "back" button to see what else he'd been searching for. And they were, in order: men, school, bus and computer. And I was stunned, because we didn't know that he could spell, much less read, and so I asked him, "Isaac, how did you do this?" And he looked at me very seriously and said, "Typed in the box."

He was teaching himself to communicate, but we were looking in the wrong place, and this is what happens when assessments and analytics overvalue one metric -- in this case, verbal communication -- and undervalue others, such as creative problem-solving. Communication was hard for Isaac, and so he found a workaround to find out what he needed to know. And when you think about it, it makes a lot of sense, because forming a question is a really complex process, but he could get himself a lot of the way there by putting a word in a search box.

And so this little moment had a really profound impact on me and our family because it helped us change our frame of reference for what was going on with him, and worry a little bit less and appreciate his resourcefulness more.

Facts are stupid things. And they're vulnerable to misuse, willful or otherwise. I have a friend, Emily Willingham, who's a scientist, and she wrote a piece for Forbes not long ago entitled "The 10 Weirdest Things Ever Linked to Autism." It's quite a list. The Internet, blamed for everything, right? And of course mothers, because. And actually, wait, there's more, there's a whole bunch in the "mother" category here. And you can see it's a pretty rich and interesting list. I'm a big fan of being pregnant near freeways, personally. The final one is interesting, because the term "refrigerator mother" was actually the original hypothesis for the cause of autism, and that meant somebody who was cold and unloving.

And at this point, you might be thinking, "Okay, Susan, we get it, you can take data, you can make it mean anything." And this is true, it's absolutely true, but the challenge is that we have this opportunity to try to make meaning out of it ourselves, because frankly, data doesn't create meaning. We do. So as businesspeople, as consumers, as patients, as citizens, we have a responsibility, I think, to spend more time focusing on our critical thinking skills. Why? Because at this point in our history, as we've heard many times over, we can process exabytes of data at lightning speed, and we have the potential to make bad decisions far more quickly, efficiently, and with far greater impact than we did in the past. Great, right? And so what we need to do instead is spend a little bit more time on things like the humanities and sociology, and the social sciences, rhetoric, philosophy, ethics, because they give us context that is so important for big data, and because they help us become better critical thinkers. Because after all, if I can spot a problem in an argument, it doesn't much matter whether it's expressed in words or in numbers. And this means teaching ourselves to find those confirmation biases and false correlations and being able to spot a naked emotional appeal from 30 yards, because something that happens after something doesn't mean it happened because of it, necessarily, and if you'll let me geek out on you for a second, the Romans called this "post hoc ergo propter hoc," after which therefore because of which.

And it means questioning disciplines like demographics. Why? Because they're based on assumptions about who we all are based on our gender and our age and where we live as opposed to data on what we actually think and do. And since we have this data, we need to treat it with appropriate privacy controls and consumer opt-in, and beyond that, we need to be clear about our hypotheses, the methodologies that we use, and our confidence in the result. As my high school algebra teacher used to say, show your math, because if I don't know what steps you took, I don't know what steps you didn't take, and if I don't know what questions you asked, I don't know what questions you didn't ask. And it means asking ourselves, really, the hardest question of all: Did the data really show us this, or does the result make us feel more successful and more comfortable?

So the Health Media Collaboratory, at the end of their project, they were able to find that 87 percent of tweets about those very graphic and disturbing anti-smoking ads expressed fear, but did they conclude that they actually made people stop smoking? No. It's science, not magic.

So if we are to unlock the power of data, we don't have to go blindly into Orwell's vision of a totalitarian future, or Huxley's vision of a trivial one, or some horrible cocktail of both. What we have to do is treat critical thinking with respect and be inspired by examples like the Health Media Collaboratory, and as they say in the superhero movies, let's use our powers for good.

Thank you.

(Applause)

科学技術は多くをもたらしてくれました 月面着陸 インターネット ヒトゲノム配列の解析などです ですが 私たちの奥深くにある 恐怖の多くにも それは入り込んでいます およそ30年ほど前 文化批評家のニール・ポストマンは 『Amusing Ourselves to Death』 という著作で このことを的確に述べました 彼はこの著作において ジョージ・オーウェルとオルダス・ハクスリーの ディストピア (反ユートピア) 思想を比べて こう書きました 「オーウェルは私たちが 囚われの身になる文化を恐れた ハクスリーは私たちが 取るに足らないことに耽溺する文化を恐れた オーウェルは真実が 私たちから隠蔽されることを恐れ ハクスリーは私たちが無関心の海で 溺れ死ぬことを恐れた」 要するに 「ビッグ・ブラザー」 に監視されるか 「ビッグ・ブラザー」を監視するかの どちらかということです (笑)

でも そうでなくともよいのです 私たちはデータや技術を 受け身で消費するだけではありません 生活において データや技術が果たす役割や その意味を見出す方法を 私たちが形作るのです しかし そのためには コード化の方法と同じくらいに 考え方にも注意を向けねばなりません 物を数えるだけでなく さらにそれを理解するために 難解な問いを 投げかけねばなりません 私たちは世界に どれ位のデータがあるか 常に聞かされていますが ビッグデータや それを読み解く難解さとなると 量だけがすべてではありません データが動く速さも問題になりますし データには様々な種類があります ごくわずかな例を挙げると 画像 文章 映像 音声などです これら別々の種類のデータに 共通しているのは これらは人の手で作られ 文脈を必要としているということです

さて イリノイ大学シカゴ校出身の データ科学者のグループがあります このグループは ヘルス・メディア・コラボラトリーと呼ばれ 米国疾病管理センターと一緒に仕事をし 人々が 禁煙についての言い表し方や 電子タバコについての言い表し方 禁煙を促すために協力しあえることを より良く理解するよう努めました 興味深いことに 人がどのように 喫煙について話しているかを 理解するにはまず 「smoking (吸う)」という語で どんな意味が表されているかを 理解せねばなりません ツイッター上には 4つの主なカテゴリーがあります 1つ目 タバコを「吸う」 2つ目 マリファナを「吸入する」 3つ目 リブ肉を「いぶす」 4つ目 「煙が出るほどホットな」イケてる女 (笑)

電子タバコについて どのように話されているかは その上で考えてみなければなりません これには 非常に様々な例が見られます スライドからもおわかりのように これは複雑な問いなのです このことで思い出すのは 言語は人々によって作られたものであり 人間は厄介かつ複雑なもので 比喩やスラングや隠語を 使うものだということ そしてそれを人間は毎日24時間 多くの言語で行い続けており 理解するやいなや その言葉自体を変えてしまうことです

では 米国疾病管理センターが出した 喉に穴が開いた女性を 映し出すこのテレビ広告は 非常に描写が露骨で 気持ちの良いものではありませんが この広告は実際に禁煙するように 人々を促したのでしょうか? ヘルス・メディア・コラボラトリーは データの限界を認めてはいますが その結論によると あなた方も見たことがあるかもしれない これらの広告によって 将来の行動が 影響されるかもしれないような 思考プロセスに 人々を導いたのだそうです 私がこのプロジェクトについて 感心し 評価するのは 人間の現実的な必要性に 基づいている などの事実面はさておき これが無関心の海に真っ向から 立ち向かう勇気を示す 素晴らしい例であるということです

一方 理解が難しいのは ビッグデータだけではないのです なぜなら 考えてもみてください 私たち人間は データの大小にかかわらず それを台無しにしてしまった 豊かな歴史を 有しているではありませんか 何年も前に ロナルド・レーガン元大統領が このように述べて厳しく批判されたことを 皆さんも覚えているかもしれません 「事実とは馬鹿げたものである」と これは言い間違いでした 公平を期すなら ですが 彼はジョン・アダムズが ボストン虐殺事件裁判において イギリス人兵士の弁護で述べた 「事実とは確固たるものである」を 引用したつもりだったのです しかし このレーガンの言い間違いは 偶然ながらも 一理あると私は思います なぜなら 事実は確固たるものですが 時に 馬鹿げてもいるからです

これが 私にとってなぜ重要なのか 個人的なお話をしたいと思います ひと息つかせてください 息子のアイザックは 2歳の時に 自閉症の診断を受けました 彼はにこにこして 愉快で 愛情深く 優しい男の子でしたが 彼の発育評価についての測定基準が 着目したのは 話せる言葉の数や ― これは当時 ゼロでした ― 意思疎通を図る身振り アイコンタクトなどであったため 彼の発育レベルは 9か月の赤ちゃん程度でした この診断は事実からすれば 正しいものでしたが 全体像を語ってはいませんでした およそ1年半後 アイザックがもうすぐ4歳になる頃 私は ある日 彼がコンピュータの前で グーグル画像検索で 女性を検索しているのを見つけました 「w-i-m-e-n」というつづりで です 過干渉な親がそうするように 私も 「前のページに戻る」ボタンをクリックし 他に何を検索していたのか知ろうとしました 他の検索は 順番に「男性」 「学校」 「バス」 そして「コンピュータ」でした 私は呆気にとられました アイザックがスペルを知っているとも ましてや読めるとも知らなかったのです そこで息子に訊きました 「どうやったの?」 アイザックは私を真剣に見て 言いました 「ボックスに文字をタイプしたんだ」

彼は自分で意思疎通の仕方を 学んでいたのに 私たちは誤った部分に 目を向けていたのです そして こういったことが起こるのは 査定や分析が ある測定基準 ― ここでは 言語による意思疎通 ― を過大評価して 創造的問題解決能力のような 他の基準を過小評価する場合です アイザックにとって 他者との意思疎通は難しいので 彼は自分に必要なことを知るための 別の方法を見つけたのです 考えてみれば 合点がいきますね 質問文を構成するのは 実に複雑なプロセスですが アイザックは検索ボックスに 単語を入れるだけで 自力で答えにたどり着けるのです

この些細な瞬間が 私と家族に 大きな影響を与えました なぜなら これが アイザックに何が起こっているのかを 把握する方法を変えてくれたからです 心配もほんの少し和らぎ 彼の能力を より理解できるようになりました

事実とは馬鹿げたものなのです また事実は意図的 あるいは無意図的に 誤用されやすいものです 私には エミリー・ウィリンガムという 科学者の友人がいますが 彼女は最近フォーブス誌に 「自閉症と関連付けられてきた 10のおかしな事」 という記事を書きました これは 結構なリストです 何でもインターネットのせいにされます ねえ? もちろん 母親も入っています 実は もっとあります この「母親」のカテゴリーの中に 色々とあるのです 色々な要素の入った 興味深いリストでしょう? 私が好きなのは 「妊娠中 高速道路のそばで 暮らしていた」ですね 最後のも興味深いです 「冷蔵庫のような母親」という言葉は 自閉症の原因に関する 元々の仮説からきており 冷徹で愛情が薄い人という意味でした

ここで こう考えるかもしれませんね 「わかった データを測定してしまえば どんな意味づけも可能と言うんだろう」 確かに 全くその通りですが 難しいのは 私たちは その意味を作り出す機会を 自らに与えられていることです データ自身ではなく 私たちが意味を作るのです ビジネスパーソンとして 消費者として 患者として 市民として 私たちには より多くの時間を使って 批判的に考える能力を 鍛える責任があります なぜかって? なぜなら 何度も耳にしてきたように 有史以来 今やものすごい速さで 何エクサバイトものデータを 私たちは処理することができるからです そして 間違った判断を より速く 効率的に下し これまでにないほどの影響を及ぼす 可能性があるからです すごいと思いませんか? ですから 私たちがすべきなのは 時間をもう少し 人文学や 社会学 社会科学 ― 修辞学や哲学 倫理学などに費やすことです これらがビッグデータに 重要な文脈を与えてくれ より批判的な考え方が できるようにしてくれるからです 結局のところ 特定の議論の中に存在する問題を 見つけることができれば それが言葉で表されようと 数字で表されようと関係ないのですから つまり 確証バイアスや誤った相関関係を 自ら見つけ出し 感情に露骨に訴えるようなやり方を 30m手前で見抜けるようにするのです なぜなら 何かがある出来事の後に 起こったからといって 必ずしも関連があるとは限らないからです ちょっと 小難しいことを言えば ローマ人はこう言い表しました 「post hoc ergo propter hoc」 「後に起きた ゆえにそれが原因なり」 という前後即因果の誤謬です

つまり 人口統計学のような 学問を疑問に付すことになります なぜかって? なぜなら 人口統計学は 私たちの実際の考えや行動ではなく 性別や年齢 住む場所による推定に基づいているからです それから データを取得した以上は 適切な個人情報保護や 消費者の意思を汲んで これを扱わねばなりません さらには 私たちは 自身の仮説や用いる方法論 そして結果の確実性について 明確でなければなりません 私の高校の代数の先生は よくこう言っていました 「計算過程を明らかにしなさい 君が踏んだ過程がわからなければ どの手順を 踏まなかったのかわからないし 君がどんな問いを立てたのかが わからなければ どんな問いを 立てなかったかがわからないからね」 それは最も難しい問いを 自らに投げかけることなのです このデータは本当に このことを示しているのか? それともこの結果が 私たちをもっと 成功しているとか 心地よく 感じさせてくれるだけなのか? と

ヘルス・メディア・コラボラトリーは プロジェクトの終わりに あの非常に露骨で不快な 禁煙推奨広告に関する ツイートの87パーセントが 恐れを表していたことが わかったといいます しかし 彼らは 「広告が実際に人々を禁煙に導いた」 と結論付けていましたか? 答えはノーです これは科学であり 魔法ではないのです

ですから データの力を 解き放つのであれば 私たちは必ずしも オーウェルの思い描いたような 全体主義的な未来や ハクスリーの描いたような 些末な事柄に溺れる未来 あるいは 両者を折衷したおぞましい未来に 盲目的に突き進まずに済むのです 私たちがすべきなのは 批判的な思考に敬意を払い ヘルス・メディア・コラボラトリーのような 前例からインスピレーションを得ることです そして ヒーローものの映画に よくあるように 私たちの力を善きものに使いましょう

ありがとうございました

(拍手)

― もっと見る ―
― 折りたたむ ―

品詞分類

  • 主語
  • 動詞
  • 助動詞
  • 準動詞
  • 関係詞等

関連動画