TED日本語 - リッカルド・サバティーニ: ゲノムを読んで人間を作る方法

TED日本語

プレゼンテーション動画

TED日本語 - リッカルド・サバティーニ: ゲノムを読んで人間を作る方法

TED Talks

ゲノムを読んで人間を作る方法
How to read the genome and build a human being
リッカルド・サバティーニ
Riccardo Sabatini

内容

秘密も病気も美もすべてが書かれたゲノム、それは人間を作り上げるのに必要なひとそろいの遺伝的手順書です。科学者であり起業家であるリッカルド・サバティーニが、今や小さなバイアル瓶の中の血液から複雑なゲノムの暗号を解読して、身長、目の色、年齢、容貌まで予想できることを示します。ゲノムについての理解によって、やがてガンのような病気に対する個別化医療が可能になるとサバティーニは言います。我々は生命そのものを変える力を手にしたのです。それをどのように使いましょう?

Script

For the next 16 minutes, I'm going to take you on a journey that is probably the biggest dream of humanity: to understand the code of life.

So for me, everything started many, many years ago when I met the first 3D printer. The concept was fascinating. A 3D printer needs three elements: a bit of information, some raw material, some energy, and it can produce any object that was not there before.

I was doing physics, I was coming back home and I realized that I actually always knew a 3D printer. And everyone does. It was my mom.

(Laughter)

My mom takes three elements: a bit of information, which is between my father and my mom in this case, raw elements and energy in the same media, that is food, and after several months, produces me. And I was not existent before.

So apart from the shock of my mom discovering that she was a 3D printer, I immediately got mesmerized by that piece, the first one, the information. What amount of information does it take to build and assemble a human? Is it much? Is it little? How many thumb drives can you fill?

Well, I was studying physics at the beginning and I took this approximation of a human as a gigantic Lego piece. So, imagine that the building blocks are little atoms and there is a hydrogen here, a carbon here, a nitrogen here. So in the first approximation, if I can list the number of atoms that compose a human being, I can build it. Now, you can run some numbers and that happens to be quite an astonishing number. So the number of atoms, the file that I will save in my thumb drive to assemble a little baby, will actually fill an entire Titanic of thumb drives -- multiplied 2,000 times. This is the miracle of life. Every time you see from now on a pregnant lady, she's assembling the biggest amount of information that you will ever encounter. Forget big data, forget anything you heard of. This is the biggest amount of information that exists.

(Applause)

But nature, fortunately, is much smarter than a young physicist, and in four billion years, managed to pack this information in a small crystal we call DNA. We met it for the first time in 1950 when Rosalind Franklin, an amazing scientist, a woman, took a picture of it. But it took us more than 40 years to finally poke inside a human cell, take out this crystal, unroll it, and read it for the first time. The code comes out to be a fairly simple alphabet,four letters: A, T, C and G. And to build a human, you need three billion of them. Three billion. How many are three billion? It doesn't really make any sense as a number, right?

So I was thinking how I could explain myself better about how big and enormous this code is. But there is -- I mean, I'm going to have some help, and the best person to help me introduce the code is actually the first man to sequence it, Dr. Craig Venter. So welcome onstage, Dr. Craig Venter.

(Applause)

Not the man in the flesh, but for the first time in history, this is the genome of a specific human, printed page-by-page, letter-by-letter: 262,000 pages of information,450 kilograms, shipped from the United States to Canada thanks to Bruno Bowden, Lulu.com, a start-up, did everything. It was an amazing feat.

But this is the visual perception of what is the code of life. And now, for the first time, I can do something fun. I can actually poke inside it and read. So let me take an interesting book ... like this one. I have an annotation; it's a fairly big book. So just to let you see what is the code of life. Thousands and thousands and thousands and millions of letters. And they apparently make sense. Let's get to a specific part. Let me read it to you:

(Laughter)

"AAG, AAT, ATA."

To you it sounds like mute letters, but this sequence gives the color of the eyes to Craig. I'll show you another part of the book. This is actually a little more complicated.

Chromosome 14, book 132:

(Laughter)

As you might expect.

(Laughter)

"ATT, CTT, GATT."

This human is lucky, because if you miss just two letters in this position -- two letters of our three billion -- he will be condemned to a terrible disease: cystic fibrosis. We have no cure for it, we don't know how to solve it, and it's just two letters of difference from what we are.

A wonderful book, a mighty book, a mighty book that helped me understand and show you something quite remarkable. Every one of you -- what makes me, me and you, you -- is just about five million of these, half a book. For the rest, we are all absolutely identical. Five hundred pages is the miracle of life that you are. The rest, we all share it. So think about that again when we think that we are different. This is the amount that we share.

So now that I have your attention, the next question is: How do I read it? How do I make sense out of it? Well, for however good you can be at assembling Swedish furniture, this instruction manual is nothing you can crack in your life.

(Laughter)

And so, in 2014,two famous TEDsters, Peter Diamandis and Craig Venter himself, decided to assemble a new company. Human Longevity was born, with one mission: trying everything we can try and learning everything we can learn from these books, with one target -- making real the dream of personalized medicine, understanding what things should be done to have better health and what are the secrets in these books.

An amazing team,40 data scientists and many, many more people, a pleasure to work with. The concept is actually very simple. We're going to use a technology called machine learning. On one side, we have genomes -- thousands of them. On the other side, we collected the biggest database of human beings: phenotypes, 3D scan, NMR -- everything you can think of. Inside there, on these two opposite sides, there is the secret of translation. And in the middle, we build a machine. We build a machine and we train a machine -- well, not exactly one machine, many, many machines -- to try to understand and translate the genome in a phenotype. What are those letters, and what do they do? It's an approach that can be used for everything, but using it in genomics is particularly complicated. Little by little we grew and we wanted to build different challenges. We started from the beginning, from common traits. Common traits are comfortable because they are common, everyone has them.

So we started to ask our questions: Can we predict height? Can we read the books and predict your height? Well, we actually can, with five centimeters of precision. BMI is fairly connected to your lifestyle, but we still can, we get in the ballpark,eight kilograms of precision. Can we predict eye color? Yeah, we can. Eighty percent accuracy. Can we predict skin color? Yeah we can,80 percent accuracy. Can we predict age? We can, because apparently, the code changes during your life. It gets shorter, you lose pieces, it gets insertions. We read the signals, and we make a model.

Now, an interesting challenge: Can we predict a human face? It's a little complicated, because a human face is scattered among millions of these letters. And a human face is not a very well-defined object. So, we had to build an entire tier of it to learn and teach a machine what a face is, and embed and compress it. And if you're comfortable with machine learning, you understand what the challenge is here.

Now, after 15 years -- 15 years after we read the first sequence -- this October, we started to see some signals. And it was a very emotional moment. What you see here is a subject coming in our lab. This is a face for us. So we take the real face of a subject, we reduce the complexity, because not everything is in your face -- lots of features and defects and asymmetries come from your life. We symmetrize the face, and we run our algorithm. The results that I show you right now, this is the prediction we have from the blood.

(Applause)

Wait a second. In these seconds, your eyes are watching, left and right, left and right, and your brain wants those pictures to be identical. So I ask you to do another exercise, to be honest. Please search for the differences, which are many. The biggest amount of signal comes from gender, then there is age, BMI, the ethnicity component of a human. And scaling up over that signal is much more complicated. But what you see here, even in the differences, lets you understand that we are in the right ballpark, that we are getting closer. And it's already giving you some emotions.

This is another subject that comes in place, and this is a prediction. A little smaller face, we didn't get the complete cranial structure, but still, it's in the ballpark. This is a subject that comes in our lab, and this is the prediction. So these people have never been seen in the training of the machine. These are the so-called "held-out" set. But these are people that you will probably never believe. We're publishing everything in a scientific publication, you can read it.

But since we are onstage, Chris challenged me. I probably exposed myself and tried to predict someone that you might recognize. So, in this vial of blood -- and believe me, you have no idea what we had to do to have this blood now, here -- in this vial of blood is the amount of biological information that we need to do a full genome sequence. We just need this amount. We ran this sequence, and I'm going to do it with you. And we start to layer up all the understanding we have. In the vial of blood, we predicted he's a male. And the subject is a male. We predict that he's a meter and 76 cm. The subject is a meter and 77 cm. So, we predicted that he's 76; the subject is 82. We predict his age, 38. The subject is 35. We predict his eye color. Too dark. We predict his skin color. We are almost there. That's his face.

Now, the reveal moment: the subject is this person.

(Laughter)

And I did it intentionally. I am a very particular and peculiar ethnicity. Southern European, Italians -- they never fit in models. And it's particular -- that ethnicity is a complex corner case for our model. But there is another point. So,one of the things that we use a lot to recognize people will never be written in the genome. It's our free will, it's how I look. Not my haircut in this case, but my beard cut. So I'm going to show you, I'm going to, in this case, transfer it -- and this is nothing more than Photoshop, no modeling -- the beard on the subject. And immediately, we get much, much better in the feeling.

So, why do we do this? We certainly don't do it for predicting height or taking a beautiful picture out of your blood. We do it because the same technology and the same approach, the machine learning of this code, is helping us to understand how we work, how your body works, how your body ages, how disease generates in your body, how your cancer grows and develops, how drugs work and if they work on your body.

This is a huge challenge. This is a challenge that we share with thousands of other researchers around the world. It's called personalized medicine. It's the ability to move from a statistical approach where you're a dot in the ocean, to a personalized approach, where we read all these books and we get an understanding of exactly how you are. But it is a particularly complicated challenge, because of all these books, as of today, we just know probably two percent: four books of more than 175.

And this is not the topic of my talk, because we will learn more. There are the best minds in the world on this topic. The prediction will get better, the model will get more precise. And the more we learn, the more we will be confronted with decisions that we never had to face before about life, about death, about parenting.

So, we are touching the very inner detail on how life works. And it's a revolution that can not be confined in the domain of science or technology. This must be a global conversation. We must start to think of the future we're building as a humanity. We need to interact with creatives, with artists, with philosophers, with politicians. Everyone is involved, because it's the future of our species. Without fear, but with the understanding that the decisions that we make in the next year will change the course of history forever.

Thank you.

(Applause)

これからの16分で 人類最大の夢への旅に お連れします 生命の暗号を 理解するということです

私にとって ことの始まりは 何年も前 はじめて3Dプリンタに 出会ったときです 魅惑的なコンセプトだと 思いました 3Dプリンタは 3つの要素を必要とします 少しばかりの情報と 原料と エネルギーです そして それまで存在しなかった物を 何でも作れてしまうんです

私は物理をやっていましたが 家に帰ってきて 3Dプリンタならずっと前から 知っていたことに気付きました 誰もが知っています それは母親です

(笑)

母は3つの要素を 取り込みます 少しばかりの情報 ― 今の場合 父と母が提供します 原料とエネルギーは同じもの 食べ物から得ます そして数ヶ月の後に 私が製造されます それ以前に 私は存在しませんでした

自分が3Dプリンタであることを知った 母の衝撃はさておき 私はすぐに 最初の要素である 情報に強く惹かれました 人間を組み立てるために どれほどの情報が 必要なのか? 多いのか? 少ないのか? USBメモリ何本分になるのか?

私は当初 物理を勉強していたので 人間を巨大なレゴブロックとして 近似してみました 個々のブロックは 小さな原子です ここに水素があり ここに炭素があり ここに窒素がある 最初の近似としては 人間の体を構成する個々の原子を すべて特定できれば それで作り上げることができます 計算してみると 驚くような結果になります 私がUSBメモリに 収めようとしているファイル 小さな赤ん坊を組み立てるための 原子のデータは タイタニック号いっぱいの USBメモリの 2千倍になるんです これこそ 生命の奇跡です 今後 妊婦を見かけたら その人は 皆さんが出会うであろう 最大の情報を 組み上げているのです ビッグデータなんて 目じゃありません これは存在する 最大の情報なのです

(笑)

幸い自然界は この駆け出しの物理学者よりずっと賢く 40億年の間に この情報を DNAと呼ばれる小さな結晶に 詰め込みました 私たちがこれに出会ったのは1950年 素晴らしい女性科学者 ロザリンド・フランクリンが写真に収めた時です しかし人類が ヒトの細胞の中をつついて この結晶を取り出し 広げて 読むようになるまでには 40年以上かかりました その暗号は4種の単純な アルファベットで書かれています A - T - C - G そして人間を作るには 30億文字必要です 30億というのは どんな数でしょう? 見当が付かないような数字です

この暗号がどれほど巨大かを どうしたら説明できるか 考えました そして 人の助けを 借りることにしました この暗号を説明する 手助けとして ゲノム解読の先駆者 クレイグ・ヴェンター以上の人はいないでしょう ご紹介します クレイグ・ヴェンター博士です

(拍手)

その人物そのものではなく 歴史上初めて 特定の人間のゲノムを 本に印刷したものです 1ページ1ページ 1文字1文字 26万2千ページの情報です 450キログラムあります アメリカからカナダに運んできました ブルーノ・ボウデンと ベンチャーのLulu.comが すべてやってくれました 大した偉業です

これが生命の暗号を 視覚化したものです 今や ちょっと面白い ことができます 中を覗いて 読むことができるんです 面白そうな本を見てみましょう たとえばこれ 付箋を付けておきました すごく大きな本なので 生命の暗号がどんなものか お見せしましょう 何千 何万 何億という 文字があります ここには何か意味があるはずです 特定の部分を見てみます 読んで差し上げましょう

(笑)

AAG AAT ATA

黙字のように聞こえますが この配列はクレイグの目の色を 指定しています 別の巻を見てみましょう こちらは もう少し複雑です

染色体14 第132巻

(笑)

お察しの通り

(笑)

ATT CTT GATT

この人は幸運です この部分の2文字が 欠けただけで ― 30億文字中の たった2文字が欠けているだけで 恐ろしい病気を 運命付けられてしまいます 嚢胞性線維症です 治す方法も救う方法も わかっていません それがたった2文字の違いで 引き起こされるのです

素晴らしい本 強力な本 この本は ある極めて驚くべきことを 教えてくれます お見せしましょう どんな人であれ 私を私 皆さんを皆さんたらしめているのは このうちの たったの5百万字 1冊の半分たらずで 残りの部分は まったく同一なんです 500ページが 皆さんという 生命の奇跡を作り出し 残りはみんなと共通です 人は皆違うと思った時 そのことを考えてみてください 私たちが共有している量を

少し興味を持って いただけたと思うので 次の疑問ですが どうやってこれを読むのか? どうすれば 意味を取れるのか? どんなにスウェーデン家具の組み立てが 得意だろうと この組み立て手順書は 一生かかっても解読できないでしょう

(笑)

そのため 2014年に 著名な2人のTED講演者 ピーター・ディアマンディスと クレイグ・ヴェンターその人が 新会社を作ることにしました ヒューマン・ロンジェビティ社の ミッションは1つ この本について 学べることをすべて学び 試せることをすべて試して 個別化医療の夢の実現を目指し より良い健康のために 何をしなければならないか この本の秘密は何なのか 解明するということです

40名のデータ科学者をはじめ 様々な人の素晴らしいチームで 共に働けるのは喜びです 概念的には とてもシンプルです 機械学習という 技術を使います 一方には何千という ゲノムがあります 他方には人間に関する 最大級のデータベースがあります 表現形 3Dスキャン NMR 思いつく限りあらゆるものが入っています この二者の間には 未知の変換過程があります 私たちは中間に機械を構築し トレーニングしています 1台だけでなく 沢山の機械があって ゲノムから表現形への変換を 理解しようと試みています この文字列は何であり 何をするのか? これは何にでも使える アプローチですが ゲノミクスにおいては 特に複雑です 少しずつ拡大して 違う挑戦へと手を広げてきました 最初はありふれた形質から 始めました ありふれた形質がいいのは ありふれていて 誰でも持っていることです

そして こんなことを 問い始めました この本を読んで 身長は予測できるか? 実際可能です 5センチの精度で 予測できます 体重は生活習慣に 大きく依存していますが それでも おおよその予測はできます 8キロの精度です 目の色は 予測できるか? できます 80パーセントの正確さです 肌の色は予測できるか? できます 80パーセントの正確さです 年齢は予測できるか? できます 生きている間に 塩基配列は変化していくからです 短くなり 欠落や挿入が起きます いろいろな特徴から モデルを作れます

興味深い課題は 人の顔は予想できるか ということです これはちょっと難しいです 人の顔を決める情報は 何百万という塩基配列に分散しているし 人の顔というのは あまり綺麗に定義できません それを学ぶために まるまる階層を構築し 機械に顔とは何か教え 埋め込み圧縮する必要がありました 機械学習に馴染みがある人なら 難しさが分かると思います

私たちが最初の配列を読んで以来 15年が過ぎましたが 去年10月に有意な結果を 目にするようになりました とても感情的に高揚する瞬間でした ご覧いただいているのは 実験室に来た被験者です この顔を使います 被験者の顔のデータを取り 複雑さを減らします 顔のすべてが遺伝子で 決まるわけではなく 様々な特徴や欠陥や非対称性が 生きている中で生じるからです 顔を対称化し アルゴリズムにかけます 次にご覧いただくのが 血液から予測した顔です

(拍手)

ちょっとお待ちを この瞬間 皆さんの目は 左の顔と右の顔を見比べ 脳が 顔を同一視しようと してしまいます だから1つ課題を 出しましょう 違いを探してください たくさんあります 最大の特徴は 性別から来ます それから年齢 BMI 人種 そこから先は ずっと複雑になります 2つの顔に 違いはあるにしても 概ね合っているのが お分かりいただけると思います どんどん近くなっていて 感動すら覚えます

これは別の被験者です こちらが予測です 実際の顔は若干小さく 頭蓋の形が完全に合ってはいませんが 大きくは外していません これが被験者の顔 これが予測した顔 マシンのトレーニングの時点では これらの顔は見せていません ホールドアウト・セットと呼ばれる 評価用データです これだけでは信じない かもしれませんが すべて科学論文として 発表しているので お読みいただけます

クリスが私にステージでやる 挑戦を持ちかけました 真剣勝負をして 皆さんが認識できる顔の 予測をすべきだろうと このバイアル瓶の中の血液には ― この血液を手に入れる苦労は 想像もつかないでしょうが このバイアル瓶の中の血液には 全ゲノム塩基配列同定のために 十分な情報があります これだけでいいのです この塩基配列を調べたので 皆さんと一緒に見ていきましょう 分かったことをすべて 積み上げていきます この血液から男性と 予想しましたが 被験者は男性です 身長は176cmと 予想しましたが 実際は177cmです 予想は76キロで 実際は82キロ 予想年齢は38歳 実際は35歳 予想した目の色は ― 少し濃すぎました 肌の色の予想は 大体合っています これが予想した顔です

種明かしの瞬間です これが被験者の顔です

(笑)

意図的にやりました 私はごく特殊な妙な民族です 南欧はイタリア人で モデルには決して合いません この人種は我々のモデルでは 複雑な特殊ケースに当たります しかし もう1つあります 人を見分ける時に よく使われるものの1つは 遺伝子に書かれていません どういうルックスになるか 自由意志によるところがあります ここでは髪型ではなく 髭です 髭を移してみましょう モデリングではなく 単なる画像加工です 被験者の髭をコピーします すると ずっと 似た感じになります

なぜ こんなことを しているのか? 身長を予測するためでも 血液から綺麗な写真を 作るためでもありません 同じ技術 同じアプローチを使った 遺伝暗号の機械学習が 体について理解する 助けになるからです 体はどのように働くのか 体はどう老化するのか 病気はどのように 発生するのか ガンはどのように 成長するのか 薬はどう働くのか 自分の体には効くのか

これは大きな挑戦です 世界中の何千という研究者が 追いかけている挑戦で 「個別化医療」と呼ばれています 人が海の中の点にすぎない 統計的アプローチから この遺伝子の本を すべて読んで その人のことを 正確に理解してあたる 個別化アプローチへと 進むことができます とても複雑な課題です というのも すべての本のうち 現在のところ ほんの2パーセントしか 分かっていないからです 175冊中の4冊です

これは私の話の範囲外です 私たちは学んでいくでしょう このテーマについては 世界最高の頭脳が挑んでいるからです 予測はより良く モデルはより正確に なっていきます 学べば学ぶほど 以前には直面する 必要のなかった決断に 直面することになるでしょう 生や 死や 子育てについて

私たちは生命の仕組みの ごく内的な詳細に触れようとしています この革命は 科学や技術の領域に 留まる話ではありません 世界的な対話が 必要になるでしょう 人類として築きつつある未来について 考え始めなければなりません 創作者 芸術家 哲学者 政治家とも 話す必要があります 全員にかかわることです 人類の未来の話なんですから 恐れずに ― ただし 理解する必要があります 私たちが近い将来にする決断が 人類史の進む方向を 永久に変えることになるのだと

ありがとうございました

(拍手)

― もっと見る ―
― 折りたたむ ―

品詞分類

  • 主語
  • 動詞
  • 助動詞
  • 準動詞
  • 関係詞等

関連動画