AlphaFold2が発表されて、Twitterがめちゃくちゃに盛り上がり、様々な記事が乱立されて一段落つきましたね。
発表を見たときから「え~興味あるな~使ってみたーい」と思っていたのですが、中々一歩が踏み出せず、やれないままのんびりと日々を過ごす形となってしまいました。
だいぶ落ち着いてきたなーというのを肌で感じつつ、
「ここまで落ち着いたら素人が触ってみてもなんとかなるのでは!?」
「きっと知見もかなり溜まっているし、いけるはず……!」
と思い、やっとこさAlphaFold2を触ってみることにしました。
!CAUTION!
この記事はAlphaFold2を純粋に触ってみたい(遊んでみたい)だけの記事なので、内容は雑です。
AlphaFold2ってなに
AlphaFold2を物凄く雑に説明すると、アミノ酸配列を入れるだけでタンパク質の立体構造を予測してくれる、しかも従来あったものよりも遥かに素晴らしい精度で予測してくれる という代物です。
2021年7月15日、Natureで論文が出、誰もがAlphaFold2を使える状態になりました。すごいね。
タンパク質の立体構造がアミノ酸配列から予測できる ということがそんなにすごいの?と思う人も多いかもしれませんが、これはかなりすごいことです(だから生物学界隈が大盛りあがりしたわけで)。
その理由は色んな記事などに書いてるので詳しくは触れませんが、これまたざっくり説明すると
- そもそもアミノ酸配列だけからタンパク質の立体構造(色んな結合や相互作用やを反映したもの)を予測したり想像したりするのは、影響要素や考えることが多すぎてかなり難しい
- タンパク質の立体構造が分かると生体内での振る舞い(何と結合する、どういう機能をもつ)がわかるので研究者としては大変うれしく、喉から手が出るほど欲しい。これは薬理などでも同様(薬はタンパク質と相互作用するものを設計したりするので、タンパク質の構造がわかるととってもうれしい)
- 従来タンパク質の立体構造を得るためには回収(精製)、結晶化、様々な手法の構造解析……といった多くのステップが必要で、かつそのどれもが絶妙な難しさを兼ね備えているため、1ステップ進むのにものすごい時間やお金、労力が費やされることが多い(精製や結晶化の条件検討だけでも凄まじい)。
というような要因が挙げられます。詳しく知りたい人は色んな記事を見てみてください。
ちなみに自分は研究室選択のとき、タンパク質構造解析のラボを選ぼうとして断念したという過去があります。
ラボ見学に行った時様々な小さい結晶を「これはこういう困難があって……やっと結晶化できて……」みたいに話してくださる先生の姿を見て、本当に結晶化は大変な作業だなぁ……とひしひし感じさせられました。
加えて、「これ一個の結晶化に5年かかって」みたいな話を聞いた時、これは卒業研究ではやりきれないなと驚愕したという記憶もあります。
結晶化って大変なんだね。
AlphaFold2はCASPという、タンパク質の構造予測をするアルゴリズムの精度を競う大会で好成績を出してきたAlphaFoldというものが発端となったものです。
CASPという大会があるという事実からも、生物学でいかにタンパク質構造予測が重要かが分かるかと思います。
AlphaFold2使うぞー!
ということで、AlphaFold2をさくっと「使ってみたい」という欲求のためだけに使ってみることにしました。
素人なので、実装とか何も見ていません。本当に使ってみるだけです。
知見ないかなーと思い調べてみると、いきなり素晴らしいページがありました。
なるほど、噂には聞いていたけれどGoogle Colab上で動かせちゃうのね。
自分の手元には超ハイスペックPC環境はないので、Google Colab版を使用してみることにしました。
上記のページ内で紹介されているこちらのリンクをクリック。
使い方についても、上記ページに詳しく書いてあるのでそれに従うだけです。凄く楽。
ちなみに、「アミノ酸配列ってどこからとってくるの?」と思われる方もいるかもしれないので、参考になるページを挙げておきます。
こちらのTOGO TVで説明されているように、NCBIを使って引っ張ってくるのが一つの手です。
噂によると膜タンパク質はあまり精度がよくないらしいので、私はmyoglobinを選択してみました。有名だし、単サブユニットだし、構造もわかってるし(変異型のものだけど)いいんじゃないかなと。
Myoglobin [Homo sapiens] - Protein - NCBI
こちらのアミノ酸配列を入れて、手順に従って「すべてのセルを実行」を押して、あとは待つだけ!
色々やってたらいつの間にか終わってました。10分かかってないくらいか?
その結果の3Dモデルがこちら。
よさげじゃない???
これ、グリグリいじれるので、いじって方向を変えてみます。
こちらがX線結晶構造解析の結果から得られた3Dモデル。是非上の結果と見比べてみてください。
ほぼほぼ同じでは……???
すごいね。
素人でもあっさりAlphaFold2が試せることと、
その精度はすごいということを体験することができました。
実際はGoogle Colabのものは簡易版らしいので、精度的には落ちるらしいのですが、
落ちてもこれだけぴったりなものを予測してくるのはパワーを感じますね。
AlphaFold2と結晶構造解析
AlphaFold2ははちゃめちゃ強力なのですが、やはり苦手なタンパク質もあり、例えば膜タンパク質なんかはうまく予測できないなんてことが言われています。
そういう風にあらゆるタンパク質に対応していないとしても、一部だけでもかなり精度良く構造を予測するというだけで物凄い発明だと思いますし、
今後きっとブラッシュアップされていってより良いものになっていくのだろうとも思います。
また、上でも述べたようにAlphaFold2があることで、構造解析が間に合っていない未知のタンパク質に対しても様々なアプローチを立て、研究することができるようになるでしょう。
これは素晴らしい貢献だと思います。
とはいえ、AlphaFold2はあくまで予測であり、実際のタンパク質の形を必ず反映しているとも限りません。
AlphaFold2の予測に更に、結晶構造解析の結果が加わることで、その構造の確からしさも増すでしょうし、結晶構造解析は今後も必ず必要なものであり続けると個人的には思っています。あくまで素人意見ですが……
なんにせよAlphaFold2って素晴らしい!と思いました(どういう頭脳の運営をしてたらこういうものを作れるようになるんだろうね)