あいまいまいんの生物学

あいまいまいんの生物学

生物学が好き。勉強したり遊んだり。

日頃感じたこと思ったこと、出来事など

勉強して面白かった話

授業で使えそうな生物学の知識・雑談・小ネタ

などなどを紹介していきたいと思います

コメント大歓迎!気軽にコメントして下さい

ゲームサイトはこちら

DORISという新しいDNAストレージ関係技術について

Researchatでも何度も何度も触れられていますが、「DNAはストレージ」であり、非常に有望な情報媒体です。

しかしDNAをどう扱えば使い勝手のよいより現実的で浸透する媒体化するか?というのは未だに盛んに研究されている対象です。

私もResearchatでDNAをうまく扱った先進的な論文を幾つも紹介される中で、凄いな~とか、頭いいな~とか、色んなことを感じていました。

 

そんな中、先日(6月12日)Nature Communicationで発表された「Dynamic and scalable DNA-based information storage」という論文が非常に面白かったので、シェアしたいと思います。

www.nature.com

ここからは読んだ内容をざっくり紹介していこうと思いますが、如何せん素人でこの業界のことはよくわかってない面もあり、読み飛ばした所もかなり多いので参考程度にして頂けたらと思います。

また、自分用のScrapboxをコピペしただけ感があり、言い回しが変だったり雑だったりします。ゴメンナサイ

 

 

論文の中身をざっくり言うと

DNAで情報管理する方法としてDORIS(Dynamic Operations and Reusable Information Storage)という新規方法を考案した、という論文です。

従来のDNAストレージから情報を出すときはPCR反応をさせ、プライマーがファイル名代わりになっていた所がありましたが、これを常温下で取り出し&RNAに転写→逆転写でDNA化させるようにしています。

ロック、アンロック、リネーム、デリートも可能になったという話です。

その技術詳細(やり方)と、検証を重ねているというのがメインです。

 

具体的な方法(手順)

これは論文のFig.1に綺麗にまとまっているので、そちらを見ながら読んで貰えるといいなと思います。多分文字だけだと厳しいし、図だけでも最初はよくわからない…

DNAにデータをエンコードするのはまぁ10の情報をATGCに置換しますよねという感じ。そこはどうでもよい


データベースの作り方

① 3'末端側からファイルアドレス20nt+T7プロモーター23nt+データペイロード117nt で一本鎖DNAを用意する

※T7プロモーター&T7RNAポリメラーゼ:T7プロモーター配列を含む二本鎖DNAを鋳型、NTPを基質として、プロモーター下流の鋳型DNAに相補的な一本鎖RNAを合成する酵素がT7RNAポリメラーゼ。 T7プロモーター配列に高い特異性を示し、他の生物由来のプロモーターを認識しない。in vitro系で重宝されている

※ntというのはnucleotide…塩基のことです。塩基数を示します。

② T7プロモーターと相補的なプライマーを添加しPCR反応で二本鎖化させる(するとファイルアドレスのみが一本鎖+T7プロモーターとデータは二本鎖で他から干渉を受けない状態になる&安全!)

 

という感じです。

論文中では、プライマー濃度とPCRサイクル数の検討をしており(Fig2.a)、ssDNA:プライマー=1:10を超えるとゲル電気泳動定量されるss-dsDNA産生量が段階的に変化するので、1:20に最終的には設定しています。

4サイクルでコンバートに十分なようです。

また、A, B, C3種類の異なるデータを一ポットでリアクションさせてもデータベースを構築できることを確認しています。

 

ファイル読みだし

① ビオチンリンクさせた20ntDNAオリゴ(データ名と相補的なやつ)を添加して結合させ、ストレプトアビジンで機能化された磁気ビーズを用いて、混合物から分離する(磁石で引っ張ってくるイメージ)

※ビオチン:ビタミンB群に分類されるビタミンB7。ビオチン標識は安定性が高く、小型であることから、標識分子の機能性をほとんど妨害しない

※アビジン:ビオチンに対して極めて高い親和性を示す、鳥類および両生類の両群に由来するタンパク質です。ストレプトアビジンは最大4個のビオチン分子に結合する能力があるため、この相互作用は精製および検出の両戦略において理想的です。

※アビジン-ビオチン系:アビジン-ビオチン複合体は、タンパク質とリガンド間の既知の非共有結合性相互作用の中では最も強力で、かつ非常に素早く形成されます。結合が形成された後には、極端なpH値、温度、有機溶剤、変性剤類からの影響を受けません。

② ファイル取り出し後:in vitroでRNAに転写して(T7RNAポリメラーゼを使用する)、ファイルはデータベースに戻す。RNAをcDNAに逆転写してシーケンスする→読みだせる!

 

①の取り出しについては、データが混在している中でもうまく特定のものだけ取り出せる…すなわち機能することを確認しています(Fig.2b)


ロック

① ビオチン添加されていない&ファイル名配列に相補的なssDNAの3'上流に30nt配列付加したものを入れる

 

ビオチンリンクの読みだし用ssDNAが結合できなくなるのでロックしたことになります。

 

論文では色んな温度でロックしています(Fig.6a参照)。

ロックをする際には、98℃で良好にロックが起こるが、25℃だとキーがないのに外れたりする(恐らく二次構造で邪魔されている?)という感じ。45℃がほどよさそう。

一報、98℃のまま…45℃以上のまま維持させると、ロックがまた自動的に外れてしまう(水素結合が切れてしまうので)ので、維持には45℃よりも下がよさそう。

 

まずファイルを分離してから高温でロックし、その後データベースに戻すことで、データベース全体が高温にさらされることを避けることができるのではないか、と提案しています。


アンロック

① ロック時添加した50ntssDNAに対する相補的なキーssDNA(50nt)を添加する

 

ロックのssDNAにキーのssDNAがくっついて外してくれるので、結果として再びファイル名ssDNAが露出しアクセス可能になります。 

file A: lock: key: oligo A’ = 1: 10: 10: 15が一番良い感じらしいですね。

温度については高温でも低温でもefficiencyは変わらないみたい。

 

名称変更

① 3'末端から新規ファイル名20nt+旧ファイル名20ntのssDNAを作成して添加する(Fig.6b)

 

今までのファイル名はssDNAによってカバーされて消え、新たなファイル名のみがssDNAとして露出しアクセス可能になります。 

45℃でやれるみたいです。

 

デリート

① ビオチン添加されていないファイル名配列に相補的な20ntのssDNAを入れる

 

ビオチンリンクの読みだし用ssDNAが結合できなくなるのでアクセス不能になるという寸法です(物自体が消えるわけではない)。

 

DORISの利点は?

  • 等温のまま個別にファイルアクセスできる
  • DNAの情報密度を上げられる&ノンスぺを減らせる
  • アドレス設計が簡単に
  • 何度もin vitroでファイルアクセス可能
  • 相対的な鎖の量の制御(プライマーとか沢山入り込まない)
  • 保存中のファイル操作を可能に

 

PCRを用いた従来方法との比較

なんか事あるごとにPCRを使った従来法を貶していきます。面白いです。

PCRはオフターゲット出るんだろ?

PCRは高温で二本鎖を全部一本鎖にしてプライマー付加するので、オリゴ内部のオフターゲットに結合してそこから伸長反応させてへんてこな断片を出す(たまたまファイル名と同じような配列がデータ中にある場合)ことや、切れたおかしなデータも参照することがあります(Fig.2c)。

わざわざそうなりそうなやつを作ってDORISとPCR使用の比較をしていますが、泳動結果を見るとそれっぽいですね?

室温だと水素結合とれないから…これは大勝利か?(でもDORISでもオフターゲット出てる気がするが…)

 

PCRははアドレス設計に制限付くんでしょ?

データベースが大きくなるとアドレス配列と同じ配列が出る確率が高まるわけなので、PCRの場合はアドレスを制限された条件内で決めるエンコーディングアルゴリズムに則って作らなければならないですね(典型的には〜<6以内のハミング距離を避ける)。

データのペイロード配列空間の制限によりデータベースを符号化できる密度が低下するか、使用できるユニークなプライマー配列の数が減少することによりデータベースの容量が低下することを本質的に意味しています。

※密度=1ntあたりに格納される情報量

モンテカルロ法でアドレスの総数と達成可能な総容量を推定すると、まぁDORISの圧勝(何も制限するものなんてないから)。

グラフがあからさますぎて笑えてきます。

 

PCRは何回もアクセスするとデータ壊れてっちゃうの?

DORISでA,B,C混合物においてファイルAにアクセス5回繰り返してみて、各アクセス後のデータベース内のファイルA, B, Cの量と組成を測定してみる、というのをやっています。
結果的には、

  • BとCは安定レベル維持(とはいえ減ってるが…?)
  • Aのストランド50%が5回アクセス後に残る

という感じ。PCRの場合はアクセスしないやつも減っていくので駄目だろうと。DORISでDNAデータベースが長寿命化するか?という感じでした。

 

 

IVT(In Vitro Transcription)は大丈夫なん?

DORISではIVTを作用させた元データDNAをプール内に戻すわけですが、そもそもIVTはDNAに対して劣化させたりしないのか、とか、ちゃんとデータを転写してこれるんか、みたいな話があるわけで。

IVT反応自体も37℃の高温なので、データベースの安定性にどのような影響があるのかを確かめよう、ということをしています。

ただし、保持されたデータベースはIVTにさらされません。アクセスされたファイルだけの話です。

結論として、RNAポリメラーゼの存在自体は保持されたファイルに影響を与えなかったんですが、IVT時間の長さは保持されたファイルの量を減少させた(Fig.3bおよび補足図4a)。
恐らく、一部の損失はビーズ結合したオリゴやss-dsDNAと競合するRNAからファイルストランドが解離したことによるものであり、また一部の損失はDNAの分解によるものであろう、という感じだそうです。

 

そもそも、IVTの品質と効率も確認しなきゃ(切ったり延ばしすぎたりしてないか?)ということで、

110〜180ntに及ぶ長さの範囲を有する一連の6つのssDNAを注文し、

これらをss-dsDNAに変換、

RNAに転写、逆転写してdsDNAにして増幅、

電気泳動にかける…という実験をしています。

結果、明確な均一なバンドが見られ、IVT時間を長くすると、すべてのテンプレートについてRNAの収量が増加した(Fig.4b)が、明確なRNAバンドを得るにはわずか2時間で十分であり(Fig.4c)、IVT時間は生成されたRNAの長さに影響を与えなかった、ということが分かりました。これはよきよき。

 

あとは転写をプロモーター配列で調節してみたりしていますが、ちょっと読み切れていないので、まぁ大事なところは抜いただろうという感じ…

自分の備忘録的なものなので、雑なのはお許しくださいませ。

 

 

論文を読んでいるとなんか色んな事象や考え方にInspireされたっぽくて、いや~面白い発想だよな~と思ったりします。

DNAデータを扱う時にPCRを使う発想ですらすごいなと思ってたのに(選別性とかね)、もっとすごいなと個人的には思いました。

ていうか簡便なのがいいよね。

自分の疑問点としては、

  • 磁性物体でどこまで引っ張れるんだろう?というのはちょっと謎だったり…普通に使われている技術なのか?
  • 今までのDNAストレージ関係技術で既にRNA化する発想や近い構想・技術はあったのか?(どれくらい新しいものなのか)
  • デリートした情報についてもDNAは残っているわけなので、高温にすればデリート用ssDNAが外れて読めちゃったりしないか?ロックとかもそう…
  • 常温でどれくらいssDNA露出した状態で崩れず維持されるものなのか?
  • なぜプールから取り出すたびにキャッチ&リリースしているはずなのに減っているのか?(5回繰り返すやつ)
  • 結局ssDNA同士の干渉が考えられるので今回の技術を使ってもファイル名と多様性の制限はつきまとうのではないか?

などです。

何にせよ賢い。賢い人は賢いなぁ…

 

 

P.S. 間違ってたらコメントなどで教えてください…!