バイオインフォマティクスでよく使われる略語、用語集

2022年8月31日2022年9月27日

はじめに

　バイオインフォマティクスに限らず生物の分野では、他の分野と比べても略語が多いと思います。バイオインフォマティクスを勉強していて意外とつまずくというか、同じ単語を何度も繰り返し調べることになるので、備忘録としてまとめることにしました（適宜追加していきます）。バイオインフォマティクスを独学で学ぼうとしている人にも参考になるよう、自分がある程度わかっているものは雰囲気も含めて書いてます。反対に調べてもよくわからないものもあるので、全体としては参考程度にして、他の文献等を参照しながら利用していただけると幸いです。

A

ANI: 　ANI：Average Nucleotide Identityの略でゲノムデータが簡単に取れる時代になったから大変なDDH法を使用しなくてもいいじゃない？ってことで生まれた方法（たぶん）で現在は菌種同定のゴールドスタンダードだと思う。ゲノムデータを2つ用意してその類似度をmax100の値で評価し、95以上で同種として判定する（熟練者がやったDDHとおおよそ同じ結果が得られるらしい）。結構精度よく分けれるが、実際にやってみると94〜96の値が出てきて判断に困ることがある。どのリファレンスゲノムとも95以上にならないゲノムデータも多く、素直に受け取れば新種の発見である（笑）。あとANIは原核生物用の同定手法です。真核生物をバイオインフォマティクス的に同定するのってどうやってるんだろ。
Alignment（アライメント）: 　塩基配列またはアミノ酸残基の配列をなるべく類似した配列同士がくっつくように整列させること。Clustal OmegaとかClustal W, MAFFTとかあるけどとりあえずClustal Omegaをつかえばいいと思ってる（今の主流はMAFFTなのかな？）。それぞれスコアの付け方や計算方法の違いで得られる結果が異なる。さらにパラメータの設定でも変わるので、結果をみて納得いかなければ違うのを使用する。あとは配列が増えるほど計算時間が急激に増えていくので、必要のない配列や領域をアライメントをする前に除くと時間の節約になる

C

Contig, Chromosome, Complete: 　read→contig→scaffold→chromosome→complete≒元の配列
詳しくは下記記事を参照

あわせて読みたい

contig, scaffold, chromosome, completeの違いはじめに　Assembly（アセンブリとかアッセンブリ、アッセンブリーと呼んでる）にはレベルがあってややこしい。バイオインフォマティクスを独学で学んでいる人なら必ず…

D

DDH: 　DDH：DNA-DNA Hybridizationの略で ANIができる前のゴールドスタンダード？ある生物の標識したDNAともう一つの生物のDNAをPCRみたいに熱で一本鎖にしてから温度を下げ、再び2本鎖にする。似てる生物なら配列も似ているので、標識したDNAととしていないDNAがくっつき、似ていない生物の場合はあんまりくっつかない。この差を評価する手法。類似度は70%以上あれば同種の判定らしい。正直DDH法はやったこともなければ今後やることもないと思うが、DDH法をやるのはそれはそれは大変らしい。そもそもType Strainとなる株がないと始まらないので、昔はわざわざ調べたい菌株を持って海外まで行き、Type strainを持っている研究所でDDH法をやるなんてこともよくあったらしい。逆に今はカルタヘナ条約とかテロの関係で、そもそも国をまたぐ菌株の移動は面倒になっている（国内もですが）のでDDH法をやる人はほとんどいないのでは。企業はまだしも、大学等の研究機関がどこまで条約を守っているのか知りませんが。

S

Scaffold: 　read→contig→scaffold→chromosome→complete≒元の配列
詳しくは下記記事を参照

あわせて読みたい

contig, scaffold, chromosome, completeの違いはじめに　Assembly（アセンブリとかアッセンブリ、アッセンブリーと呼んでる）にはレベルがあってややこしい。バイオインフォマティクスを独学で学んでいる人なら必ず…

数値

16S rRNA: 　16SリボソームのRNA。だいたい1500 bpくらい。リボソームはRNAの情報をもとにタンパク質を作る細胞小器官。つまり原核生物であればまず間違いなく持っているけど、保存性が高いもののバリエーションがある領域もある。この特徴を利用し、保存性の高い領域（保存領域）にプライマーを作成し、増幅、シーケンシングを行い保存性の低い領域（可変領域）を比較することで、菌種の同定、分類を行う方法がある（16S rDNA解析）。NGSをかけるほどでもないときにとりあえずやったりする。プライマー設計や、シーケンスを出す手間はあるが、1株あたり5000円もあれば結果が得られる。業者におまかせでも2万円くらい。会話では単純に16Sって言ったりする。

よかったらシェアしてね！

URLをコピーしました！

バイオインフォマティクスでよく使われる略語、用語集

はじめに

A

C

D

S

数値

コメント

コメントするコメントをキャンセル

バイオインフォマティクスでよく使われる略語、用語集

はじめに

A

C

D

S

数値

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル