細菌の種類数(どのくらいの菌種が認められているか)

目次

細菌の種類数

 NCBIのタクソノミーとかリファレンスゲノム(基準となるゲノム)を見ててふと、菌種ってどのくらいいるのだろうと疑問を覚えたので、Webで「菌種 細菌 種類 総数」等で検索したが、菌の量(菌数)のことばかり出てきて、イマイチしっくりくる回答が得られなかったので、自分で調べてみることに。またこの記事ではソートのしやすさの問題から細菌や菌種の中に古細菌も含めています。

結論

過程はどうでもいいと思う人が多いと思うので、調べた内容について結論からいうと

  1. 細菌(古細菌含む)の種類の総数は2022年9月11日時点で18,672菌種
  2. リファレンスゲノムが存在する細菌は15,572菌種以下で古細菌を含むと16,103菌種以下
  3. ゲノム情報から推測すると細菌は62,291菌種、古細菌は6,062菌種に分かれる可能性あり

以上が調べた結果です。

情報源について

1. 細菌(古細菌含む)の種類の総数は2022年9月11日時点で18,672菌種

 まず、一番の18,672菌種は、原核生物の名前を管理している団体のサイトLPSN (List of Prokaryotic names with Standing in Nomenclature) のNumbersページに記載があり、同義語を除いて種が18,672菌種となっていました。この数値はあくまでも認められている菌種数で、俗に言う”確認されているだけで”ってやつです。

 本当は古細菌を除いたバクテリアだけの総数を知りたくて、csvファイルからソートでもして確認しようとしたのですが、属以下のカラムしか存在せず、Domainレベルではソートできませんでした(カラムが増えるのを嫌ったのででしょうか?Domainレベルから記載してほしいところです)。しかたなくLPSN APIをいれて検索をかけようと思ったのですが、これまた思っている結果は得られませんでした。英語版のwikiでも古細菌含む総数で書かれていたので、そういうものだと諦めました(地道に古細菌をソートして除けばいけますが流石にしんどい)。

2. リファレンスゲノムが存在する細菌は15,572菌種以下で古細菌を含むと16,103菌種以下


 次に2番目のリファレンスゲノムですが、これはNCBIのデータベースを参考にし、Reference genomesをフィルターで選択し、RefSeq onlyの数を採用しました。”以下”となっているのは、大腸菌のようにReferenceを2個もつ菌種があり(この2つはANI_value 98を超えます)これらを除く設定や術が不明であったためです。全てのデータが属名と種名で構成されていればuniqコマンドでも使って適当に処理できたのですが、自由に命名されていて、うまく処理できませんでした。ただReferenceを2個もつ菌種はほとんどいないので、無視してもいいと思います(大腸菌以外知らない)。

ArchaeaまたはBacteriaかつReference genomesでソート
RefSeq onlyの値を参考にした

ちなみにBacteriaだけだと15,572菌種

RefSeq onlyの値を参考にした

ゲノム情報から推測すると細菌は62,291菌種、古細菌は6,062菌種に分かれる可能性あり

 最後の3番目ですが、これはGTDBのトップページに記載されている菌種数を参考にしました。

 GTDBに関する論文までは読んでいないですが、NCBI(公開されているデータベース)のゲノムデータをFastANI等を使用してゲノム的に分けれるところまで分けたところ62,291菌種まで分けれた。ということらしいです。確かに、同じ菌種(とされているゲノム情報)でANIをかけたときに結構な割合で違う菌種とのほうが値が高かったり、95以上になる菌種が見つからなかったりするし、系統樹を書いても明らかに違うグループになっているものが混ざり込んでいるので62,291菌種は妥当な数値だと思う。ただ、ゲノム情報が欠損していたり、コンタミしていることで外れることもあるし(弾く処理をしていても)、マイナーな菌種であればあるほど再検証も難しいし、本当に細かいところはノイズとの戦いなんだろうなと勝手に思っている。

追記
 詳しく見ていくとNCBIでRepresentativeのゲノムをもつ菌種でもGTDBに存在しない菌種がいます。それらはたいていLPSNで確認すると、「有効な名前になっていません」となっており、近縁種に統合されていたりします。ややこしいですが、国際原核生物命名規約 (ICNP) に載っている菌種が正しく、我々はそのデータをまとめているLPSNを参照するのが一番正しい菌種名を得ることができます。

まとめと所感

 細菌は約2万種が確認されていて、ゲノム情報を活用すれば約6万種まで分けることができる。
 自分の感覚では意外と少ないと感じたが、ただ今後、シーケンスコストの低下とメタゲノム解析は間違いなく増えていくので、しばらくは加速度的に菌種数が増えていくはず。種を分けるということ自体が分類学的には重要なのかもしれないが、データベースが充実してくれば、今みたいにころころ種名や属名が変わらないようになり、菌を扱う全ての人が恩恵を受けるので、この分野で研究している人たちには感謝の一言に尽きる。

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

目次