細菌と古細菌の単一の概要

ブログ

ホームページホームページ / ブログ / 細菌と古細菌の単一の概要

Jan 12, 2024

細菌と古細菌の単一の概要

volume di dati scientifici 10,

Scientific Data volume 10、記事番号: 332 (2023) この記事を引用

1233 アクセス

22 オルトメトリック

メトリクスの詳細

酸素極小地帯 (OMZ) または酸素欠乏海洋地帯 (AMZ) と呼ばれる酸素欠乏海水は、一般的な海洋学的特徴です。 それらは、低酸素条件に適応した国際的な微生物と固有の微生物の両方を宿主としています。 OMZ と AMZ 内の微生物の代謝相互作用は、連動した生物地球化学サイクルを推進し、その結果、窒素の損失と気候活動性微量ガスの生産と消費が引き起こされます。 地球温暖化により、酸欠水域の拡大と強度が高まっています。 したがって、酸素欠乏地域に生息する微生物群集に焦点を当てた研究は、海洋生態系の機能とサービスに対する気候変動の影響を監視し、モデル化するために必要です。 ここでは、代表的な OMZ および AMZ 地球化学プロファイルを含む、海洋環境からの 5,129 個の単細胞増幅ゲノム (SAG) の概要を紹介します。 これらのうち、3,570 個の SAG はさまざまな完成レベルで配列決定されており、ゲノム内容と OMZ および AMZ マイクロバイオーム内の潜在的な代謝相互作用に関する株分解の観点が提供されています。 階層的クラスタリングにより、同様の酸素濃度および地理的地域からのサンプルも同様の分類学的組成を有することが確認され、比較群集分析のための一貫した枠組みが提供されました。

酸素欠乏帯は、有機物の分解中に微生物の呼吸酸素要求量が酸素利用可能量を超えるときに生じる一般的な海洋学的特徴です(図1)。 これらの水は、異酸素性(20 ~ 90 μM)、亜酸素性(1 ~ 20 μM)、無酸素性(1 μM 未満)または無酸素硫化物(検出可能な酸素なし)の範囲の酸素条件に基づいて運用上定義されています1,2。 北太平洋の亜熱帯循環などの海洋中水域の酸素最小地帯(OMZ)は、沈下する粒子状有機物の微生物による再石灰化を通じて嫌気性代謝をサポートできる異酸素状態を示しています3(図1a)。 北東亜寒帯太平洋(NESAP)などの低酸素沿岸および外洋OMZでは、硝酸塩(NO3−)還元のための酸化還元遷移を含む亜酸素条件が存在します(図1a)。 酸素欠乏性海洋ゾーン(AMZ)は、硫化物の蓄積の有無にかかわらず、亜硝酸塩(NO2-)の蓄積によってさらに区別されます(それぞれ硫化物底層水と外洋または低酸素最小ゾーン(OMZ))4、5、6。 例えば、東部熱帯北太平洋(ETNP)と東部熱帯南太平洋(ETSP)のAMZは、NO3−NO2−への還元をサポートするナノモル酸素条件を示し、硫化水素(H2S)の蓄積なしに窒素生成物をさらに減少させます(図1a)。 対照的に、ナミビア沖のベンゲラ湧昇などの沿岸湧昇システムでは、酸素欠乏の一時的な変化が見られ、一時的な硫化物プルームの出現を裏付けています(図1a)。 無酸素硫化物条件はサーニッチ湾(SI)などの沿岸フィヨルドにも存在しており、そこでは氷河の敷居が水塊の循環を制限しています。 硫化物底の状態は、バルト海のような縁海でも観察されます(図1a)。

酸素極小地帯 (OMZ) と酸素欠乏海洋地帯 (AMZ) の地球化学的プロファイルとサンプリング場所の世界地図。 (a) 酸素欠乏海水のさまざまな地球化学的プロファイルが図式化されています (Ulloa et al., 2012 から修正)4。 実線は観測データを表し、破線は散発的な蓄積イベントを表します。 (b) 単一細胞増幅ゲノム (SAG) の OMZ および AMZ サンプリング位置が示されています。 各位置から取得された SAG の総数 (白) とシーケンス済み (黒) は、データセット内の対応するサンプル数に比例した円で示されます。 海洋は、2018 年の NOAA World Ocean Atlas119 で 1 度および 5 度のグリッドごとに報告された酸素濃度の最も低い平均統計値に従って色分けされており、白いグリッドは酸素濃度データが利用できなかった場所を示しています。 海洋中海からのサンプリング場所には、北太平洋亜熱帯循環 (NPSG) と南大西洋亜熱帯循環 (SASG) が含まれます。 低酸素 OMZ のサンプル サイトには、北東亜寒帯太平洋 (NESAP) が含まれます。 AMZ のサンプル サイトには、東部熱帯北太平洋循環 (ETNP) と東部熱帯南太平洋循環 (ETSP) が含まれます。 一時的な硫化物底を持つ沿岸湧昇システムのサイトには、南太平洋東部沿岸湧昇 (ESPCU) やベンゲラ沿岸湧昇 (ベンゲラ) などがあります。 硫化物底盆地からのサンプリング場所には、サーニッチ湾 (SI) やバルト海などがあります。 地理位置座標と各場所のサンプル数の詳細を表 1 に示します。

OMZ と AMZ 内の異なる地球化学プロファイルは生態熱力学的勾配 7 を生み出し、低酸素条件下での生活に適応した国際的および固有の微生物による炭素、窒素、硫黄の結合した生物地球化学的循環を促進します (2、3、4、8 で概説)。 これらの代謝相互作用が窒素損失と気候活動性微量ガス生成にどのように寄与するかを理解することは、重要な課題です9、10、11、12。 地球温暖化は、熱成層と水塊循環の変化を通じて水柱酸素欠乏を悪化させ、その結果、OMZ と AMZ の拡大と強化をもたらします 13,14,15。 過剰な栄養摂取(富栄養化)などの他の要因も、沿岸および海辺の酸素欠乏に寄与します15、16、17、18。 遺伝子中心のアプローチとゲノムを解決したメタゲノムアプローチの両方を使用して、OMZ と AMZ 内の結合した生物地球化学サイクルをモデル化する取り組みにより、分類学的解像度が向上した改良されたゲノムアセンブリの利用可能性から直接利益を得る重要な微生物集団が特定されました 19,20。

培養に依存しない全ゲノムショットガンシークエンシングは、自然環境および人工環境における微生物群集の構造と機能に対する直接的な洞察を提供します21、22、23、24、25、26、27。 配列決定技術が向上するにつれて、分類学的解像度が向上してメタゲノムからゲノムを組み立てることが可能になります20。 しかし、メタゲノム構築ゲノム(MAG)への依存が拡大しているにもかかわらず、集団の微小異質性28、不完全またはキメラゲノムアセンブリ(アセンブリまたはビニングのいずれかに起因する)の解決、カバレッジバイアス、および分類学的に特徴付けられた参照ゲノムの入手可能性の制限など、いくつかの課題が残っています。相互検証29、30、31。 蛍光活性化細胞選別(FACS)および配列決定技術の進歩により、個々の細胞レベルでの未培養微生物の研究が可能になり、より正確な分類学的ラベルおよび関連する可動性遺伝要素(MGE)が提供されます32,33,34,35,36,37,38。 。 得られた単細胞増幅ゲノム (SAG) と MGE は、「微生物の暗黒物質」のコード化の可能性を明らかにし 39、生物地球化学サイクルの基礎となる分類と機能の間の正確な関連性を提供し 20、21、30、40、ゲノムの合理化を評価するために使用されてきました。規模の人口構造 28、37、42 およびウイルスと宿主の動態 43。 最近リリースされた Global Ocean Reference Genomes Tropics (GORG-Tropics) は、熱帯および亜熱帯の有光海洋水域からの 12,000 以上の部分ゲノム配列を含む、分類学的に定義された SAG の貴重な概要を提供します。 GORG-Tropics SAG の少数のサブセットは「海洋中水域の低酸素」海域 (配列決定された SAG 20,288 件中 2,136 件) から収集されました 44 が、酸素欠乏海水域は、海洋生態系の機能とサービスに対する生物地球化学的影響が大きいことを考慮すると、依然として著しく過小評価されています。

ここでは、OMZ および AMZ からの細菌および古細菌の SAG の世界的な概要を紹介します。 この概要には、標的細胞選別法と非標的細胞選別法の組み合わせを使用して導き出され、現存する酸素欠乏海水に関連する地球化学的プロファイルの全範囲をカバーする環境から単離された、分類学的に同定された 5,129 個の SAG が含まれています 4 (図 1)。 現在、確立されたゲノム標準に基づいて、これらの SAG のうち 3,570 個が配列決定され、組み立てられ、除染されています 45 (図 2、S1a ~ c​​)。 配列決定およびアセンブルされた SAG は、遺伝子予測と機能アノテーションのために微生物ゲノム アノテーション パイプライン 46 を通じて処理され、統合微生物ゲノム プラットフォーム (IMG; https://img.jgi.doe.gov/)47 または IMG/ProPortal ( https://img.jgi.doe.gov/proportal)。 SAG 配列のコレクションは、代謝形質を推測し、集団構造を解明し、OMZ および AMZ マイクロバイオーム内の関連する分類系統の空間的および時間的傾向を評価するための貴重なリソースを提供します。

微生物の単細胞増幅ゲノム (SAG) を処理および生成するためのワークフローの概要。 より詳細なスキームは、補足情報(補足図 S1 ~ S3)に示されています(Rinke et al.、2013 から変更)50。

異なる OMZ および貧酸素水域内でのさまざまな海洋観測航海中に、約 1 ~ 2 mL の海水サンプルが 2 回または 3 回収集されました (図 1 および表 1)。 サンプルを滅菌凍結バイアルに入れ、次の凍結保護剤のいずれかで修正しました: グリシンベタイン (最終濃度 6% [v/v] 39,48)、グリセロール (最終濃度 10% [v/v] 28,49)、またはグリセロール-TEバッファ39、50。 環境海水の収集は、ニスキンボトル ロゼット、または NBP13-05 クルーズ (ETSP; R/V Nathaniel B. Palmer、2013 年 7 月 5 ~ 7 日) 用のポンプ プロファイリング システムを使用して実行されました。プロファイラー、溶存 O2 センサー、蛍光光度計、透過率計。 BiG RAPA クルーズ (ETSP、チリ沖、2010 年 11 月 19 日、水深 55 m) では、変更されたサンプル収集プロトコルが使用され、最初にデッキ上でクロロフィル含有微生物の選択が濃縮されました 51。 3つのサンプルを60μmサイズのメッシュに通し、Influx(商標)(BD Biosciences)フローサイトメーターシステムを通して選別した。 約 4,000 個の細胞を 1 mL の滅菌グリセロール-TE バッファーに選別しました。 分別は、粒子サイズの代用として前方散乱光を使用し、赤色発光チャネル (488 レーザーで励起) 内の粒子の色素含有量に基づいて開始されました。 すべてのサンプルは液体窒素中で凍結保存され、その後、単一細胞増幅ゲノム生成のために処理される前に、-80 °C で保存されました。

ビゲロー海洋科学研究所のシングルセルゲノミクスセンター (SCGC) または共同ゲノム研究所 (JGI) でサンプルが解凍され、微生物細胞が選別されました。 サンプルを滅菌した 40 μm サイズのメッシュに通した後、非標的分離手順またはシアノバクテリアの特異的選択によって微生物を選別しました。 非標的分離の場合、微生物粒子を最終濃度 5 μM の DNA 染色 SYTO-9 (Thermo Fisher Scientific) で標識しました。 励起用の 488 nm レーザーと 70 μm のノズルオリフィスを備えた MoFloTM (Beckman Coulter) または InFluxTM (BD Biosciences) のフローサイトメーター システムを使用して、微生物細胞を個別に選別しました 52。 SYTO-9 で染色された微生物細胞の非標的単離のゲートは、核酸含有量の代用として粒子の緑色蛍光、および粒子サイズの代用として側方散乱光に基づいて定義されました。 シアノバクテリア細胞の分離では、赤色発光チャネルの自己蛍光に基づいてゲートが定義されました。 緑色蛍光 (SYTO-9 DNA 標識) と赤色蛍光 (クロロフィル含有量) の比に基づいて、砕片粒子からシアノバクテリア細胞を識別する機能が向上しました。 サイトメーターは、「シングル 1 ドロップ」モードを使用して側方散乱でトリガーされました。 すべての微生物単細胞を、ウェルあたり 600 nL の 1X TE バッファーを含む 384 ウェル プレートに選別し、さらに処理するまで -80 °C で保存しました。 「AAA001」接頭語で識別される SAG を生成した微生物細胞のサブセット(深さ 800 m の SASG で収集された SAG の一部)は、「prepGEMTM Bacteria Reaction mix」(ZyGEM)に分類されました48。 Bigelow Single Cell Genomics Center で処理したサンプルについては、各プレートの 384 ウェルのうち 64 ウェルをネガティブ コントロール (液滴の付着なし) として使用し、3 ウェルにはそれぞれ 10 個の細胞を受け入れてポジティブ コントロールとして機能させました。

TE バッファーに分類された微生物単細胞を、冷 KOH53、または 0.4 mM KOH、10 mM EDTA、および 100 mM ジチオスレイトール 52 からなる溶解バッファー 700 nl を添加することにより、前述のように溶解しました。 冷KOHまたは溶解バッファーで溶解したサンプルについては、それぞれ4℃または20℃でサンプルを10分間インキュベートしました。 「prepGEMTM 細菌反応混合物」に分類された微生物細胞は、最初にメーカーの指示に従って溶解され、次に冷 KOH 溶解手順で処理されました 48。 次に、微生物の核酸は、従来の Phi29 媒介の「レガシー多重置換増幅」 (L-MDA39,53) またはより熱安定性の高い Phi29 ポリメラーゼを使用した「全ゲノム増幅-X」 (WGA- X52)。 この手順の生成物を、ここでは SAG と呼びます。

WGA-X で生成された単一細胞ゲノム増幅産物は分類学的に事前スクリーニングされていませんでしたが、L-MDA と非熱安定性ポリメラーゼを使用して処理されたほぼすべての SAG は、小サブユニット リボソーム RNA (SSU または 16 S rRNA) 遺伝子アンプリコンの配列決定によって分類学的に同定されました。 細菌 (27-F: 5'- AGAGTTTGATCMTGGCTCAG -3'54、907-R: 5'- CCGTCAATTCMTTTRAGTTT -3'55) および古細菌プライマー (Arc_344F: 5'- ACGGGGYGCAGCAGGCGCGA -3'56、Arch_915R: 5'- GTGCTCCCCCGCCAATTCCT) の両方-3'57) が使用されました。 リアルタイム PCR と得られたアンプリコンの配列決定は、前述のように実行されました 39,52。 得られた SSU rRNA 遺伝子アンプリコン配列を、BLAST + v2.9.059 の blastn を使用して SILVA データベース v138.158 に対してクエリしました。 上位の blastn ヒット (つまり、最高のカバレッジ、ビットスコア、アイデンティティ、および最低の e 値) を、事前にスクリーニングされた各 SAG の一次分類学的分類として使用しました (表 S1)60。 さらに、SSU rRNA 遺伝子アンプリコン配列を NCBI-RefSEQ v2021-08-14 データベースに対して照会しました61。 上位ヒットは、上記と同じ基準を使用して決定され、ここでは SAG の二次分類学的割り当てとして示されています (表 S1)60。 「未分類」と示された配列には、これらのデータベース内のいずれの参照に対しても有意な配列相同性はありませんでした (表 S1)60。

分類法を SAG に割り当てるために 2 つの方法が使用されました。 最初に、L-MDA によって生成された SAG の分類学的割り当ては、全ゲノム アセンブリから直接、または上記のアンプリコンから SSU rRNA 遺伝子配列を抽出することによって行われました。 ゲノム配列決定前に系統発生マーカーについてスクリーニングされなかった WGA-X 手順を通じて生成されたすべての SAG について、ゲノム アセンブリ内の > 500 bp の SSU rRNA 遺伝子配列を特定するために検索が実施されました (補足図 S2)。 この検索は、統合微生物ゲノムおよびマイクロバイオーム システム (IMG/M、https://img.jgi.doe.gov/m/) の遺伝子予測および注釈パイプライン (以下を参照) に基づいて実行されました 45,46。 さらに、Anvi'o v7.062 を使用したリボソーム RNA 遺伝子配列の回復ワークフローにより、SAG アセンブリのサブセットから SSU rRNA 配列が回復されました。 これらの SSU rRNA 遺伝子配列は、分類法を割り当てるために上記のように処理されました (表 S1)60。 1,281 個の SAG では十分な SSU rRNA 遺伝子配列情報が提供されなかったため (表 S2)60、すべての SAG アセンブリもゲノム分類データベース ツール キット GTDB-Tk v2.1.063,64,65,66,67,68,69 を通じて処理されました。 70 と GTDB R07-R207_v271,72,73 は、多座位分類学的割り当てのための参照データです。 これにより、SSU rRNA 遺伝子配列を欠いている SAG の分類学的同定が可能になり、部分的または完全な系統発生マーカー配列によって割り当てられた SAG と比較して追加の参照が提供されました。 両方の方法を使用して生成された分類学的割り当ての数は表 S360 に詳細に示されており、割り当ては表 S160 で利用できます。

SAG は以前に記載されているように配列決定され 39,52、SPAdes v2.2.10 から v3.10.074 を使用してそれらのリードがコンティグに組み立てられました。 2,000 bp 未満のコンティグは SAG アセンブリから除去されました。 次に、CheckM v1.2.175 を使用して、SAG アセンブリの完全性と汚染レベルを判定しました。 確立されたゲノム基準 45 に準拠するために、推定汚染率 5% を超えるアセンブリは ProDeGe v2.2 から v2.376 まで実行され、汚染推定値に改善が見られなくなるまで矛盾するコンティグが除去されました。 これらの SAG の汚染レベルと完全性レベルは CheckM v1.2.175 を使用して再評価され、依然として汚染が 5% を超えているものは、Anvi'o v562 で利用可能なメタゲノミクス ワークフローおよびリファイニング MAG ビン ワークフローを通じて手動で汚染除去されました。

ProDeGe 除染パイプライン 76 およびショートコンティグ トリミング (表 S5)60 を通じて処理された後、合計 14 個の SAG が 5% の汚染を超えました。 これらの SAG は、メタゲノミクス ワークフローおよびリファイニング MAG ビン ワークフローを使用して、Anvi'o v5 で手動で汚染除去されました62。 これらの SAG ごとに、コンティグ データベースと各データベースに対応する隠れマルコフ モデルが生成されました。 次に、遠心分離データベース 77 を使用して、各遺伝子の分類法が割り当てられました。 これらの SAG の追加の手動キュレーションは、サーニッチ湾メタゲノム (2011 年 8 月 100 m、150 m、および 2012 年 100 m、150 m。生体サンプル SAMN05224439、SAMN05224444、SAMN05224441、SAMN) からのメタゲノム読み取りに基づいて、各 SAG の異なるカバレッジを使用して実行されました。 05224518、バイオプロジェクトPRJNA247822)78。 生のメタゲノム読み取りは、bwa v0.7.17-r118879 および samtools v1.6-19-g1c03df680 を使用してマッピングされました。 Anvi プロファイル データベースは、コンティグ データベースと読み取られたマッピング ファイルを利用して、SAG ごとに生成されました。 個々のコンティグは、分類学的同一性、平均テトラヌクレオチド同一性、および低い差分カバレッジに基づいて、対話型インターフェイスを通じて手動で削除されました。 新しいアセンブリは fasta ファイルとしてエクスポートされ、CheckM で再評価されました。

汚染除去されたすべての SAG アセンブリに対して CheckM を実行した後、Bowers らの論文に基づいて各 SAG の品質が決定されました。 201745. 推定完全性が 50% 未満の SAG は、低品質の SAG とみなされます。 推定完全性が 50% 以上で、推定汚染が 10% 未満の SAG は、少なくとも中程度の品質であるとみなされました。 SAG が高品質であるかどうかを判断するには、90% を超える推定完全性と 5% 未満の推定汚染に加えて、SAG に 23 個の S、16 S、および 5 S rRNA 遺伝子と、最終アセンブリに少なくとも 18 個の tRNA が存在する必要があります。 。 rRNA と tRNA を特定および定量するために、SAG を Barrnap v0.9 (https://github.com/tseemann/Barrnap)81 および tRNA-SE v2.0.1182 にそれぞれ通過させました。 推定完全性が 90% を超え、推定汚染が 5% 未満であるが、少なくとも 18 個の tRNA を持つ 1 つ以上の rRNA 遺伝子が欠落している SAG は、中品質として分類されました。 各 SAG の rRNA および tRNA の数、および品質分類は表 S160 にあります。

すべてのゲノム アセンブリは、Joint Genome Institute の IMG プラットフォームを通じてアノテーションが付けられ、JGI Microbial Genome Annotation Pipeline46 を使用してアノテーションが付けられました。 IMG (https://img.jgi.doe.gov/) または IMG/ProPortal (https://img.jgi.doe.gov/proportal) システムは、遺伝子コールと機能を備えた、最終的に組み立てられ汚染除去されたすべての SAG シーケンスをホストします。注釈はこれらのポータルを通じて公開されています。 配列決定された SAG のすべての IMG アクセッション番号が提供されています (表 S1)60。

V4-V5可変領域をカバーする回収されたSSU rRNA遺伝子アンプリコン配列は、CD-Hit83、84、85を使用して97%の同一性でクラスター化され、各クラスターの代表的な配列に基づいて識別子が割り当てられました。 これらの代表的な配列の分類学的同一性に基づいて、各クラスターに関連する SAG の割合がサンプルごとに決定されました。 これらの比率は、vegan R パッケージ v2.5-786 の vegdist() コマンドを使用して Bray-Curtis の相違指数を計算するために使用されました。 サンプルは、ベース R の hclust コマンドを使用した階層的クラスタリングの平均リンク法を使用して、Bray-Curtis の非類似性に基づいてクラスタリングされ、視覚化されました (図 3)。

OMZ 全体の微生物組成の SAG ベースの評価。 ドットプロットは、各場所からの分類学的指定と、門レベルでの各分類群およびクラスレベルでのプロテオバクテリアで配列決定された匿名でソートされた SAG の割合 (色付きのドット) を示します。 下の灰色の点は、収集され、分類学的にスクリーニングされたが、現在配列されていない SAG を表します。 分類は、SILVA v138.1 で定義されている SSU rRNA 遺伝子アンプリコン配列によって決定されました。 ドットの色はサンプリング時の環境酸素濃度を表します。 サンプリング場所は、各場所で収集された SAG 分類学的構成の類似性に従ってクラスター化されました。 クラスタリング スケールは、SAG 配列情報に基づいて、各場所の微生物多様性間の Bray-Curtis の非類似性を表します。 注釈バーは DNA 増幅方法と OMZ タイプを示します。 位置情報は、DNA増幅方法、OMZまたはAMZの種類、サンプリング時の酸素濃度ごとに色分けされています。 樹状図の先端にあるサンプリング場所の名前は、「location_ Depth (m)_collection month and/or year」として示されます。 位置の頭字語は、サーニッチ湾 (SI)、亜寒帯太平洋北東部 (NESAP)、北太平洋亜熱帯循環 (NPSG)、熱帯北太平洋東部 (ETNP)、熱帯南太平洋東部 (ETSP)、南太平洋東部沿岸湧昇 (ESPCU) に対応します。 、ベンゲラ沿岸湧昇(ベンゲラ)、南大西洋亜熱帯循環(SASG)、バルト海(バルト海)。

ファイル 1: テーブル S1。 関連するクルーズおよび地理位置情報メタデータを含む OMZ SAG 生体サンプル。 このファイルには、すべての Bioproject および Biosample アクセッション、IMG ゲノム ID、SRA アクセッション、Genbank アクセッション、CheckM 出力、GTDB-tk 出力、および SSU rRNA BLAST 結果が含まれています。表 S1_Metadata-template-Bio-Med-SAGdescriptor-OMZ_April_06_2023 にあります。 xlsx (10.6084/m9.figshare.20481603)60.

ファイル 2: テーブル S2。 各 DNA 増幅法で生成された SAG の数、および各データセットから回復された SSU rRNA 遺伝子配列の数。 アンプリコンと全ゲノム由来の SSU rRNA 遺伝子配列の両方を含むサンプルがいくつかあることに注意してください。 この情報は、(10.6084/m9.figshare.20539005)60 および: https://github.com/hallamlab/OMZ_SAG_Compendium_Figures/blob/main/Outputs/Table_S2_summary_Table_WGA_Approach_Mar_21_2023.csv にあります。

ファイル 3: 表 S3。 SILVA v138.1 および GTDB-tk v2.1.0 の分類が割り当てられた SAG の数と、それらの概要 CheckM 完全性 % および汚染率推定値。 この情報は、(10.6084/m9.figshare.20539056)60 および https://github.com/hallamlab/OMZ_SAG_Compendium_Figures/blob/main/Outputs/Table_S3_QA_QC_summary_Mar_21_2023.csv にあります。

ファイル 4: 表 S4。 この概要で使用される SAG を含む各 384 マイクロウェル プレートの一次および二次コンタクト。 この情報は、表 S4_PI_Contact_Info.xlsx (10.6084/m9.figshare.20483595)60 にあります。

ファイル 5: ゲノム アセンブリを含む zip ファイル圧縮 tar アーカイブ (10.6084/m9.figshare.20459526)60.fna – multi-fasta 形式の核酸ファイル

ファイル 6: ゲノム SSU rRNA 遺伝子配列、および分類学的割り当てに使用される部分的な SSU rRNA 遺伝子アンプリコン配列を含む zip ファイル圧縮 tar アーカイブは、(10.6084/m9.figshare.20537919)60.fna – 核酸ファイルにあります。マルチファスタ形式で

ファイル 7: 表 S5。 サーニッチ湾から手動除染を受けた SAG のリストと、それらが発生した深さを含む xlsx ファイル。 深さは、手動除染プロセスに使用されるメタゲノム読み取りを選択するために使用されました。 この表は (10.6084/m9.figshare.20538936)60 にあります。

SAG ワークフローの初期の実装には、384 ウェル プレート形式で匿名で選別された単一細胞の MDA と、それに続く選択された系統発生マーカー (SSU rRNA 遺伝子など) の PCR 増幅を行って、シークエンシング対象の SAG を同定することが含まれていました 39。 WGA-X と低カバレッジゲノムシークエンシング (LoCoS) を組み合わせた最近の開発により、潜在的な PCR バイアスなしでサンプルあたり数百の SAG を識別するためのより経済的なワークフローが提供されます 52。 セルロースなどの蛍光標識基質に結合するシアノバクテリアや細胞など、細胞または基質のスペクトル特性に基づいて標的を選別する方法は、SAG の選択と配列決定にも適用されています 87、88、89。 SSU rRNA 遺伝子は依然として最も広く使用されている系統発生マーカーの 1 つであり、十分に確立され厳選されたデータベース (SILVA58 など)、GTDB-Tk63、64、65、66、67、68 などの多座位系統割り当てツールを備えています。 69、70 は、より多くの情報を使用して同様に有効な結果を生成します。 この大要では、分類学的ラベルと非標的細胞選別アプローチを使用して配列決定された SAG の存在量情報を使用して、微生物の多様性が評価されました。 ただし、アンプリコン配列が短すぎる (500 bp 未満のアンプリコンを持つ 188 個の L-MDA SAG; 表 S2) か、ランダムゲノム増幅から SSU rRNA 遺伝子が回収されなかったため、すべての SAG が SSU rRNA 遺伝子分類と一致するわけではありませんでした。 (つまり、1,093 個の WGA-X SAG、表 S2)。 したがって、GTDB-Tk63、64、65、66、67、68、69、70 を使用した全ゲノム割り当てに基づいて、すべての SAG に対して追加の分類分類器が実行されました。 両方の分類セットが表 S1 に示されています。 (割り当て可能な V4-V5 SSU rRNA 遺伝子アンプリコン配列を含む 3,217 個の SAG の)階層的クラスタリングにより、同様の酸素条件を持つ深さと地理的位置からの SAG 間の類似性が高いことが明らかになりました(図 3)。この結果は以前の観察と一致しています 2,3,4 、8。 WGS-X 法で増幅された SAG の多くは、高度に酸素化されたサンプルに由来し、同様の分類学的組成を有しており、したがってクラスター化していることにも注意してください。 この情報に基づいて、ここで提示された OMZ および AMZ SAG シーケンスは、(酸素化された) 有光海洋水から得られた以前の SAG コレクションを補完する役割を果たすはずです 44,49。

この概要は、海洋の酸素欠乏海域からの分類学的にラベル付けされた参照ゲノムの重大なギャップを埋めることを目的としています。 含まれる SAG シーケンスは、十分に確立されたアセンブリおよび汚染除去ワークフローを使用して処理されました。 ただし、将来のソフトウェア バージョンの使用や代替ワークフローの実装に関心のあるユーザーは、生データへのリンクも利用できます。 どのようなアプローチでも、FACS (2 つ以上の細胞を 1 つのウェルに同時分類すること、環境 DNA 汚染) および WGA (試薬汚染) に関連する汚染配列を識別することを目的とすべきです90。 SAG 配列には、プラスミドやウイルスを含む MGE が含まれることが多い 43、91、92、93 ことを強調することが重要です。 これらの配列は通常、除染プロセス中に濾過されて除去されますが、アイランドや MGE からのプロファージなどの内在性染色体間隔を区別するには、慎重な手作業によるキュレーションが必要です。 MGE に興味のあるユーザーは、除染の前に生データまたは初期ア​​センブリを操作することをお勧めします。 CheckM によって得られたゲノムアセンブリのコンタミネーション推定値は慎重に扱う必要があることに注意してください。このツールは完全性とコンタミネーションを過大または過小評価する傾向があるためです94。 前述したように、WGA-X を使用した MDA の最近の進歩により、SAG の完成度が向上し、LoCoS の採用により、シークエンシングのために目的の SAG を選択するための SSU rRNA 遺伝子アンプリコンのスクリーニングの必要性がなくなりました 52。 この概要に含まれる配列には、古い SAG 配列決定アプローチとより現代的な SAG 配列決定アプローチの両方が含まれています。 結果は、SILVA、NCBI、および GTDB に基づいて SSU rRNA 遺伝子と複数遺伝子座の分類学的割り当てを提示することによって統合されます。

WGA-X52 で導入された改良にもかかわらず、単一細胞ゲノミクスでは常に不完全なゲノムアセンブリが生じます (図 4、補足図 S4)。 この制限は、非常に高いレベルのヌクレオチド同一性を共有する複数の SAG が同じサンプルから得られる場合に部分的に克服できます。 このような密接に関連した配列を一緒に分析することで、より完全な代謝再構成 7,33,42,51 が可能になったり、組み合わせたアセンブリの生成に使用したり 50,95 することができます。 さらに、集団レベルのゲノムは、SAG 配列とメタゲノム配列を組み合わせたハイブリッドアセンブリを通じて取得できます 96,97。 いずれの場合も、SAG コンティグは高品質のフィルタリングを行って夾雑配列の存在を排除し、確立されたゲノム標準に準拠する必要があります 45。 ここで報告されたすべての SAG アセンブリは徹底的に除染され、4 つを除くすべての SAG で汚染度が 5% 未満に達しました (汚染度が 5 ~ 10% の間のみでした。図 4、補足図 S4、表 S2)。

CheckM は、メガベース ペア (MBP) でのアセンブリ長を表すポイント サイズを使用して、すべての配列決定済み SAG の配列決定済み SAG の完全性と汚染推定を行います。 これらのうち、実線は中品質 SAG (> = 50% 完全性、<10% 汚染) の推定完全性および汚染しきい値を表し、破線は高品質 SAG (>90% 完全性、<5% 汚染) のしきい値を表します。 )45. プロットは、(a) 地域、(b) OMZ エコタイプ、(c) 深さ、(d) 環境酸素濃度レベル、(e) DNA 増幅方法、および (f) 分類グループ (プロテオバクテリアのクラス レベル、門レベル) に基づいて色付けされます。他の分類群の場合)SILVA v138.1 で定義されています。 推定汚染度が 5% を超える SAG はこの図から除外されていることに注意してください。

この大要に含まれる SAG の多くは配列決定されておらず、DNA は保管されたままです。 ユーザーには、提供された分類学的情報に基づいて、OMZ および AMZ マイクロバイオームから過小評価されている微生物を特定し、配列決定の優先順位を付けてユーザー コミュニティと共有することが推奨されます。 同時に、この概要に含まれていない、過小評価されている OMZ および AMZ 環境も存在することを認識しています。 とりわけ、黒海、南シナ海、アラビア海、ベンガル湾からのシーケンスは、比較研究やモデリングの取り組みで使用できる酸素欠乏海域のより堅牢な表現を提供するでしょう。 最後に、この大要に含まれる SAG 配列は、分類学的に特徴付けられた参照ゲノムとして使用して、海洋環境からメタゲノム データセットを収集したり、経路予測方法 29,98,99,100,101,102,103,104,105,106 を改善したり、機能マーカーの遺伝子中心の分析のための参照パッケージを拡張したりすることができます 107。

SAG の数、Bray-Curtis 相違行列の計算に使用されるスクリプトは、階層クラスターを実行し、図を生成します。 1b、3、4、補足図 S4 ~ S8 は R バージョン 4.1.3 で書かれています。 これらのスクリプトは、次の R パッケージを利用します。tidyverse、egg、vegan、dendexted、sf、rnaturalearth、および rnaturalearthdata は、このホワイト ペーパーに示されている表と図を生成します。 関連するソフトウェアと仕様への直接リンクは、Hallam Lab Github リポジトリ https://github.com/hallamlab/OMZ_SAG_Compendium_Figures でオンラインで見つけることができます。

バージョン番号、調整可能な変数、その他のパラメーターなど、使用される追加のソフトウェアには次のものがあります。

トリムマティック 0.35108: -phred33 リーディング:0 トレーリング:5 スライディングウィンドウ:4:15 ミンレン:36

ILLUMINACLIP:Trimmomatic-0.35108: /adapters/TruSeq. 3-PE.fa:2:3:10 リーディング:3 トレーリング:3 スライディングウィンドウ:4:15 ミンレン:36

SPAdes 3.0.0-3.10 74 : --careful--sc--phred-offset 33

ProDeGe v2.3.0 76

CheckM v1.2.175: checkm lineage_wf --tab_table -x.fna --threads 8 --pplacer_threads 8

CheckM v1.2.175: checkm qa -o 2 --tab_table

GTDB-Tk v2.1.063,64,65,66,67,68,69,70: gtdbtk assign_wf --genome_dir --out_dir -x.fna --cpus 8

ヌクレオチド-ヌクレオチド BLAST 2.9.0+59: blastn -query -db -outfmt "6 qacc sacc stitle staxid pident bitscore" -max_target_seqs。 1 -num_threads 4 -out

ヌクレオチド-ヌクレオチド BLAST 2.9.0+59: blastn -query -db -outfmt "6 qacc stitle pident bitscore" -max_target_seqs。 1 -num_threads 4 -out

Anvi'o v562: anvi-gen-contigs-database -f -o -n

Envi'o v562: anvi-run-hmms -c

Anvi'o v562: anvi-get-sequences-for-gene-calls -c -o

Anvi'o v562: $CENTRIFUGE_BASE/p + h + v/p + h + vgene-calls.fa -S centrifuge_hits.tsv

Anvi'o v562: anvi-import-taxonomy-for-genes -c -p

BWA v 0.7.17-r118879:bwa インデックス

BWA v 0.7.17-r118879:bwa メモリ

Samtools v 1.6-19-g1c03df6 (htslib 1.6-55-gb065a60 を使用)80: samtools view -b F 4

Samtools v 1.6-19-g1c03df6 (htslib 1.6-55-gb065a60 を使用)80: samtools インデックス ファイル.sorted.bam

Anvi'o v562: anvi-profile -i -c --min-contig-length 2000 --output.dir --cluster-contigs

Anvi'o v562: anvi-merge path_to_profile1/PROFILE.db path_to_profile2/PROFILE.db -o --skip-concoct-binning

Anvi'o v562: anvi-interactive -p

Anvi'o v562: anvi-summarize -c -p -C

Anvi'o v762: anvi-gen-contigs-database -f -o

Anvi'o v762: anvi-run-hmms -c --num-threads 8

Anvi'o v762: anvi-get-sequences-for-hmm-hits

barrnap81: barrnap --kingdom bac --threads {threads} --outseq {working_dir}/barrnap/*rRNA.fasta {input.fasta_dir}/$g.fasta > {working_dir}/barrnap/$g.rRNA.gff

barrnap v0.982: barrnap --kingdom arc --threads {threads} --outseq {working_dir}/barrnap/*rRNA.fasta {input.fasta_dir}/$g.fasta >{working_dir}/barrnap/$g.rRNA .gff

tRNAscan-SE v 2.0.1182: tRNAscan-SE -B -o {working_dir}/trnascan/$g.output.txt -m {working_dir}/trnascan/$g.stats.txt -b {working_dir}/trnascan/$ g.bed -j {working_dir}/trnascan/$g.gff -a {working_dir}/trnascan/$g.trna.fasta -l {working_dir}/trnascan/$g.log --thread {th​​reads} {input. fasta_dir}/$g.fasta

Revsbech、NP et al. STOXセンサーによる酸素最小ゾーンにおける超低酸素濃度の測定。 リムノール。 海洋学者: 方法。 7、371-381。 (2009年)。

Wright、JJ、Konwar、KM & Hallam、SJ 拡大する酸素最小ゾーンの微生物生態学。 ナット。 Rev.Microbiol. 10、381–394 (2012)。

論文 CAS PubMed Google Scholar

Jürgens, K. & Taylor, GT 『Microbial Ecology of the Oceans』の酸素欠乏水柱の微生物生態学と生物地球化学 (Gasol, JM & Kirchman, DL 編) 231–288 (John Wiley & Sons, 2018)。

Ulloa、O.、Canfield、DE、DeLong、EF、Letelier、RM & Stewart、FJ 無酸素酸素最小ゾーンの微生物海洋学。 手順国立アカド。 科学。 USA 109、15996–16003 (2012)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Thamdrup, B.、Dalsgaard, T. & Revsbech, NP 南太平洋東部の酸素極小地帯における広範な機能的酸素欠乏症。 深海研究所ポイント I. 65、36–45 (2012)。

ブリストウ、ルイジアナ州ら。 酸素最小ゾーンの水中でのナノモル酸素濃度でのアンモニウムおよび亜硝酸塩の酸化。 手順国立アカド。 科学。 USA 113、10601–10606 (2016)。

論文 ADS CAS PubMed PubMed Central Google Scholar

ホーリー、AK 他多様な海洋微生物細菌は、生態熱力学的勾配に沿って結合した生物地球化学サイクルを媒介する可能性があります。 ナット。 共通。 1507 年 8 月 (2017 年)。

論文 ADS PubMed PubMed Central Google Scholar

Bertagnolli、AD および Stewart、FJ 海洋酸素最小ゾーンの微生物ニッチ。 ナット。 Rev.Microbiol. 16、723–729 (2018)。

論文 CAS PubMed Google Scholar

Codispoti、LA et al. 海洋の固定窒素と亜酸化窒素の予算:人新世に入るとターゲットは移動する? サイエンティアマリーナ。 65、85–105 (2001)。

DeVries, T.、Deutsch, C.、Rafter, PA & Primeau, F. 海洋の脱窒率はグローバル 3-D 逆モデルから決定されます。 生物地球科学。 10、2481–2496 (2013)。

ナクヴィ、SWA et al. CH4 および N2O の供給源としての海洋の低酸素/酸素欠乏。 Biogeosciences 7、2159–2190 (2010)。

Thamdrup, B. et al. 嫌気性メタン酸化は、海洋最大の酸素最小ゾーンにおけるメタンの重要な吸収源です。 リムノール。 海洋学者。 64、2569–2585 (2019)。

Stramma, L.、Johnson, GC、Sprintall, J. & Mohrholz, V. 熱帯海洋における酸素最小ゾーンの拡大。 サイエンス 320、655–658 (2008)。

論文 ADS CAS PubMed Google Scholar

Schmidtko, S.、Stramma, L. & Visbeck, M. 過去 50 年間における世界の海洋酸素含有量の減少。 ネイチャー 542、335–339 (2017)。

論文 ADS CAS PubMed Google Scholar

Carstensen, J.、Andersen, JH、Gustafsson, BG & Conley, DJ 前世紀におけるバルト海の脱酸素化。 手順国立アカド。 科学。 USA 111、5628–5633 (2014)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Diaz, RJ & Rosenberg, R. 広がるデッドゾーンと海洋生態系への影響。 サイエンス 321、926–929 (2008)。

論文 ADS CAS PubMed Google Scholar

Malone, TC & Newton, A. 沿岸海洋における文化的富栄養化のグローバル化: 原因と結果。 フロント。 3月科学。 7、670 (2020)。

ウッドクロフト、BJ 他永久凍土の融解における炭素処理のゲノム中心の視点。 Nature 560、49–54 (2018)。

論文 ADS CAS PubMed Google Scholar

Louca, S. et al. モデル酸素最小ゾーンにおける生物地球化学とマルチオーム配列情報の統合。 手順国立アカド。 科学。 アメリカ合衆国。 113、E5925–E5933 (2016)。

Reed, DC、Algar, CK、Huber, JA & Dick, GJ 環境ゲノミクスと生物地球化学モデルを統合する遺伝子中心のアプローチ。 手順国立アカド。 科学。 アメリカ合衆国。 111、1879–1884 (2014)。

論文 ADS CAS PubMed PubMed Central Google Scholar

タイソン、GW 他環境からの微生物ゲノムの再構築による群集構造と代謝。 Nature 428、37–43 (2004)。

論文 ADS CAS PubMed Google Scholar

アイバーソン、V. et al. メタゲノムからゲノムのもつれを解く: 海洋古細菌の未培養クラスを明らかにする。 サイエンス 335、587–590 (2012)。

論文 ADS CAS PubMed Google Scholar

ライトン、KCら。 複数の未培養細菌門における発酵、水素、硫黄の代謝。 サイエンス 337、1661–1665 (2012)。

論文 ADS CAS PubMed Google Scholar

ヴェンター、JC et al. サルガッソ海の環境ゲノムショットガン配列決定。 サイエンス 304、66–74 (2004)。

論文 ADS CAS PubMed Google Scholar

Albertsen, M.、Hansen, LBS、Saunders, AM、Nielsen, PH & Nielsen, KL 強化された生物学的リン除去を実行する本格的な微生物群集のメタゲノム。 ISME J. 6、1094–1106 (2012)。

論文 CAS PubMed Google Scholar

デロング、EF 他。 海洋内部の層別微生物集団間の群集ゲノミクス。 サイエンス 311、496–503 (2006)。

論文 ADS CAS PubMed Google Scholar

砂川 伸 ほか地球規模の海洋マイクロバイオームの構造と機能。 サイエンス 348、1261359 (2015)。

論文 PubMed Google Scholar

カシュタン、N.ら。 単細胞ゲノム解析により、野生のプロクロロコッカスには数百もの亜集団が共存していることが明らかになりました。 サイエンス 344、416–420 (2014)。

論文 ADS CAS PubMed Google Scholar

Basher、ARMA、McLaughlin、RJ & Hallam、SJ 豊富な経路特徴を備えたマルチラベル分類を使用した代謝経路の推論。 PLoS コンピューティング。 バイオル。 16、e1008174 (2020)。

記事 Google Scholar

メジティ、A.ら。 自然集団を表現する際のメタゲノム構築ゲノム (MAG) の信頼性: 同じ糞便サンプルに由来する分離ゲノムに対する MAG の比較からの洞察。 応用環境。 微生物。 87、e02593-20 (2021)。

Sczyrba, A. et al. メタゲノム解釈の重要な評価 - メタゲノミクス ソフトウェアのベンチマーク。 ナット。 方法 14、1063–1071 (2017)。

論文 CAS PubMed PubMed Central Google Scholar

Saak, CC、Dinh, CB & Dutton, RJ 微生物群集における移動性遺伝要素を追跡するための実験的アプローチ。 FEMS 微生物。 改訂 44、606–630 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Stepanauskas, R. 単一細胞ゲノミクスによる微生物相互作用への盗聴。 フロント。 微生物。 6、258(2015)。

記事 PubMed PubMed Central Google Scholar

Stepanauskas, R. 単細胞ゲノミクス: 微生物を個別に観察する。 カー。 意見。 微生物。 15、613–620 (2012)。

Rinke, C. 微生物暗黒物質の単一細胞ゲノミクス。 方法 Mol. バイオル。 1849、99–111 (2018)。

論文 CAS PubMed Google Scholar

Ishoey, T.、Woyke, T.、Stepanauskas, R.、Novotny, M. & Lasken, RS 環境サンプルからの単一微生物細胞のゲノム配列。 カー。 意見。 微生物。 11、198–204 (2008)。

論文 CAS PubMed PubMed Central Google Scholar

バウワーズ、RMら。 単一細胞ゲノム解像度でのコミュニティ全体のサンプリングに基づいて、主要な温泉微生物集団を分析します。 ISME J. 16、1337–1347 (2022)。

論文 CAS PubMed Google Scholar

Woyke, T.、Doud, DFR & Schulz, F. 微生物単細胞配列決定の軌跡。 ナット。 方法 14、1045–1054 (2017)。

論文 CAS PubMed Google Scholar

リンケ、C.ら。 FACS ベースの単細胞ゲノミクスを使用して、未培養の環境微生物からゲノムを取得します。 ナット。 プロトック。 9、1038–1048 (2014)。

論文 CAS PubMed Google Scholar

パチアダキ、MG et al. 暗海の炭素固定における亜硝酸酸化細菌の主要な役割。 サイエンス 358、1046–1051 (2017)。

論文 ADS CAS PubMed Google Scholar

スワン、B.K.ら海洋表層におけるゲノムの流線化と浮遊性細菌の緯度方向の分散が蔓延している。 手順国立アカド。 科学。 USA 110、11463–11468 (2013)。

論文 ADS CAS PubMed PubMed Central Google Scholar

カシュタン、N.ら。 大西洋と太平洋のプロクロロコッカスの多様性とゲノム集団構造の基本的な違い。 ISME J. 11、1997–2011 (2017)。

論文 CAS PubMed PubMed Central Google Scholar

ルー、S.ら。 単一細胞およびメタゲノミクスによって明らかにされる、未培養の SUP05 細菌に感染するウイルスの生態と進化。 Elife 3、e03125 (2014)。

記事 PubMed PubMed Central Google Scholar

パチアダキ、MG et al. 単細胞ゲノミクスを通じて海洋マイクロバイオームの複雑さをグラフ化します。 セル 179、1623–1635.e11 (2019)。

論文 CAS PubMed PubMed Central Google Scholar

バウワーズ、RMら。 細菌および古細菌の単一増幅ゲノム (MISAG) およびメタゲノム構築ゲノム (MIMAG) に関する最小限の情報。 ナット。 バイオテクノロジー。 35、725–731 (2017)。

マルコウィッツ、VM 他。 統合微生物ゲノム比較解析システムの IMG 4 バージョン。 核酸研究所 42、D560–D567 (2014)。

論文 CAS PubMed Google Scholar

Chen, I.-MA et al. IMG/M v.5.0: 微生物ゲノムとマイクロバイオームの統合データ管理および比較分析システム。 核酸研究所 47、D666–D677 (2019)。

論文 CAS PubMed Google Scholar

スワン、B.K.ら暗い海洋に遍在する細菌系統間の化学合成独立栄養の可能性。 サイエンス 333、1296–1300 (2011)。

論文 ADS CAS PubMed Google Scholar

ベルベ首相ほか多様な海洋環境からのプロクロロコッカス、シネココッカス、および同所性微生物の単細胞ゲノム。 科学。 データ 5、180154 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

リンケ、C.ら。 微生物の暗黒物質の系統発生とコード化の可能性についての洞察。 ネイチャー 499、431–437 (2013)。

論文 ADS CAS PubMed Google Scholar

プロミンスキー、AM et al. 酸素欠乏海洋地帯における炭素、窒素、硫黄の結合循環に関与する、これまで特徴づけられていなかった重要な微生物グループの代謝潜在力とその場トランスクリプトームプロファイル。 環境。 微生物。 20、2727–2742 (2018)。

論文 CAS PubMed Google Scholar

Stepanauskas、R. et al. ゲノム回収率が向上し、個々の未培養微生物細胞とウイルス粒子の細胞サイズ分析が統合されました。 ナット。 共通。 8、84 (2017)。

論文 ADS PubMed PubMed Central Google Scholar

ラグナサン、A.ら。 単一細菌からのゲノム DNA の増幅。 応用環境。 微生物。 71、3342–3347 (2005)。

Page, KA、Connon, SA & Giovannoni, SJ オレゴン州クレーター湖から分離された代表的な淡水バクテリオプランクトン。 応用環境。 微生物。 70、6542–6550 (2004)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Stackebrandt, E. & Goodfellow, M. 細菌系統学における核酸技術。 (ジョン・ワイリー&サン・リミテッド、1991)。

シャペル、FH et al. メタン生成菌が優勢な水素ベースの地下微生物群集。 Nature 415、312–315 (2002)。

論文 ADS PubMed Google Scholar

Ohene-Adjei, S.、Teather, RM、Ivan, M. & Forster, RJ ヒツジ第一胃における接種後の原虫の確立とメタン生成古細菌の関連パターン。 応用環境。 微生物。 73、4609–4618 (2007)。

論文 ADS CAS PubMed PubMed Central Google Scholar

クアスト、C.ら。 SILVA リボソーム RNA 遺伝子データベース プロジェクト: データ処理と Web ベースのツールの改善。 核酸研究所 41、D590–D596 (2013)。

論文 CAS PubMed Google Scholar

カマチョ、C.ら。 BLAST+: アーキテクチャとアプリケーション。 BMC バイオインフォマティクス 10、421 (2009)。

記事 PubMed PubMed Central Google Scholar

Anstett、J. et al. 酸素欠乏海水から増幅された細菌および古細菌の単細胞ゲノムの概要 Figshare https://doi.org/10.6084/m9.figshare.c.6137379.v5 (2022)。

O'Leary、NA et al. NCBI の参照配列 (RefSeq) データベース: 現在のステータス、分類学的拡張、および機能的注釈。 核酸研究所 44、D733–D745 (2016)。

論文 PubMed Google Scholar

エレン、AM 他。 Anvi'o: 「オミクス データ」の高度な分析および視覚化プラットフォーム。 ピアJ. 3、e1319 (2015)。

Chaumeil, P.-A.、Mussig, AJ、Hugenholtz, P. & Parks, DH GTDB-Tk v2: ゲノム分類データベースによる記憶に優しい分類。 バイオインフォマティクス 38、5315–5316 (2022)。

論文 CAS PubMed PubMed Central Google Scholar

Chaumeil, P.-A.、Mussig, AJ、Hugenholtz, P. & Parks, DH GTDB-Tk: ゲノム分類データベースを使用してゲノムを分類するためのツールキット。 バイオインフォマティクス 36、1925-1927 (2019)。

PubMed PubMed Central Google Scholar

Matsen、FA、Kodner、RB & Armbrust、EV 配置者: 固定参照ツリー上への配列の線形時間最尤法およびベイジアン系統学的配置。 BMC バイオインフォマティクス 11、538 (2010)。

記事 PubMed PubMed Central Google Scholar

Jain, C.、Rodriguez-R, LM、Phillippy, AM、Konstantinidis, KT & Aluru, S. 90K 原核生物ゲノムのハイスループット ANI 解析により、明確な種の境界が明らかになりました。 ナット。 共通。 9, 5114 (2018)。

論文 ADS PubMed PubMed Central Google Scholar

ハイアット、D. et al. Prodigal: 原核生物の遺伝子認識と翻訳開始部位の同定。 BMC バイオインフォマティクス 11、119 (2010)。

記事 PubMed PubMed Central Google Scholar

Price、MN、Dehal、PS および Arkin、AP FastTree 2 – 大規模なアライメントのほぼ最尤ツリー。 PLoS One 5、e9490 (2010)。

Eddy、SR 加速プロファイル HMM 検索。 PLoS コンピューティング。 バイオル。 7、e1002195 (2011)。

論文 ADS MathSciNet CAS PubMed PubMed Central Google Scholar

オンドフ、BD 他。 Mash: MinHash を使用した高速ゲノムおよびメタゲノム距離推定。 ゲノムバイオル。 17、132 (2016)。

記事 PubMed PubMed Central Google Scholar

パークス、DH et al. GTDB: 系統発生的に一貫性があり、ランクが正規化された完全なゲノムベースの分類法による、細菌および古細菌の多様性に関する継続的な国勢調査。 核酸研究所 50、D785–D794 (2022)。

論文 CAS PubMed Google Scholar

リンケ、C.ら。 ゲノム分類データベース用の標準化された古細菌分類。 Nat Microbiol 6、946–959 (2021)。

論文 CAS PubMed Google Scholar

パークス、DH et al. 細菌と古細菌の完全なドメインから種への分類。 ナット。 バイオテクノロジー。 38、1079–1086 (2020)。

論文 CAS PubMed Google Scholar

Bankevich、A. et al. SPAdes: 新しいゲノムアセンブリアルゴリズムとその単一細胞配列決定への応用。 J.Comput. バイオル。 19、455–477 (2012)。

論文 MathSciNet CAS PubMed PubMed Central Google Scholar

Parks, DH、Imelfort, M.、Skennerton, CT、Hugenholtz, P. & Tyson, GW CheckM: 分離株、単一細胞、およびメタゲノムから回収された微生物ゲノムの品質を評価します。 ゲノム研究所 25、1043–1055 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

Tennessen, K. et al. ProDeGe: ゲノムの完全自動除染のための計算プロトコル。 ISME J. 10、269–272 (2016)。

論文 CAS PubMed Google Scholar

Kim, D.、Song, L.、Breitwieser, FP & Salzberg, SL 遠心分離機: メタゲノム配列の迅速かつ高感度な分類。 ゲノム研究所 26、1721–1729 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

ホーリー、AK 他サーニッチ湾の水柱からのマルチオミック配列情報の概要。 科学。 データ 4、170160 (2017)。

論文 CAS PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Burrows-Wheeler 変換による高速かつ正確なショートリード アラインメント。 バイオインフォマティクス 25、1754–1760 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

リー、Hら。 配列アライメント/マップ形式と SAMtools。 バイオインフォマティクス 25、2078–2079 (2009)。

記事 PubMed PubMed Central Google Scholar

Seemann, T. barrnap 0.9: 細菌のリボソーム RNA 予測因子。 (Github)。

Chan、PP、Lin、BY、Mak、AJ、Lowe、TM tRNAscan-SE 2.0: トランスファー RNA 遺伝子の検出と機能分類が改善されました。 核酸研究所 49、9077–9096 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Li, W. & Godzik, A. Cd-hit: タンパク質またはヌクレオチド配列の大規模なセットをクラスタリングして比較するための高速プログラム。 バイオインフォマティクス 22、1658–1659 (2006)。

Huang, Y.、Niu, B.、Gao, Y.、Fu, L. & Li, W. CD-HIT Suite: 生物学的配列のクラスタリングと比較のための Web サーバー。 バイオインフォマティクス 26、680–682 (2010)。

Fu, L.、Niu, B.、Zhu, Z.、Wu, S. & Li, W. CD-HIT: 次世代シーケンス データのクラスタリングを高速化しました。 バイオインフォマティクス 28、3150–3152 (2012)。

論文 CAS PubMed PubMed Central Google Scholar

Webサイト。 オクサネン、J.ら。 ビーガン: コミュニティ エコロジー パッケージ R パッケージ バージョン 2.5 ~ 6。 https://CRAN.R-project.org/package=vegan (2019)。

Martinez-Garcia、M. et al. 活性な多糖類分解者の単一細胞ゲノムの捕捉: Verrucomicrobia の予期せぬ貢献。 PLoS One 7、e35314 (2012)。

論文 ADS CAS PubMed PubMed Central Google Scholar

ウロア、O.ら。 シアノバクテリアのプロクロロコッカスは、発散した集光アンテナを持ち、低酸素の海で進化した可能性があります。 手順国立アカド。 科学。 USA 118、e2025638118 (2021)。

ダウド、DFRら。 機能主導型の単一細胞ゲノミクスにより、希少な生物圏からセルロース分解細菌が明らかになります。 ISME J. 14、659–675 (2020)。

論文 CAS PubMed Google Scholar

ウォイク、T.ら。 単一細胞全ゲノム増幅用の MDA 試薬の除染。 PLoS One 6、e26161 (2011)。

論文 ADS CAS PubMed PubMed Central Google Scholar

ラボンテ、JM et al. 海洋表層細菌プランクトンにおけるウイルスと宿主の相互作用の単一細胞ゲノミクスに基づく分析。 ISME J. 9、2386–2399 (2015)。

Roux, S.、Hallam, SJ、Woyke, T. & Sullivan, MB 公的に入手可能な微生物ゲノムから解明されたウイルス暗黒物質とウイルス - 宿主相互作用。 eLife 4、e08490 (2015)。

マルティネス・ヘルナンデス、F. 他単細胞ゲノミクスにより、海洋に非常に豊富に存在する未培養の 37-F6 ウイルス集団の推定上の宿主としてペラギバクターが明らかになりました。 ISME J. 13、232–236 (2019)。

論文 CAS PubMed Google Scholar

Becraft、ED et al. ロクバクテリア: 未培養細菌門のゲノム巨人。 フロント。 微生物。 8、2264 (2017)。

記事 PubMed PubMed Central Google Scholar

ノブ、MK 他培養に依存しないゲノミクスから推定された候補門「アトリバクテリア」(OP9/JS1) の系統発生と生理学。 ISME J. 10、273–286 (2016)。

論文 CAS PubMed Google Scholar

Mende, DR、Aylward, FO、Eppley, JM、Nielsen, TN & DeLong, EF メタゲノムアセンブリと単細胞アセンブリの統合による環境ゲノムの改善。 フロント。 微生物。 7、143 (2016)。

記事 PubMed PubMed Central Google Scholar

Kokawa, M.、Hosokawa, M.、Nishikawa, Y.、Mori, K. & Takeyama, H. 単一細胞増幅ゲノムの洗浄と共アセンブリによる未培養微生物からの高品質ドラフトゲノムの取得。 科学。 議員第8号、2059年(2018年)。

論文 ADS PubMed PubMed Central Google Scholar

Konwar, KM、Hanson, NW、Page, AP & Hallam, SJ MetaPathways: 環境配列情報からパスウェイ/ゲノム データベースを構築するためのモジュール式パイプライン。 BMC バイオインフォマティクス 14、202 (2013)。

記事 PubMed PubMed Central Google Scholar

ハンソン、NW、コンワール、KM、ウー、S.-J. & Hallam、SJ MetaPathways v2.0: グリッドとクラウド上で環境パスウェイ/ゲノム データベースを構築するためのマスターワーカー モデル。 2014 IEEE 会議計算します。 インテル。 バイオインフ。 計算します。 バイオル。 (2014年)。

コンワール、KMら。 MetaPathways v2.5: 定量的な機能、分類、および使いやすさの改善。 バイオインフォマティクス 31、3345–3347 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

Karp, PD、Paley, S.、Romero, P. パスウェイ ツール ソフトウェア。 バイオインフォマティクス 18、S225–S232 (2002)。

Karp, PD、Latendresse, M.、Caspi, R. パスウェイ ツールのパスウェイ予測アルゴリズム。 立つ。 ジェノム。 科学。 5、424–429 (2011)。

Karp, PD EcoCyc データベースと MetaCyc データベース。 核酸研究所 28、56–59 (2000)。

Caspi, R. et al. 代謝経路と酵素の MetaCyc データベース - 2019 年の更新。 核酸研究所 48、D445–D453 (2020)。

論文 CAS PubMed Google Scholar

Basher、ARMA & Hallam、SJ 代謝経路予測のための異種ネットワーク埋め込みの活用。 バイオインフォマティクス 37、822–829 (2021)。

記事 CAS Google Scholar

Basher、ARMA、McLaughlin、RJ & Hallam、SJ 精度が向上した非負行列因数分解を使用した代謝経路予測。 J.Comput. バイオル。 28、1075–1103 (2021)。

Morgan-Lang, C. et al. TreeSAPP: ツリーベースの高感度で正確な系統発生プロファイラー。 バイオインフォマティクス 36、4706–4713 (2020)。

Bolger, AM、Lohse, M. & Usadel, B. Trimmomatic: Illumina シーケンス データ用の柔軟なトリマー。 バイオインフォマティクス 30、2114–2120 (2014)。

ガネーシュ、S. et al. アナモックス細菌による代替窒素基質の使用に関する単一細胞のゲノムおよびトランスクリプトームの証拠。 ISME J. 12、2706–2722 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

ガネーシュ、S. et al. 海洋酸素極小域における群集遺伝子転写と窒素代謝のサイズフラクション分配。 ISME J. 9、2682–2696 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

Tsementzi、D. et al. SAR11 細菌は海洋酸素欠乏症と窒素喪失に関連しています。 ネイチャー 536、179–183 (2016)。

論文 ADS CAS PubMed PubMed Central Google Scholar

デュレ、MT 他。 東部熱帯北太平洋酸素最小地帯における真核微生物群集のサイズ分別多様性。 FEMS 微生物。 エコル。 91 (2015)。

Padilla, CC et al. 海洋酸素最小ゾーンのNC10バクテリア。 ISME J. 10、2067–2071 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

ヘンリケス・カスティージョ、C. 他メタオミクスにより、海洋酸素極小域における炭素循環に対するアルテロモナス細菌の寄与が明らかになりました。 フロント。 3月科学。 9, 993667 (2022)。

Rii、YM 他南東太平洋の生物地球化学的に異なる地域における光合成ピコ核生物の多様性と生産性。 リムノール。 海洋学者。 61、806–824 (2016)。

記事 ADS Google Scholar

Boeuf, D. et al. メタパンゲノミクスは、遍在する海洋細菌 SAR324 系統の代謝能の深さに依存した変化を明らかにします。 マイクロバイオーム 9、172 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Landry, Z.、Swan, BK、Herndl, GJ、Stepanauskas, R. & Giovannoni, SJ 暗い海洋からの SAR202 ゲノムは、難分解性の溶解有機物の酸化経路を予測します。 MBio 8 (2017)。

Torres-Beltrán、M. 他サーニッチ湾の水柱からの地球化学情報の概要。 科学。 データ 4、170159 (2017)。

記事 PubMed PubMed Central Google Scholar

ガルシア、H.E. 他 World Ocean Atlas 2018: 溶存酸素、見かけの酸素利用率、および酸素飽和度。 NOAAアトラスNESDIS。 3、83(2019)。

リファレンスをダウンロードする

RV の船長、乗組員、科学者の方々、長年にわたるこの分野での並外れた努力に対し、ジョン・ストリックランド氏と CCGS のジョン・P・タリー氏、そして DOE 共同ゲノム研究所のミランダ・ハーモン・スミス氏とティジャナ・グラビナ・デル・リオ氏に感謝したいと思います。 JGI) プロジェクト管理サポート用。 また、ハラム研究室の多くの学部生の助っ人や、ジェイド・シラー氏やクリス・ペイン氏を含む遠洋技術サポートスタッフの長年にわたるサンプル収集と処理への支援にも感謝します。 ハワイ大学マノア校海洋学部およびCMOREのDeLong研究室、ジョージア工科大学生物科学部のStewart研究室、コンセプシオン海洋学部のUlloa研究室、Jürgens研究室のメンバーにも特に感謝します。このデータセットで使用される SAG の提供に対して、ライプニッツ バルト海研究所および Bigelow SCGC で功績を残しました。 この研究 (亜寒帯太平洋の群集ゲノム比較解析: 10.46936/10.25585/60007478、東部亜熱帯北太平洋における拡張酸素極小帯の微生物システム生態学: 10.46936/10.25585/60000795、微生物に関する単細胞ゲノムの窓を開く)拡大する海洋酸素最小ゾーンにおける生態型選択: 10.46936/10.25585/60000761、長く続けて深く進む: モデル外洋時系列研究サイト、ステーション ALOHA での包括的な外洋群集単一細胞ゲノム配列決定: 10.46936/10.25585/60000920、微生物および多様な低酸素ゾーンにわたる群集炭素循環のウイルス制御: 10.46936/10.25585/60000893、暗い海洋微生物単細胞ゲノミクス: 10.46936/10.25585/60000688、GEBA 単細胞非培養微生物: 10.46936/10.25585/60007913 、海洋生態系の参照ゲノムの生成研究: 遍在する未培養バクテリオプランクトンクレードの単細胞配列決定: 10.46936/10.25585/60007356、中深海バクテリオプランクトンの単細胞ゲノム配列決定: 10.46936/10.25585/60007269) 米国エネルギー省共同ゲノム研究所によって実施 (https ://ロル。 org/04xm1d337) は、DOE 科学局ユーザー施設であり、契約番号 DE-AC02-05CH11231 に基づいて運営されている米国エネルギー省科学局の支援を受けました。 この研究は、海洋研究科学委員会 (SCOR)、G. Unger Vetlesen 財団および Ambrose Monell 財団、カナダ自然科学工学研究評議会、Genome British Columbia、カナダイノベーション財団、およびSJH SCGC 分析および RS に与えられた助成金によるカナダ高等研究所は、NSF 助成金 1826734、1441717、821374、1335810、1232982、0826924 によって支援されました。 OU はチリ国立研究開発庁 (ANID) の助成金 ICN12_019 および 1161483 によって支援されました。

アルバロ・M・プロミンスキー

現在の住所: カリフォルニア大学サンディエゴ校、スクリップス海洋研究所、海洋生物学研究部門、ラホーヤ、カリフォルニア州、92037、米国

これらの著者は同様に貢献しました: Julia Anstett、Alvaro M. Plominsky。

ゲノム科学およびテクノロジー大学院プログラム、ゲノム科学センター、ブリティッシュ コロンビア大学、バンクーバー、ブリティッシュ コロンビア、カナダ

ジュリア・アンステット & スティーブン・J・ハラム

ブリティッシュコロンビア大学微生物・免疫学部、バンクーバー、ブリティッシュコロンビア州、V6T 1Z3、カナダ

ジュリア・アンステット、アルバロ・M・プロミンスキー、スティーブン・J・ハラム

ダニエル K. イノウエ微生物海洋学センター: 研究と教育、ハワイ大学、マノア、ホノルル、HI、96822、米国

エドワード・F・デロング

ブリティッシュコロンビア大学工学部、カナダ、ブリティッシュコロンビア州ケロウナ

アリス・キーサー

ライプニッツ・バルト海研究所、ヴァルネミュンデ、ドイツ

クラウス・ユルゲンス

バイオインフォマティクス大学院プログラム、ブリティッシュ コロンビア大学、バンクーバー、ブリティッシュコロンビア州、V6T 1Z4、カナダ

コナー・モーガン=ラング & スティーブン・J・ハラム

Bigelow 海洋科学研究所、イースト ブースベイ、メイン州、米国

ラムナス・ステパナスカス

ジョージア工科大学生物科学部、米国ジョージア州アトランタ

フランク・J・スチュワート

微生物動態および感染センター、ジョージア工科大学、米国ジョージア州アトランタ

フランク・J・スチュワート

モンタナ州立大学、微生物学および細胞生物学部、米国モンタナ州ボーズマン

フランク・J・スチュワート

海洋学部、コンセプシオン大学、Box 160-C、4070386、コンセプシオン、チリ

オスバルド・ウジョア

ミレニアム海洋研究所、ボックス 1313、4070386、コンセプシオン、チリ

オスバルド・ウジョア

エネルギー省共同ゲノム研究所、米国カリフォルニア州バークレー

タンジャ・ウォイク & レックス・マルムストロム

環境ゲノミクスとシステム生物学、ローレンス・バークレー国立研究所、米国カリフォルニア州バークレー

タンジャ・ウォイク & レックス・マルムストロム

ブリティッシュ コロンビア大学生命科学研究所、バンクーバー、BC、V6T 1Z3、カナダ

スティーブン・J・ハラム

ECOSCOPE トレーニング プログラム、ブリティッシュ コロンビア大学、ブリティッシュ コロンビア州バンクーバー、V6T 1Z3、カナダ

スティーブン・J・ハラム

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

JA、AMP、SJH がこの研究を発案しました。 EFDL、KJ、RS、FJS、OU、および SJH がサンプルを収集しました。 JA、AMP、AK、CML、RS、TW、SJH はデータを分析したり、データのグラフによる解釈を提供したりしました。 JA、AMP、AK、SJH がデータを編集し、原稿を書き、数値を生成しました。 すべての著者がテキストを読み、貢献しました。 SAG は Bigelow Single Cell Genomics Center (SCGC) で生成されました。 RS、TW、RM が FACS を提供しました。 細胞選別と DNA 増幅のために生成された反応速度プロット。 選別された細胞は、SCGC、DOE Joint Genome Institute (JGI)、カナダの Michael Smith Genome Sciences Centre、ジョージア工科大学、MIT の BioMicroCenter、オレゴン州立大学、および海洋生物学研究所で配列決定されました。 JA、CML、AMP は、イルミナのショートリードをトリミングしてコンティグに組み立て、SAG アセンブリを生成しました。 JA (他の共著者) はアセンブリを除染しました。 JA はアンプリコン配列をクラスター化しました。 JA と AMP はデータを収集し、この研究に示す数値を作成しました。

スティーブン・J・ハラム氏への通信。

SJH は、クラウドでスケーラブルなアルゴリズムおよびデータ分析ソリューションを設計および提供するバイオインフォマティクス コンサルティング会社 Koonkie Inc. の共同創設者です。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Anstett、J.、Plominsky、AM、DeLong、EF 他。 酸素欠乏の海水で増幅された細菌および古細菌の単細胞ゲノムの概要。 Sci Data 10、332 (2023)。 https://doi.org/10.1038/s41597-023-02222-y

引用をダウンロード

受信日: 2022 年 8 月 26 日

受理日: 2023 年 5 月 10 日

公開日: 2023 年 5 月 27 日

DOI: https://doi.org/10.1038/s41597-023-02222-y

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供