Skip to main content

Геномика по одной клетке

Большинство бактерий в природе не может быть клонировано в лабораторных условиях, и поэтому их ДНК нельзя секвенировать, используя только существующие технологии секвенирования «следующего поколения» (NGS). Невозможность клонирования — основное ограничение, с которым сталкиваются в различных исследованиях, от проекта «человеческий микробиом» (Human Microbiome Project) [3, 6] до исследований по обнаружению новых антибиотиков [9]. 

«Человеческий микробиом» и обнаружение антибиотиков — лишь два примера из множества задач, на которые одноклеточная геномика может повлиять революционно. Последние продвижения в экспериментальной [4, 7, 8, 10] и вычислительной [1] её составляющих открыли возможность исследовать геномы отдельных бактерий. В частности, в [1] продемонстировано, что таким способом можно обнаружить достаточное число генов для того, чтобы понять, как проходят метаболические процессы в бактерии. Для многих проектов возможность узнать большую часть генов — результат, сопоставимый по значению с доступностью целого генома.

В настоящее время для аплификации ДНК в одноклеточной геномике используется метод множественного замещения полинуклеотидных цепей (MDA)Особенностями метода являются значительная неравномерность покрытия генома ридами, присутствие химерических ридов, а также ридов, связанных парной информацией. В исследовании [12] отмечено, что задачи, стоящие перед одноклеточной геномикой, являются скорее вычислительными, чем экспериментальными. Недавняя статья [5] показала, что существующие сборщики не дают удовлетровительного результата даже в сборке единственной синтетазы нерибособных пептидов, не говоря о целом геноме.

Читсаз и др. в 2011 г. [1] представили программу по сборке геномов E+V-SC, сочетающую части ассемблера EULER-SR и модифицированные модули программы Velvet. Получившийся сборщик показал существенное улучшение результата в восстановлении ДНК по одной клетке. Тем не менее, авторы ассемблера осознавали, что для полноценного использования данных нельзя просто модифицировать существующие инструменты — небоходимо изменить алгоритмический подход в целом.

Мы представляем SPAdes («Спейдз»), cборщик геномов, предназначенный для работы с данными как из одной клетки, так и из множества клонированных бактерий. В ассемблере применяется множество новых алгоритмических идей и улучшений по сравнению с существующими программами для сборки геномов.

Статьи (все на англ.):

  1. H. Chitsaz, J.L. Yee-Greenbaum, G. Tesler, M.J. Lombardo, C.L. Dupont, J.H. Badger, M. Novotny, D.B. Rusch, L.J. Fraser, N.A. Gormley, O. Schulz-Trieglaff, G.P. Smith, D.J. Evers, P.A. Pevzner, and R.S. Lasken. Efficient de novo assembly of single-cell bacterial genomes from short-read data sets. Nat Biotechnol, 29(10):915–921, 2011.
  2. F.B. Dean, J.R. Nelson, T.L. Giesler, and R.S. Lasken. Rapid amplification of plasmid and phage DNA using phi 29 DNA polymerase and multiply-primed rolling circle amplification. Genome Res, 11(6):1095–1099, Jun 2001.
  3. S.R. Gill, M. Pop, R.T. Deboy, P.B. Eckburg, P.J. Turnbaugh, B.S. Samuel, J.I. Gordon, D.A. Relman, C.M. Fraser-Liggett, and K.E. Nelson. Metagenomic analysis of the human distal gut microbiome. Science, 312(5778):1355–1359, Jun 2006.
  4. J.P. Glotzbach, M. Januszyk, I.N. Vial, V.W. Wong, A. Gelbard, T. Kalisky, H. Thangarajah, M.T. Longaker, S.R. Quake, G. Chu, and G.C. Gurtner. An information theoretic, microfluidic-based single cell analysis permits identification of subpopulations among putatively homogeneous stem cells. PLoS One, 6(6):e21211, 2011.
  5. R.V. Grindberg, T. Ishoey, D. Brinza, E. Esquenazi, R.C. Coates, W.T. Liu, L. Gerwick, P.C. Dorrestein, P. Pevzner, R. Lasken, and W.H. Gerwick. Single cell genome amplification accelerates identification of the apratoxin biosynthetic pathway from a complex microbial assemblage. PLoS One, 6(4):e18565, 2011.
  6. M. Hamadyand, R. Knight. Microbial community profiling for human microbiome projects: Tools, techniques, and challenges. Genome Res, 19(7):1141–1152, Jul 2009.
  7. T. Ishoey, T. Woyke, R. Stepanauskas, M. Novotny, and R.S. Lasken. Genomic sequencing of single microbial cells from environmental samples. Current Opinion in Microbiology, 11(3):198–204, Jun 2008.
  8. S. Islam, U. Kjallquist, A. Moliner, P. Zajac, J.B. Fan, P. Lonnerberg, and S. Linnarsson. Characterization of the single-cell transcriptional landscape by highly multiplex RNA-seq. Genome Res, 21(7):1160–1167, Jul 2011.
  9. J.W. Li and J.C. Vederas. Drug discovery and natural products: end of an era or an endless frontier? Science, 325(5937):161– 165, Jul 2009.
  10. N. Navin, J. Kendall, J. Troge, P. Andrews, L. Rodgers, J. McIndoo, K. Cook, A. Stepansky, D. Levy, D. Esposito, L. Muthuswamy, A. Krasnitz, W.R. McCombie, J. Hicks, and M. Wigler. Tumour evolution inferred by single-cell sequencing. Nature, 472(7341):90–94, Apr 2011.
  11. C. Rausch, T. Weber, O. Kohlbacher, W. Wohlleben, and D.H. Huson. Specificity prediction of adenylation domains in nonribosomal peptide synthetases (NRPS) using transductive support vector machines (TSVMs). Nucleic Acids Res, 33(18):5799– 5808, 2005.
  12. S. Rodrigue, R.R. Malmstrom, A.M. Berlin, B.W. Birren, M.R. Henn, and S.W. Chisholm. Whole genome amplification and de novo assembly of single bacterial cells. PLoS One, 4(9):e6864, 2009.
  13. S.A. Sieber and M.A. Marahiel. Molecular mechanisms underlying nonribosomal peptide synthesis: approaches to new antibiotics. Chem Rev, 105(2):715–738, Feb 2005.