Большинство бактерий в природе не может быть клонировано в лабораторных условиях, и поэтому их ДНК нельзя секвенировать, используя только существующие технологии секвенирования «следующего поколения» (NGS). Невозможность клонирования — основное ограничение, с которым сталкиваются в различных исследованиях, от проекта «человеческий микробиом» (Human Microbiome Project) [3, 6] до исследований по обнаружению новых антибиотиков [9].
«Человеческий микробиом» и обнаружение антибиотиков — лишь два примера из множества задач, на которые одноклеточная геномика может повлиять революционно. Последние продвижения в экспериментальной [4, 7, 8, 10] и вычислительной [1] её составляющих открыли возможность исследовать геномы отдельных бактерий. В частности, в [1] продемонстировано, что таким способом можно обнаружить достаточное число генов для того, чтобы понять, как проходят метаболические процессы в бактерии. Для многих проектов возможность узнать большую часть генов — результат, сопоставимый по значению с доступностью целого генома.
В настоящее время для аплификации ДНК в одноклеточной геномике используется метод множественного замещения полинуклеотидных цепей (MDA). Особенностями метода являются значительная неравномерность покрытия генома ридами, присутствие химерических ридов, а также ридов, связанных парной информацией. В исследовании [12] отмечено, что задачи, стоящие перед одноклеточной геномикой, являются скорее вычислительными, чем экспериментальными. Недавняя статья [5] показала, что существующие сборщики не дают удовлетровительного результата даже в сборке единственной синтетазы нерибособных пептидов, не говоря о целом геноме.
Читсаз и др. в 2011 г. [1] представили программу по сборке геномов E+V-SC, сочетающую части ассемблера EULER-SR и модифицированные модули программы Velvet. Получившийся сборщик показал существенное улучшение результата в восстановлении ДНК по одной клетке. Тем не менее, авторы ассемблера осознавали, что для полноценного использования данных нельзя просто модифицировать существующие инструменты — небоходимо изменить алгоритмический подход в целом.
Мы представляем SPAdes («Спейдз»), cборщик геномов, предназначенный для работы с данными как из одной клетки, так и из множества клонированных бактерий. В ассемблере применяется множество новых алгоритмических идей и улучшений по сравнению с существующими программами для сборки геномов.
Статьи (все на англ.):
- H. Chitsaz, J.L. Yee-Greenbaum, G. Tesler, M.J. Lombardo, C.L. Dupont, J.H. Badger, M. Novotny, D.B. Rusch, L.J. Fraser, N.A. Gormley, O. Schulz-Trieglaff, G.P. Smith, D.J. Evers, P.A. Pevzner, and R.S. Lasken. Efficient de novo assembly of single-cell bacterial genomes from short-read data sets. Nat Biotechnol, 29(10):915–921, 2011.
- F.B. Dean, J.R. Nelson, T.L. Giesler, and R.S. Lasken. Rapid amplification of plasmid and phage DNA using phi 29 DNA polymerase and multiply-primed rolling circle amplification. Genome Res, 11(6):1095–1099, Jun 2001.
- S.R. Gill, M. Pop, R.T. Deboy, P.B. Eckburg, P.J. Turnbaugh, B.S. Samuel, J.I. Gordon, D.A. Relman, C.M. Fraser-Liggett, and K.E. Nelson. Metagenomic analysis of the human distal gut microbiome. Science, 312(5778):1355–1359, Jun 2006.
- J.P. Glotzbach, M. Januszyk, I.N. Vial, V.W. Wong, A. Gelbard, T. Kalisky, H. Thangarajah, M.T. Longaker, S.R. Quake, G. Chu, and G.C. Gurtner. An information theoretic, microfluidic-based single cell analysis permits identification of subpopulations among putatively homogeneous stem cells. PLoS One, 6(6):e21211, 2011.
- R.V. Grindberg, T. Ishoey, D. Brinza, E. Esquenazi, R.C. Coates, W.T. Liu, L. Gerwick, P.C. Dorrestein, P. Pevzner, R. Lasken, and W.H. Gerwick. Single cell genome amplification accelerates identification of the apratoxin biosynthetic pathway from a complex microbial assemblage. PLoS One, 6(4):e18565, 2011.
- M. Hamadyand, R. Knight. Microbial community profiling for human microbiome projects: Tools, techniques, and challenges. Genome Res, 19(7):1141–1152, Jul 2009.
- T. Ishoey, T. Woyke, R. Stepanauskas, M. Novotny, and R.S. Lasken. Genomic sequencing of single microbial cells from environmental samples. Current Opinion in Microbiology, 11(3):198–204, Jun 2008.
- S. Islam, U. Kjallquist, A. Moliner, P. Zajac, J.B. Fan, P. Lonnerberg, and S. Linnarsson. Characterization of the single-cell transcriptional landscape by highly multiplex RNA-seq. Genome Res, 21(7):1160–1167, Jul 2011.
- J.W. Li and J.C. Vederas. Drug discovery and natural products: end of an era or an endless frontier? Science, 325(5937):161– 165, Jul 2009.
- N. Navin, J. Kendall, J. Troge, P. Andrews, L. Rodgers, J. McIndoo, K. Cook, A. Stepansky, D. Levy, D. Esposito, L. Muthuswamy, A. Krasnitz, W.R. McCombie, J. Hicks, and M. Wigler. Tumour evolution inferred by single-cell sequencing. Nature, 472(7341):90–94, Apr 2011.
- C. Rausch, T. Weber, O. Kohlbacher, W. Wohlleben, and D.H. Huson. Specificity prediction of adenylation domains in nonribosomal peptide synthetases (NRPS) using transductive support vector machines (TSVMs). Nucleic Acids Res, 33(18):5799– 5808, 2005.
- S. Rodrigue, R.R. Malmstrom, A.M. Berlin, B.W. Birren, M.R. Henn, and S.W. Chisholm. Whole genome amplification and de novo assembly of single bacterial cells. PLoS One, 4(9):e6864, 2009.
- S.A. Sieber and M.A. Marahiel. Molecular mechanisms underlying nonribosomal peptide synthesis: approaches to new antibiotics. Chem Rev, 105(2):715–738, Feb 2005.