Разрешение повторов с помощью прямоугольных графов
Хотя некоторая реализация подхода уже включена в поставку ассемблера SPAdes, мы, помимо этого, выпускаем алгоритм отдельным модулем, чтобы его можно было запускать независимо от нашего ассемблерa. Этот модуль немного отличается от текущей реализации подхода, используемой в ассемблере, но в будущем мы полностью интегрируем его в SPAdes.
Модуль можно запустить с другими геномными сборщиками при условии, что они поддерживают формат файлов для хранения графов, который используется в ассемблере SPAdes.
Подробности читайте в статье Николая Вяххи, Шона Фама и Павла Певзнера From de Bruijn Graphs to Rectangle Graphs for Genome Assembly (Lecture Notes in Bioinformatics 7534 (2012), pp. 249-261.)
По вопросам обращайтесь к Николаю Вяххи.
Системные требования: Питон версии 2.7 (работу на 2.5 и 2.6 не гарантируем, но скорее всего сработает)
Использование:
- Запустите SPAdes в отладочном режиме (spades.py --debug) — это сгенерирует дополнительную директорию с необходимыми данными
- Запустите модуль разрешения повторов по графу прямоугольников: python rrr.py -s project_name/saves [options] [-o out_dir=out]
- Контиги и логи будут в директории out_dir
Все опции скрипта rrr.py: