SpECtоR — SEquence Cоverage Roughness

О проекте

Сохранение целостности генома - залог нормального функционирования организма и передачи наследственных признаков в ряду поколений. Некоторые участки генома менее стабильны и более подвержены повреждениям, что, возможно, связано с эволюционной избирательностью механизмов поддержания целостности генома. Накопление нарушений и повреждений в геноме является характерным признаком различных болезней, таких, как нейропсихиатрические расстройства и рак.

Цель

Важным шагом на пути к пониманию работы механизмов, обеспечивающих поддержание стабильности генома, является создание методов количественной оценки его целостности. Метрики, характеризующие стабильность, помогут понять то, как связаны геномная архитектура, механизмы поддержания целостности генома и фенотипические признаки. Например, при изучении онкологических трансформаций, они смогут обрисовать сложные геномные перестройки и процессы, негативно влияющие на генетический (геномный) гомеостаз.

Получение интегральных характеристик сложных фенотипических признаков, связанных со стабильностью генома, послужит стимулом для разработки клинических биомаркеров, которые могут быть использованы для выбора новых стратегий лечения.

Инструменты

Текст с описанием. В результате исследований были получены следующие значимые результаты

Способы поиска разладок в сигналах типа time series Репозиторий

Результаты

За три года работы над проектом были достигнуты следующие важные результаты:

Разработаны количественные показатели, позволяющие оценить степень локальной и глобальной целостности генома на основе данных полногеномного секвенирования. Локальный показатель одинаково чувствителен как к протяженным аберрациям, так и к локальным возмущениям сигнала покрытия, что позволяет создать на его основе глобальную метрику. Релевантность данного показателя по отношению к процессам поддержания целостности генома была продемонстрирована в серии экспериментов по системной генетике, что даёт возможность использовать его в качестве нового молекулярного фенотипа, ассоциированного с целостностью генома.

Вычислительные эксперименты показали применимость разработанных показателей к широкому спектру организмов от человека до низших растений. Были разработаны практические рекомендации для использования показателей в лабораторной практике и геномных исследованиях. Значение локального показателя аберрантности, соответствующее различению стабильных и аберрантных регионов соответствует 10. Применяя разработанную методику к данным проектов HGDP и «Российские геномы», мы получили эмпирическое значение глобальной метрики, которое соответствует высокому качеству секвенирования, достижимого в рутинной лабораторной практике. Полученное значение составляет: 0.43(+/-)0.11.

В процессе работы над проектом были созданы несколько пакетов программ, позволяющих детально исследовать сигнал покрытия секвенирования и эффективно выполнять различные операции над геномными интервалами. Также, была построена математическая модель, позволяющая обнаруживать разладки (т.е. аберрации) в сигналах.

Таким образом в научную практику был введен новый тип данных, который, как ожидается будет способствовать выявлению взаимоотношений между архитектурой генома, механизмами поддержания его целостности и фенотипическими признаками.

Рекомендации

Значение локального показателя аберрантности, соответствующее различению стабильных и аберрантных регионов соответствует 10. Применяя разработанную методику к данным проектов HGDP и «Российские геномы», мы получили эмпирическое значение глобальной метрики, которое соответствует высокому качеству секвенирования, достижимого в рутинной лабораторной практике. Полученное значение составляет: 0.43(+/-)0.11.

Публикации

2020

SINE and LINE-1 competition for energy resources determines cell fate

Duk, M., Chertkova, A., Gursky, V., Samsonova, M., Kanapin, A. & Samsonova, A., 2020, BIOINFORMATICS OF GENOME REGULATION AND STRUCTURE/SYSTEMS BIOLOGY (BGRS/SB-2020): The Twelfth International Multiconference Abstracts. Институт цитологии и генетики СО РАН, стр. 148-149

On region based inference in genome wide association study

Malov, S. V., Antonik, A. & Shevchenko, A. K., 2020, Bioinformatics of Genome Regulation and Structure/Systems Biology (BGRS/SB-2020): The Twelfth International Multiconference (06–10 July 2020, Novosibirsk, Russia); Abstracts. Novosibirsk: Институт цитологии и генетики СО РАН, стр. 177-178 2 стр.

2021

A Genomic Blueprint of Flax Fungal Parasite Fusarium oxysporum f. sp. lini.

Samsonova A, Kanapin A, Bankin M, Logachev A, Gretsova M, Rozhmina T, Samsonova M. Int J Mol Sci. 2021 Mar 6;22(5):2665. doi: 10.3390/ijms22052665.

Detection of temporary disorders

Baron M and Malov S, 10th World Congress on Probability and Statistics, July 19-23, 2021, Seoul, Korea

Change-Point Models in Quality Control Applications

Baron M and Malov S, JSM 2021, Virtual Conference, August 8-12, 2021, USA

On Selective Imputation Using Beagle v.5.

Tamazian G., Kanapin A., Samsonova A., Malov S.V. Proceedings of 10th Moscow Conference on Computational Molecular Biology MCCMB'21, ISBN 978-5-901158-32-6

Detection and Eestimation of Multiple Transient Changes

Baron M and Malov S, arXiv: math.PR/0000000

2022 – 2023

Detection and Estimation of Multiple Transient Changes Journal of Applied Statistics

Baron M., Malov S.V

Анализ покрытия alu-повторов выровненными геномными прочтениями

Тамазян Г.С., Канапин А.А., Самсонова А.А. (Биофизика 2023)

Генетические детерминанты целостности генома льна

Канапин А.А, Самсонова А.А. (Биофизика 2023)

Инструменты визуализации сигнала покрытия секвенирования

Бездворных И.В.,Черкасов Н.А., Канапин А.А., Самсонова А.А., (Биофизика 2023)

Поиск аномалий сигнала покрытия секвенирования, ассоциированных со структурными вариациями генома

Бездворных И.В., Черкасов Н.А., Канапин А.А., Самсонова А.А. (Биофизика 2023)

Полногеномный анализ ассоциаций вариаций копийности в контексте стабильности генома

Дук M.A., Канапин A.A., Рожмина T.A., Самсонова A.A. (Биофизика 2023)

"Pygenomics: Python package for processing genomic intervals and bioinformatic data formats". in BIOINFORMATICS OF GENOME REGULATION AND STRUCTURE/SySTEMS BIOLOGy (BGRS/SB2022).

Tamazian G., Cherkasov N., Kanapin A., Samsonova A. The Thirteenth International Multiconference 4-8 July, 2022., pp. 1121-1122, DOI 10.18699/SBB-2022-672 — стендовый доклад

"Swaveform: a genome-wide survey of structural variation profiles." in BIOINFORMATICS OF GENOME REGULATION AND STRUCTURE/SySTEMS BIOLOGy (BGRS/SB-2022).

Bezdvornykh I., Kanapin A., Samsonova A. The Thirteenth International Multiconference 4-8 July, 2022., pp. 762-763, DOI 10.18699/SBB-2022-439 — устное выступление

Detection of Transient Changes

Michael Baron and Sergey Malov. IMS Annual Meeting in Probability and Statistics, London, 27-30 June, 2022 — устное выступление

Команда

Анастасия Самсонова, Александр Канапин, Гайк Тамазян, Сергей Малов, Игорь Бездворных, Николай Черкасов, Ольга Шахова