InterTransViewer: a comparative description of differential gene expression profiles from different experiments

Vavilovskii Zhurnal Genet Selektsii. 2023 Dec;27(8):1042-1052. doi: 10.18699/VJGB-23-119.

Abstract

Meta-analysis of transcriptomic data from different experiments has become increasingly prevalent due to a significantly increasing number of genome-wide experiments investigating gene expression changes under various conditions. Such data integration provides greater accuracy in identifying candidate genes and allows testing new hypotheses, which could not be validated in individual studies. To increase the relevance of experiment integration, it is necessary to optimize the selection of experiments. In this paper, we propose a set of quantitative indicators for a comprehensive comparative description of transcriptomic data. These indicators can be easily visualized and interpreted. They include the number of differentially expressed genes (DEGs), the proportion of experiment-specific (unique) DEGs in each data set, the pairwise similarity of experiments in DEG composition and the homogeneity of DEG profiles. For automatic calculation and visualization of these indicators, we have developed the program InterTransViewer. We have used InterTransViewer to comparatively describe 23 auxin- and 16 ethylene- or 1-aminocyclopropane-1-carboxylic acid (ACC)-induced transcriptomes in Arabidopsis thaliana L. We have demonstrated that analysis of the characteristics of individual DEG profiles and their pairwise comparisons based on DEG composition allow the user to rank experiments in the context of each other, assess the tendency towards their integration or segregation, and generate hypotheses about the influence of non-target factors on the transcriptional response. As a result, InterTransViewer identifies potentially homogeneous groups of experiments. Subsequent estimation of the profile homogeneity within these groups using resampling and setting a significance threshold helps to decide whether these data are appropriate for meta-analysis. Overall, InterTransViewer makes it possible to efficiently select experiments for meta-analysis depending on its task and methods.

В настоящее время в связи со стремительным ростом количества полногеномных экспериментов по изучению изменения экспрессии генов в различных условиях все более широкое распространение получают методы метаанализа транскриптомных данных из разных экспериментов, так как интеграция данных может обеспечить большую точность в выявлении генов-кандидатов и позволяет тестировать новые гипотезы, которые невозможно было проверить в отдельных исследованиях. Для повышения информативности такой интеграции необходимо оптимизировать подбор экспериментов. В настоящей работе мы предлагаем набор количественных показателей для всестороннего сравнительного описания транскриптомных данных. Эти показатели легко могут быть визуализированы и интерпретированы. Они включают в себя количество дифференциально экспрессирующихся генов (ДЭГ), долю специфических (уникальных) ДЭГ в каждом наборе данных, попарное сходство экспериментов по составу ДЭГ, оценку однородности профилей дифференциально экспрессирующихся генов. Для автоматического вычисления и визуализации этих показателей мы разработали программу InterTransViewer. Мы применили InterTransViewer для сравнительного описания транскрипционных ответов на обработку фитогормонами у модельного растения Arabidopsis thaliana L., взяв в анализ 23 единообразно обработанных профиля дифференциальной экспрессии генов в ответ на ауксин и 16 профилей дифференциальной экспрессии, индуцированных этиленом или его предшественником – 1-аминоциклопропановой кислотой. Мы продемонстрировали, что комплексное рассмотрение характеристик отдельных профилей ДЭГ в контексте результатов попарных сравнений профилей по составу ДЭГ позволяет позиционировать эксперименты в контексте друг друга, оценивать тенденцию к их интеграции или сегрегации, генерировать гипотезы о влиянии весомых нецелевых факторов на исследуемый транскрипционный ответ. В результате это дает возможность выделять потенциально однородные группы экспериментов. Последующий анализ однородности этих групп профилей с помощью процедуры ресемплинга и установления порога уровня значимости помогает принять решение о целесообразности использования этих данных для метаанализа. В целом InterTransViewer позволяет эффективно формировать выборки экспериментов в зависимости от задачи и методов метаанализа. об.

Keywords: Arabidopsis thaliana L.; auxin; data integration; ethylene; transcriptome.