自身免疫性疾病(Autoimmune Diseases, ADs)是一类复杂且异质性的疾病,其特点是免疫系统错误地攻击自身组织,导致多个器官的损伤和功能障碍。尽管近十年来,组学(omics)研究为揭示这些疾病的分子机制提供了重要见解,但不同队列和病理的数据通常独立存储在公共数据库中,缺乏统一的资源来辅助研究人员进行综合分析。为了解决这一问题,ADEX(Autoimmune Diseases Explorer)网站应运而生。
ADEX是一个综合性的数据库,专注于自身免疫性疾病的组学数据分析。该网站集成了82项经过精心策划的转录组和甲基化研究,涵盖了5609个样本,涉及系统性红斑狼疮(SLE)、类风湿性关节炎(RA)、干燥综合征(SjS)、系统性硬化症(SSc)和1型糖尿病(T1D)等常见自身免疫性疾病。ADEX提供易于使用的环境,集成了高级数据分析和统计方法,以便研究人员探索组学数据集,包括元分析、差异表达分析和通路分析等。

ADEX团队从GEO(Gene Expression Omnibus)等公共数据库中收集了相关数据,并进行了严格的数据筛选和处理。他们使用了统一的分析流程,对RNA-Seq、Affymetrix和Illumina基因表达微阵列以及Illumina甲基化阵列等平台的数据进行了规范化处理,确保了数据的同质性和可比性。
ADEX网站采用RStudio Shiny包设计,用户界面直观易用。网站分为六个主要部分:
ADEX不仅提供基本的查询和分析功能,还集成了更高级的分析工具,如HiPathia软件用于信号传导网络分析,以及CARNIVAL软件用于因果网络推断。这些工具帮助研究人员更深入地理解自身免疫性疾病的分子机制。
通过使用ADEX,研究人员可以轻松地探索IFN(干扰素)特征在不同疾病中的表达情况。例如,研究发现IFN特征在SLE和SjS患者中显著过表达,而在RA患者中表现出异质性。这一发现支持了IFN在自身免疫性疾病中的重要作用,并为未来的治疗策略提供了线索。
通过整合多个数据集,ADEX能够定义每个疾病的常见生物标志物。例如,在SLE中发现了1703个一致失调的基因,这些基因可能成为潜在的诊断和治疗靶点。
在ADEX数据库中通过Gene Query模块分析单个基因在特定疾病与健康人之间基因表达情况,步骤:左侧选择【Analysis】模块选择Expression , 【Dataset】选择SLE中的T细胞数据集GSE10325,【Gene】模块输入需要分析的基因IFI44L,右侧即可出现健康对照与SLE之间IFI44L的表达箱线图及 统计差异结果。

在ADEX数据库中通过Gene Query模块分析单个基因在特定疾病数据集的甲基化水平与健康对照差异。步骤:左侧选择【Analysis】模块选择Methylation , 【Dataset】选择SLE中的T细胞数据集GSE59250,【Gene】模块输入需要分析的基因IFI44L,右侧【Region selection】有三个选择项,通常选择Promoter 启动子区域(或者自行选择区域)。即可出现健康对照与SLE之间IFI44L在启动子区域不同CpG岛甲基化水平情况,图片可另存为png格式。

【数据的异质性】 值得注意的是,SLE 另外一个数据集显示IFI44L位点在SLE患者中呈现高甲基化水平,因此说明不同数据来源质量层次不齐,需要自身掌握专业知识来判断。

在ADEX数据库中通过Gene Query模块分析单个基因甲基化水平与基因表达相关性分析。步骤:左侧选择【Analysis】模块选择Expression &Methylation , 【Dataset】选择SLE中GSE82221(目前只有两个相关数据集可选),【Gene】模块输入需要分析的基因IFI44L,上侧【Region selection】有三个选择项,通常选择Promoter 启动子区域(或者自行选择区域),右侧【Correlation method】有三种相关性分析方法,默认 Pearson。如图IFI44L基因表达与IFI44L启动子区域CpG岛甲基化水平相关性,图片可另存为png格式。

在ADEX数据库中通过Gene Query模块分析单个基因与其他基因共表达相关性分析。步骤:左侧选择【Analysis】模块选择Expression correlation , 【Dataset】选择SLE中GSE10325 T 细胞数据集,【Gene】模块输入需要分析的基因,【Condition】选择healthy 或者SLE。如图展示了IFI44L基因与其他基因共表达相关性热图。

在ADEX数据库中通过【Gene set Query】模块分析单个基因与其他基因共表达相关性分析。 步骤:1. Select datasets;选择数据集,可通过左侧【Automatic selection 】模块选择ALL SLE , 这是所有SLE数据集被选择,如图可知,数据集信息包括GSE号,疾病类型、样本数,组织、细胞类型。可通过点击数据集进行添加与取消,这样可以选择目的数据集类型。

步骤2:Select genes :既可以自行输入需要检索的基因,又可以输入预定义的基因模块。该基因模块是根据SLE外周血基因芯片数据定义的转录基因模块。如果选择的DC.M1.2 Interferon 是24个干扰素相关基因,包括IFI44L在内。

步骤3:Heatmap:热图展示,当选择目的数据集与基因后,自动生成热图。左侧有【Show covariates】可添加数据集的信息,如疾病、组织、细胞类型信息,【Clustering】可对Genes与Datasets进行行与列双向聚类展示。【FDR filter】过滤数据集,通常默认None.其他是热图颜色范围设置。热图通过Download plot 可下载为PDF图片,Download table可下载热图矩阵数据表格。

在【Analyze Dateset】模块下可以进行单个数据集的差异基因分析与通路分析。【Analysis】模块下选择分析的项目,【Dataset】模块下选择需要分析的数据集。右侧可对结果数据进行筛选过滤、下载数据结果表格或图片。

在【Meta Analysis】模块下可以进行不同疾病或相同疾病的多个数据集进行分析,挖掘特征基因。步骤1【Select Dataset】模块下选择数据集,步骤2【Run Meta -Analysis】进行分析。步骤3.【Results】展示热图结果,可选择展示的基因数量,下载热图表格与结果。


后记:这是5星推荐的优秀数据库网站,无需登录注册,功能齐全,可视化图可以直接用于发表,是风湿免疫方向研究者收藏网站。