首页 > 范文大全 > 正文

基于网络的流感病毒复制的研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于网络的流感病毒复制的研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:流感病毒是一种重要的呼吸道疾病病原,容易在人群中造成地方流行,给人类带来灾难和危害。利用A型流感病毒的四种毒株H3N2、H5N1、H7N7和H7N9的基因表达谱数据集,运用偏最小二乘法,分别构建了四个流感病毒感染复制的调控网络,挖掘了四个数据集下在病毒复制过程中发挥重要功能的基因,为进一步探索流感病毒在宿主细胞内的复制机制,揭示流感病毒的致病机理提供了可能。

关键词:偏最小二乘法 病毒复制 复杂网络

中图分类号:TP393 文献标识码:A 文章编号:1672-3791(2017)01(a)-0000-00

基金目:湖北省教育厅科学技术研究计划青年人才项目(Q20151505);武汉工程大学第十期大学生校长基金项目(2015008)

1 引言

人类约60-70%的传染性疾病是由病毒感染所引起。近年来,重大病毒传染性疾病的爆发流行日趋严重,对人类健康和社会经济发展构成了巨大威胁。而这些病毒必须依靠宿主细胞才能不断的复制下去,基于网络的系统生物学方法,揭示病毒复制及与宿主相互作用网络的分子机制,发现抗病毒药物新靶标,为病毒性传染病预防和治疗提供新理论和新技术,是当前生命科学研究的前沿领域之一[1]。

2 多层网络的构造

2.1数据来源

在美国国家生物信息中心已经公开的数据库中,GEO号为GSE49840的数据库中包含了四组基因表达谱数据。这四组数据分别是被新型禽源流感病毒H7N9,禽流感病毒H5N1和H7N7,以及H3N2流感病毒数据。该实验数据通过四种不同的病毒去感染样本,并且分别测量了病毒感染后宿主在3小时、7小时、12小时和24小时的基因表达谱数据。

2.2 数据预处理

对于每一组基因表达谱数据,我们根据探针信息的注释文件,将探针号与基因ID号对应起来,如果没有对应的基因ID号,我们将舍弃该探针,如果有几个探针对应的是同一个基因的ID号,我们将这几个探针的平均值作为该基因的表达谱数据。

2.3 基因的选取

自2008年以来共有六个科研小组发现了参与流感病毒复制的人体宿主细胞因子,在这些宿主因子中有128个宿主基因至少被两个实验证明参与了流感病毒复制[2]。我们发现这128个基因中有116个基因在GSE49840数据库中有基因表达谱数据值,所以我们以这116个基因作为我们研究工作的候选基因。

2.4 多层网络的构建

一共有四组基因表达谱数据,所以我们构建了一个四层的多层网络,每一层是一种流感病毒的复制调控网络,用一个线性方程来近似基因间的调控关系,用偏最小二乘法求解线性模型中的调控参数,并进一步利用阈值筛选有显著意义的调控关系,具体的步骤如下:

(1)计算成对基因之间的皮尔逊相关系数,设定阈值,得到一个流感病毒复制调控的初始网络;

(2)为了简化,用一个线性方程来描述病毒复制有关的基因之间的调控关系:

其中 表示第 个基因的表达水平, 表示第 个基因对第 个基因的作用强度。

(3)在Matlab中调用spline函数,根据基因在3小时、7小时、12小时、24小时的表达值,利用三次样条插值每隔0.5小时进行插值,然后用中心差分值代替微分值,得到基因在3小时、7小时、12小时、24小时这四个时刻的表达值变化率:

(f)选取合适的阈值 ,删除相互作用强度较小的边,从而得到每种病毒感染下的基因调控网络。阈值 的选取是基于统计网络的节点数随着 的变化情况,当节点数发生显著变化时此时对应的 值即为阈值。

3 重要模块及基因的识别

首先基于所构造的多层网络,利用模块探测算法ClusterOne[4],识别了每一层网络中的模块。然后参照文献[5]中定义的模块影响力指标,分别计算了四层网络中每一层网络的高影响力模块,如表1所示:

在这些高影响力模块中,基因DAP3、C6orf62、ACVR1C、ATP6V0D1至少两次出现在了不同病毒的高影响力模块中,我们认为这四个基因在流感病毒的复制过程中发挥了重要的作用。它们可以成为新的抗病毒药物的靶标。

4 结论

本文中基因表达谱数据出发,利用偏最小二乘法构建了一个流感病毒复制的基因调控多层网络,每一层网络是一种流感病毒,然后基于所构造的多层网络挖掘了与病毒复制有关的重要模块和基因为流感病毒复制机制的研究和抗病毒药物的研制提供了新的思路。

参考文献

[1] N.-Y. Hsu, O. Ilnytska, G. Belov, et al. Viral reorganization of the secretory pathway generates distinct organelles for rna replication. Cell, 141(5):799C811, 2010.

[2] Watanabe T, Watanabe S, Kawaoka Y. Cellular networks involved in the influenza virus life cycle[J]. Cell host & microbe, 2010, 7(6): 427-439.

[3] 王惠文,吴载斌,孟洁. 偏最小二乘回归的线性与非线性方法[M]. 北京:国防工业出版社, 2006

[4] T. Nepusz, H. Yu, and A. Paccanaro. Detecting overlapping protein complexes in protein-protein interaction networks. Nature Methods, 9(5):471C472, 2012.

[5] Y. Li, S. Jin, L. Lei, Z. Pan, and X. Zou. Deciphering deterioration mechanisms of complex diseases based on the construction of dynamic networks and systems analysis. Scientific Reports, 5:9283, 2015.