首页 > 范文大全 > 正文

高性能计算为生物信息学加速

开篇:润墨网以专业的文秘视角,为您筛选了一篇高性能计算为生物信息学加速范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

基因组信息爆炸的时代,需要超大规模计算系统来运算。

伴随着基因组研究日新月异的快速发展,相关信息出现了爆炸性增长,迫切需要对海量生物信息进行处理。以DNA碱基数为例,其增长速度呈指数性增长,大约每14个月就会增长一倍,这种增长速度只有计算机运算能力的增长可以与之相比。所以在当前基因组信息爆炸的时代,需要建立超大规模计算系统,用更准确、更可靠的方法来分析这些数据,从中获得有用的信息是生物信息学取得成果的决定性步骤。

近日,具有万亿次浮点运算能力、基于四核处理器的联想高性能机群――深腾1800落户于上海交通大学,承载着该校在生命科学研究领域的多种核心应用软件。上海生物信息技术研究中心主任李亦学在接受记者采访时说: “生物与计算结合最早叫做计算生物学,从要求来讲,能够进行大规模计算即可,对单个CPU结点的内存没有多大的要求,但随着生物学的发展,对计算机的要求变得比较复杂。一个完整的解决方案,要求对大量不同的数据库同时进行快速检索,然后是数据整合,同时还要做很多并发计算,很多计算是非常耗内存的。实际上并不一定非得要求计算能力非常高,但一定要可靠。再者,需要同时并发完成许多不同的计算。”

李亦学说,他们在进行生物信息计算时会同时存在几十种不同的任务,这不但需要计算机运算速度快,还要求有很大的共享内存。现代生物学为了获得高速运算,必须把所有的数据放在内存中进行操作,这样会节省时间。如果没有很大的共享内存,他们的很多案例就没有办法做了。比如大的基因组测序数据的拼接工作,内存要30G左右,大内存的胖结点可以做到。而四核的发展,其实可以把每个结点共享内存加大,在性价比方面也比较高,这种发展非常符合生物学发展对复杂生物系统计算性能的要求。

据介绍,深腾1800能提供每秒1.02万亿次的双精度浮点峰值运算平台。而此次HPC的部署总计12个计算结点、1个胖结点以及管理结点和存储结点,共计116个CPU内核,附带完备的基础架构。该方案满足了上海交大的需求,也提升了其科研工作效率和综合科研实力。

在高性能计算领域,相对于低端的PC服务器而言,机群服务器及其系统构建更需要专业的应用方案设计技术和精湛的技术服务能力,高性能计算大多用于对计算能力要求比较严格的行业,比如说生物信息学、材料分子学、地质分析以及证券金融等。但是也应该看到我国的HPC已经有了很大的发展,中国的HPC的系统方案也将从标准的通用型走向更切合应用需求特点的专用型。