首页 > 范文大全 > 正文

石油HPC走向“平衡计算”

开篇:润墨网以专业的文秘视角,为您筛选了一篇石油HPC走向“平衡计算”范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

“现在对于一个复杂区块来说,唯一认识地下的手段就是地震波技术,而不是其他的传统技术。”张铁刚在接受采访时说。他是中国石油大庆油田公司勘探开发研究院总工程师,重要职责就是通过信息技术支撑油田的持续稳产。而他提及的地震波技术正是现阶段最流行、最精准的油气勘探法――通过人工地震波,采集传入地下深处的不同形态岩层形成的反射波,转变为数据,再通过计算处理模拟勘探区域地下的地质构造,以便找到存有油气的岩层位置。这被形象地称为“给地球做CT”。

而采用这种方法进行勘探,离不开海量数据的存储和处理,处理时间越短,成像效果越好,勘探的经济效益也就越高。对于石油勘探来说,计算能力本身就是生产力。这也正是在商用高性能计算(hpc)应用领域,石油行业始终走在前列的原因。

平衡是必经阶段

在经过连续多年的HPC建设之后,石油行业培养出一大批IT应用专家,他们孜孜以求的就是让HPC的应用效能最大化。翻译成技术语言来看,HPC与采集区的勘探数据主要是通过两类应用联系起来的,一是地震资料处理,另一类是油藏模拟。前者对计算敏感,要求HPC的浮点运算性能必须出色;后者则对系统内存带宽敏感,并且需要大缓存支持。这样的应用特性决定了石油行业必然要率先获得服务器处理器的技术路线图,甚至率先尝试。

然而,经过十年x86服务器大规模使用,油田确实创造了非常可观的经济效益,但在应用中也发现了很多问题。“这几年,我们投入上千万元来进行技术改造,主要就是要解决四个问题:提高CPU利用率、提高存储性能、确保数据安全、合理控制能耗。” 中国石油东方地球物理公司(BGP)研究院处理中心总工程师赖能和认为,现在石油HPC是到了均衡发展的时候了。这也正与英特尔提出“平衡计算”的战略相合。

英特尔高性能计算架构师高大伟介绍说,整体性能提高是靠很多环境来组成的,这些环境就包括磁盘I/O、网络I/O等方面,平衡计算的意义主要是两点,一是在现有系统的情况下,必须采用适当算法和软件,实现整个系统的高性能。二是特别强调在I/0的密集性上,往往解决了热点问题后,还会冒出新问题,这样一来最好借助新技术来解决。英特尔还力推除处理器平台之外的一系列技术,落脚点就是行业客户的实际需要,系统设计要取决于应用特征。英特尔要针对用户不同应用面临的挑战,提供一个平衡解决方案。

软硬功夫兼施

在连续五次的HPC Top500榜单中,石油大型系统都基于英特尔至强处理器平台,石油行业的算法对每个核的性能要求非常高,而这一点恰恰是至强的优点之一。但当存储与网络渐渐成为瓶颈,单独处理器快速向前发展已经满足不了石油行业HPC的需求了。尤其是石油行业RTM(逆时偏移)应用渐成主流,数据处理量和I/O需求急剧增加,RTM算法的采样率提高1倍,就要带来16倍的计算强度和8倍的内存访问量。出于平衡发展的考虑,英特尔大力推动SSD(固态电子盘)和万兆以太网,并在石油行业进行了先期尝试。

SSD往往被用来优化I/O密集应用和替换启动硬盘,在BGP,SSD的表现已经非常抢眼。“我们很早就关注SSD,它功耗非常低,I/O读写性非常好,现在正在尝试把数据库应用全部采用SSD,在HPC节点内置盘开始尝试SSD。”赖能和认为,一旦价格降到合理阶段,并且容量提升上去,SSD对石油行业的应用意义就非常大。

据英特尔亚太及中国区HPC架构师何万青介绍:英特尔已与壳牌就逆时偏移应用做测试,使用SSD作为硬盘缓存,存储中间结果数据,效果非常好。今年BGP快速提高计算能力,一次性投资4600万元,就是专门为了做逆时偏移而建设平台。壳牌SSD的成功应用也为其提供了参考借鉴。

而在网络传输部分,万兆以太网的优势也已经开始显露出来。英特尔产品经理齐炜援引IDC的数据说,今年万兆以太网使用量将会大幅上升,预计在2013年,在服务器部分,万兆端口量将会超过千兆以太网端口量。

作为简化数据中心网络的手段之一,万兆以太网卡有望很好地弥补千兆以太网和Infiniband之间的性能差距。齐炜认为,早期万兆以太网推广的最大阻碍是价格和功耗,但现在功耗已经降到了合理范围,价格也在快速下降,今年底或明年年初,万兆端口将集成在主板上,这样促使整个万兆以太网的设备价格急剧下降,这对应用普及将有很大帮助。

不仅如此,英特尔在HPC上的实力更多还体现软件方面:全球知名ISV大多针对IA架构的HPC进行了软件优化,形成了强壮的软件生态系统。针对中国本地的HPC用户,英特尔也提供了特别的软件优化服务。比如BGP自主开发的GeoEast应用软件,英特尔技术专家针对时间偏移模块,采用有效软件工具进行特征分析和优化,使时间偏移软件性能提高了约5倍,三维建模模块通过英特尔专家优化,也取得了明显进展,而类似的情况在大庆油田等多家石油行业单位并不鲜见。

新技术添动力

针对高性能计算的具体应用和市场细分,英特尔的产品布局已经完整:主流应用采用至强5600系列,然后切换到Sandy Bridge系列,而对于高度并行应用,英特尔将在2012年底MIC(集成众核)架构。对于大内存需求比如精细解释的应用,英特尔的多路服务器处理器可以满足需要。

在技术路线图中,MIC引起了油田科技工作者的极大关注。张铁刚透露说,大庆油田正在考虑建设适合逆时偏移计算的计算平台,但具体架构尚未确定,他希望英特尔的MIC尽快投入商业应用,因为“处理方面还有更大需求”。

在英特尔规划中,MIC主要为了实现高度并行计算――以单线程性能为代价,用多个小的定序执行的计算内核获得高的整体积聚性能,这类应用需要满足大量并行以使用所有小核,大量SIMD操作和高密集计算的特征。据统计,当前有5%~15%的应用可以成功使用MIC,而引入新算法后会增加这类高并行应用的应用数量。

MIC的成功之处在于,将广泛接受的架构和编程概念扩展到高并行。因为都基于标准的x86编程模式和存储器模型,MIC与至强使用相同的编程语言、编译器、开发工具、库函数以及编码和优化技术,因而不需要重新编程。这样,MIC就满足了用户最看重的两个基本特征:在固定成本/功耗的前提下提高性能;架构对编程性的影响极其微小。据高大伟介绍,基于MIC专门针对石油行业逆时偏移应用的移植工作正在进行中,石油行业用户将从中极大受益。

链 接

石油勘探开发背后的IT故事

中国石油大庆油田勘探开发研究院总工程师张铁刚

大庆油田最近荣获国家科技进步特等奖,这是我们第三次获得该奖项。四大技术亮点中有两项与IT密切相关:一是大规模三维高分辨率地震勘探技术,这得益于地震资料处理技术。还有窄小河道砂体识别技术,这主要是地震解释和大规模油藏计算技术,也是高性能计算的重大技术。

这些年我们在总部油田的支持下,装备能力每年都得到持续发展。引进地震处理集群,包括引进用于油藏数值模拟的集群以后,英特尔派专家到现场,利用性能分析工具,帮助我们优化分析软件系统,指导系统优化配置和调整。这些技术都为提高地震处理、数模计算的实效性有很大帮助。

从连续两年的测试当中,我们尝到了甜头。油田研究院对新一代服务器处理器做了全面测试,今年测试了基于E7的10核、4路服务器。受限于时间短,我们先期做了多学科协同地震解释测试,这将来是英特尔多路服务器,也就是“胖节点”服务器未来的应用领域。

现在地震信息采集量越来越大,区块也越来越大,密度也越来越高,带来的结果就是如何解释,提出有价值的地质信息,必须进行地震解释和地震属性计算以及三维可视化解释,在大屏幕上显示出来,这就需要强大的服务器来支持。最早油田采用SGI小型机做三维解释,后来全面转向英特尔双路服务器。做100平方公里的区块数据解释,双路服务器就可以了,但现在我们普遍做的大区块解释都是300平方公里,甚至是连片处理解释。从去年开始,我们尝试用英特尔4路、6核处理器做解释,从计算效率、数据访问和数据管理整个过程来看,效率提高了2~3倍,工作人员普遍接受了采用“胖节点”的多路服务器来逐步取代小型机以及昂贵的企业级服务器来做协同解释。

我们未来的计划是,每个勘探研究室在进行多学科协同工作时,从地震的特殊属性处理以及地震构造解释、精细解释和“井震结合”的解释,都在一台服务器上全部完成。这样做的好处就是把所有数据有效集中管理,软件部署也达到了统一集中管理。油田研究院与英特尔的合作为我们未来建立多学科,基于研究室的多学科协同地学综合研究提供了很好的研究平台。