首页 > 范文大全 > 正文

一天再造罗马

开篇:润墨网以专业的文秘视角,为您筛选了一篇一天再造罗马范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

罗马不是一天造就的,即使重建其3D模型也需要10年。然而,当撒米尔•阿加瓦尔发现了Flickr上的图片资源之后,他开始尝试在24小时内重建虚拟罗马。

撒米尔•阿加瓦尔(Sameer Agarwal)是一位计算机视觉专家,美国华盛顿大学计算机科学与工程系助理教授。他现在做的工作听起来非常酷―一日重建罗马。

“把所有困难的工作都扔给计算机好了。计算机能自动收集Flickr上带有Rome或者Roma标签的图片,图片收集好后进行匹配,21小时后,你就能走进新‘叠’成的3D版罗马。”阿加瓦尔一边说,一边把浏览3D版罗马的网址发给记者。“你可以尝试四处走走看,亲身感受一下这座露天的博物馆,10年建成的斗兽场是一定要去看看的,还有几乎花了一个世纪建造的圣彼得大教堂。”

记者点击了阿加瓦尔提供的网页,加载速度稍慢,加载完成后,能360度观看斗兽场,感觉就像是从斗兽场脚下走过一样,还能微微仰视,有种身临其境的感觉。甚至斗兽场第4层的房檐下面排列着240个中空的,用来安插木棍以支撑遮阳帆布的部位都清晰可见。

“你眼前所看到的,只是借助Flickr上的15万张图片,征用了496台集群计算机,工作21小时的结果,而在此之前,同样的重建过程可能会耗时10年。”阿加瓦尔说。

找出图片的DNA

“重建罗马只是第一步,我们还重建了威尼斯、杜布罗夫尼克,以后还会有更多的城市加入其中。”在阿加瓦尔看来,这十分必要。“一张图片胜过千言万语,现在的问题是,千张图片的价值在哪里?它们齐刷刷地扑面而来,叽叽喳喳都在你耳边说话,你一句我一句。”

“如果你在Flickr的搜索框输入‘特雷维喷泉’,你会发现超过1.1万千张照片。浏览这些图片,就意味着你必须一张张点击图片的缩略图。任何用过Flickr或者Google图片搜索的人都能理解这种繁琐来带来的沮丧。”阿加瓦尔说。“5年前,我想在网上找张视角稍广点的‘特雷维喷泉’图片,但没有。”图片很多,想要的却不多。

“我们从网上分享的图片中获得启发,并且成功开发出了一款软件,它能通过关键字搜索图片,自行进行匹配。在测试中,电脑花了不到两个小时,让‘特雷维喷泉’三维重建,所用到的图片来自50位摄影师所拍的151张照片。所有的计算和图像排序是自动执行。”史蒂夫•塞茨(Steve Seitz)补充道。他是阿加瓦尔《一日建造罗马》论文的合作者,华盛顿大学计算机科学与工程系副教授。

“每张照片经计算机的景像算法处理,提取出很多的特征元素。通过创建一个点云(见本期辞典)给图片一个唯一的标识,类似于DNA一样为每个已被识别的图片的特征进行标识。然后,这些照片的特征会在一个网中被链接起来。当同一个特征在不同的图像中被发现时,它的三维位置就能够被计算出来。这类似于人脑通过双眼看到的图像来感知三维立置。”阿加瓦尔进一步进行解释,这就是使用了全新思路的基于图像的渲染技术(IBR)。

阿加瓦尔曾在Te c h F e st会议上演示过“特雷维温泉”的漫游,这款有趣的软件于是被微软青睐。2005年3月,微软与华盛顿大学签署了商业授权协议,将其重新包装后于2008年8月推出,命名为Photosynth。

全世界的拼图游戏

“连续观看时,有些不顺畅,一些细小的人物和景物无法完全衔接。这是因为三维图像是由多幅照片拼接而成的,所以转动观看角度时就像播放动画片,它的流畅和真实程度取决于原始照片的数量和质量。要是拍摄的照片不够多,或场景差别过大,就会出现上述情况。”

一些使用过Photosynth的人表示,这个软件很酷。但从处理照片到最终完成三维效果动画,可能会耗费数小时。

的确,从制作城市地标到还原整座城市的转变,是从数百张照片,转而变为要对数十万、数百万张照片进行处理。这并不是一件容易的事。“按照Photosynth的处理水平,一套有2万5千张图片的场景需要500台计算机花1年的时间才能处理完”,阿加瓦尔说,“如果是10万张照片,处理的时间将超过10年。”

解决方法是建立一个并行分布式系统,“新开发的代码,速度比以前的版本快上100多倍。它首先确定可能的匹配,然后将这些可能的匹配进行集中重建。该代码还使用并行处理技术,使其能够运行在多台计算机,或通过因特网连接的远程服务器,甚至同时进行。”

“当然,我们将不仅仅是做一本相片集”,赛茨说:“当它实现了再现照片上的特定场景或地点之后,房地产机构,博物馆和酒店会觉得这是一个对旅游业有益的东西,因为观众可以通过放大来阅读餐厅的菜单或查看一幅画。而考古学家和生物学家们则可以在网上通过逼真还原的场景来进行研究。这种直观的通过照片再现场景的技术,对军方的价值自然就更不用说了。” 以外,这种技术还能够为用户在网络地图上创建一个虚拟现实的体验,甚至还可以建立以城市为背景的视频游戏。“它绝不会仅仅被用作城市建筑的数字化保存,起码能与在线地图相互整合使用吧。”赛茨对他的创意很有信心。

阿加瓦尔认为,只要还有热衷于摄影和旅游的玩家,这款软件就会充满前途。因为玩家们的照片事实上充斥着互联网。

在阿加瓦尔看来,他正在做的就是在实现“视觉维基”的概念。投稿者可以上传照片,并有计划地将它们结合起来,最终在虚拟世界创造出一个完整的现实世界的镜像。