首页 > 范文大全 > 正文

金字塔影像结构时间机器

开篇:润墨网以专业的文秘视角,为您筛选了一篇金字塔影像结构时间机器范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

1引言

地学观察需要观察者深入地了解地学要素和研究对象,一般情形下要亲自观察和采样,分析地学问题,提出解决问题的途径和研究方法。地学观察的设计通常是基于构建主义理论,其目标是以地学现场的各种媒介强化观察者对地学观察对象的认识。地学观察对象有其自身的一些特点,如重视对象的空间位置和时间序列,重视观察对象所处的自然和社会环境。以上特点决定了地学观察常常耗费巨大,难以实施,而地学观察对象通常也不能被长期保持,不能被反复细致地观察。从某种意义上讲,地学观察对视觉资料有内在的要求。但目前的地学观察通常只会有一定数量的照片、记录和样本,这对事后反复、细致的观察研究是非常不利的。目前的传感器和影像技术已经可以多尺度、多角度和多目的地获取现场或实地的影像数据,如果通过影像的整合能把地学观察转移到大容量的影像空间中,再辅以强有力的聚焦服务功能,必能有力地推动地学观察的发展。

2当我们注视这个世界许多现代科学门类都少不了观察。物理学、生物学如此,地质学、地理学也是如此。观察通常是从特点时空中的“点”开始的[1]。例如,传统的地质学在进行野外考察时,一般会带着罗盘、锤子、放大镜等装备。用罗盘定方位和“点”的位置;用锤子敲开“点”上的外部特征,揭开外表与内部的特征联系;用放大镜观测这“点”上的细节,用以感官延长并推断内部成分。可以看到,传统意义上的观察主要依靠视觉的感性认知,认知的手段是物质形式,认知的对象也是物质的。通过观察可以对一个“点”上的定性和定量特征加以测量、分析和表达,不过,这一切不能离开现场。为了观测与表达一件事,一方面需要经年累月的考察甚至实地挖掘;另一方面可能要锁定特定目标,它通常与某个已经发生、正在发生或将要发生的事件有关。这些事件似乎是在点上发生的,其实牵涉了方方面面,它们是点数据的信息源。由于观察的对象和手段在变化之中,点数据和信息源的关系也在变化中,传统的现场观察方法是无法保持与回溯这种变化的。现在大家熟悉的“3S”技术,即遥感技术(RS)、全球定位系统(GPS)和地理信息系统(GIS)与罗盘、锤子、放大镜等现场观察手段所揭示的观测对象的特点应该是一致的,只是对“点”的观测尺度和距离有着越来越大的变化。原来以现场视觉观测为主,现转变为仪器设备采集,以显示器所显示的数据为主。这些新型的观测手段弥补了现场观察手段许多的不足,如可以定期地观测,可以精确地知道观测对象的时空位置,可以事后反复对观测对象的定性和定量特征加以测量和分析,并对结果进行管理。

3多尺度世界中的动静变换自然和社会的现实目标源,来自于已经发生、正在发生或将要发生的各类事件,伴随着丰富的信息或数据源。对此,一方面需要通过对目标源深入细致地研究,总结出观察对象的特点;另一方面,需要根据目标源的时间、地点、背景和状态,重构事件的发生和发展过程。如何通过多尺度、多角度和不同来源数据,记录和表达事件发生的完整信息,并在真实的图像中得以体现,值得深入探讨。

3.1多尺度的金字塔影像结构金字塔结构的影像是目前处理海量数据的最常见的组织方式,它忠实记录某一时刻某一范围内的“点数据”,而记录的范围则根据传感器的不同而变化。通常情况下,这些“点数据”的空间分辨率会随着记录范围的扩大而降低,因此在通过影像,即记录好的点数据,对现场进行再观察时,选择合适的范围和空间分辨率是研究者最先需要考虑的问题。金字塔结构本质上是对二维影像逐次低通滤波,并增大采样间隔,得到一个像元总数逐渐变小的影像序列。这个序列中的每个图像称为这个金字塔结构的一个层,它们的尺寸递减,并均为原始图像的一种低分辨率表示,如图1所示。该数据集的特点是影像序列被限定在同一数据量下,在同一范围内不是同一目标的数据。另外,不同应用领域中的金字塔结构也有各自的特点[2],它们在图像融合、图像编码、渐进传输、海量图像实时显示中都发挥了重要作用。图1 某种金字塔结构图像然而,现有的金字塔结构是单纯记录“点数据”的,对于“点数据”的变化,它只能通过一系列影像分别表示。而对于信息源,金字塔结构无法记录。因此,从某种程度上讲,金字塔结构的影像是片面和割裂地建立了可视信息与现实世界的映射关系,而研究者的再观察也是建立在这种片面割裂的映射关系之上的。

3.2面向事件的动态结构由于传统的金字塔影像只能记录“点数据”在某一时刻的状态,如果要表示一个过程,则需要在时间轴上补充一系列的影像,如图2。其本质是将所有的目标当做静态来处理,而用时间序列“模拟”出一种动态的效果。图2 传统时间序列影像示意图但现实目标源是有静与动之分的,怎样记录静止的点和动态的点,这是影像中的世界能够逼近真实的世界的关键。以金字塔结构组织的影像由于不是按照事件的发生和发展过程组织数据,数据庞杂,很难将静止点和动态点整合在一起。缺乏静与动的关联与转换,影像中的世界与真实的世界之间的对应就会不可靠和不确定。因此,可根据任一事件确定目标源,建立可视信息与现实世界的映射关系;在认知与实体整合的基础上,通过位置和属性动态信息生成空间关系。通过该过程构造的影像中的世界,具有多尺度空间关系场中的位置关联、属性关联的准确性,以及单一特征和综合特征客观性,将会更加逼近真实的世界,给出更加客观的观察对象。在传统影像中,如果我们需要映射的是四维世界的某一时刻,即三维世界,我们则用二维的画面来完成映射的过程。如果需要映射的是四维世界的某一时间段,我们则用附加时间轴的二维画面来映射。但与影像的二维空间相比,映射空间在时间轴上是非常离散的,这也是传统影像不能很好表现真实世界的原因。但对于这个三维空间来说,我们完全有能力通过某种插值算子,将时间轴的离散程度降低,并且这种降低不是单纯地增加时间分辨率,而是质上的改变,即将原来的若干二维片段插值成一个完整的三维物体(其中一维是时间维)。举例来说,我们如果需要记录一个点变成一个圆的过程,在传统的影像手段中,我们得到的是一个点和几个逐渐变大的圆,而在新的映射关系里,我们得到的应该是一个圆锥体,如图3。这种新型的数据结构一旦形成,由于其将事件本身当做一个整体来处理,因此截取任意时刻的瞬时状况将变得可行;同时,由于将时间轴和空间轴等价,可以预见,许多现存的基于空间的算法可以同时利用到时间轴上。

4时间机器

面向事件的数据结构可以整体映射影像与现实世界的关系,避免了像金字塔结构一样片面表达和割裂现实世界及其影像。不过现实世界的动态轨迹一般比图3的例子复杂,观察对象具有时间、地点、背景和状态,我们可能是某一个时刻对其进行观察,也可能是一段时间对其进行观察。这种观察研究都有一个共同的特点:一方面观察对象是每时每刻在发生变化,另一方面研究者很多情形下需要反复细致地进行观察。因此,我们希望冻结住一个瞬间,以便在将来可以不断地回到这个瞬间,身临其境进行各方面的探索,也许在拍摄时我们并不在意这个瞬间的具体时刻。同时,科学家往往在某个案例发生的瞬间不知道捕捉的整个大环境中哪个位置、哪个点之后将会有突出的影响。对于这样的情况,时间机器这样的技术就显得尤其重要。如果能通过Gigapixel这样的技术,将观察对象凝固在影像中,对许多地学研究人员反复细致地观察对象是非常有价值的。然而怎样才能将地学观察对象凝固在影像中?这里涉及艰难的工作,即真实世界中的观察对

4.1拍摄过程的设计和GigaPan结构目前,最新的超高分辨率的全景成像仪(如Giga-pan)试图用拼接的方式重构一个世界。例如,在一段时间内对一处沙丘自动拍摄若干张图片,最终马赛克一般地拼在一起。每一幅单张图片与相邻的单张图片都有重叠区域,GigaPan系统则利用重叠区域的SIFT特征点匹配并拼接它们[3]。这些成功拼接在一起的图片构成了一幅完整的单幅GigaPan图像(single-frame GigaPan image),它突破了图像空间分辨率随着范围增大而降低的限制,单幅GigaPan图像可以达到十亿像素。这种拼接的方式理论上实现了某一时刻的多尺度世界映射,观察者可以在GigaPan图像中将视线任意移动缩放到想要观察的对象。虽然由于拍摄工作和存储设备的限制,这种缩放仍然有极限并且无法真正记录某一时刻———它只能记录整个拍摄过程,而这个过程含有多次曝光和视角移动,但随着技术的成熟,这些不足会被慢慢改进。

4.2带有时间序列的GigaPan结构在上述基础上,又出现了带有时间序列的GigaPan结构[4]。研究者先在一段时间内拍摄了一系列单幅GigaPan图像,然后在时间轴,通过简单匹配、链状匹配或网状匹配的方式将这一系列图像组织在一起。相机可以调整角度来拍摄各种细节,这样的过程可持续若干天甚至更久。例如,用全景成像仪拍摄某个庭院一年,那么在最终得到的结果里,用户可以放大到庭院里的一棵树,观察它从春季发芽、夏季繁茂,一直到冬季树叶落尽的全过程,甚至可以观察树叶上的某条青虫如何破茧化蝶。这种结构从某种意义上实现了可视信息与现实世界的高度映射,因为用户可以通过调整虚拟摄像头角度来进入不同的时间和空间,此时视频就会放大和缩小显示特定的部分。研究者可以把目标搬进实验室反复细致地观察,在屏幕里看庭前花开花落,望天上云卷云舒,如图4所示(该图影像资料来自文献[5])。以上的过程涉及到所谓的时间机器设计。在2010年的国际Gigapixel科学会议上,Randy Sargent等人阐述了时间机器设计过程中几个重要的问题。第一,拍摄过程的设计和GigaPan的组成与原理的探索;第二,图像处理,其中最重要的是图像拼接的过程,而最大的技术问题在于跨越时间的图像的拼接;第三,在海量图像中按时间机器方式进行浏览,该问题涉及对Timelapse的探讨。

4.3面向事件的全景影像不过,尽管这些全景成像仪的目的是根据观察对象的发生和发展过程采集图像,最终实现现实世界的完美映射,但由于其数据组织方式仍然是金字塔结构,因而不同尺度的影像是分裂的象限数据。该问题使得实际所见的是与现实目标源不一致的该区域的分裂的全要素数据,不是在一个同名区域内的关于事件的完整数据,因此难以得到事件的定位定量的完整综合信息。这也正是需要我们深入探讨的问题。基于

5结束语本文讨论了地学观察是否可以从现场观察转变为对现场影像的处理和分析。探讨了金字塔影像数据结构和GigaPan全景影像以及带有时间序列的GigaPan结构,指出了它们的不足和局限性。通过分析从现实世界到影像世界的动静转换和映射关系,提出了一种面向事件的可以表现多尺度世界中动静状态的新的影像结构,给出了未来遥感影像研究的一个新的方向。