首页 > 范文大全 > 正文

扫描体素显示器

开篇:润墨网以专业的文秘视角,为您筛选了一篇扫描体素显示器范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

文章编号:1006-6268(2009)03-0012-09

摘要:传统的立体显示器(stereoscopic display)需要观众人为地将眼睛的焦距固定在某一个距离,不断改变左、右眼收敛点来观察不同距离的物体,因此会造成眼疲劳和不适感,也降低了图像质量。立体显示器(Volumetric display)可以克服这个问题,但仅限于一定观看距离内和一定调节能力的小物体;同时,它们也不能正确地提供闭塞信号。本文描述了一种可能的解决办法――多平面扫描体素显示器(multi-planar scanned voxel display)。

关键词:传统立体显示器;立体显示器;多平面扫描体素显示器

中图分类号:TN141 文献标识码:A

Scanned Voxel Displays

Brian T. Schowengerdt1, Eric J. Seibel2

(1.Department of the Human Interface Technology Laboratory, University of Washington,WA,U.S.A; 2. Department of Mechanical Engineering,,University of Washington,WA,U.S.A)

Abstract: Conventional stereoscopic displays can cause viewers to experience eye fatigue and discomfort,as well as compromise image quality, because these displays require the viewers to unnaturally keep the eye focal length fixed at one distance while dynamically changing the convergence point of the left and right eyes (vergence) to view objects at different distances.Volumetric displays can overcome this problem, but only for small objects placed within a limited range of viewing distances and accommodation levels; they also cannot render occlusion cues correctly. One possible solution ― multi-planar scanned voxel displays ― is described here.

Keywords:stereoscopic display; volumetric display; multi―planar scanned voxel display

人体可视系统能敏锐地感知三维关系。一套互动的视觉过程快速地扫描周围环境,使大脑准确地估计周边物体的相对空间位置。当无法得到一些纵深信号时,该视觉系统可使用剩余的信号给出最佳估计。试想闭着一只眼睛穿过房间会不会很容易:不断改变的大小、物体的相对运动、近处的物体阻碍看到远处的物体,这些都提供了足够的纵深信号以避免碰到障碍物。如果任务的难度进一步增加――例如投篮或用解剖刀切除组织,部分纵深信号的缺失会大幅降低人体运动能力。

因此,对于包括显示在内的空间难度工作,如腹腔镜手术,提供尽可能多的准确纵深信号是很有用的,其最好的方法是使用三维显示器。但是,这不是那么简单。显示三维数据最简单和最常见的设备是立体显示器;然而,尽管它们可以通过提供一些二维显示器无法得到的信号以产生令人信服的纵深感,但它们也会产生不准确的信号,这些信号会提供相互矛盾的纵深信息――一种人体可视系统反应很差的状况。这种三维观看条件的不完美模仿在视觉系统内部会产生感官冲突,从而导致眼疲劳和不适。

为了真正实现三维显示器的巨大前景,就必须解决这些问题。本文介绍了几种建立三维显示器的方法,这些三维显示器可提高模拟的真实度,并在视觉系统内不会产生冲突。这些三维显示器包括各种能避免一定距离外小物件的调节/聚散度去耦合的体块显示器及我们的扫描体素显示器。该扫描体素显示器能克服无限物体大小范围和距离的冲突。

1 共同硬接线:聚焦和瞄准眼睛

当观看现实世界中的物体时,视觉系统中提供的信息和各种进程上的要求是相匹配和同步的。调节过程可控制眼睛的光学聚焦。类似相机、摄像口能改变焦距,并将给定观看距离的物体带入视网膜的锐聚焦。虽然相机可以前后滑动镜头来远近变焦,但摄像口可延伸或释放安置在虹膜和瞳孔背后的弹性镜头,以改变其凸度[1]。另一聚散过程则能够控制眼睛汇聚的观看路线,即观看者指向眼睛的距离。

当观众从远处的物体移向更近的物体时,为了清楚地看到新东西,两件事必须同时发生:观看者必须将两眼都集中在这个新的目标上,并改变摄像镜头的调节以使物体聚焦(如图1)。

图1(a)中:当观众看远处的房子时,眼睛的两条视线(黑色虚线)都集中在房子上,而眼球调节到一个相匹配的距离将从房子反射的光(实线A)聚焦在视网膜上,以形成房子的清晰图像。由于树是处于不同的观看距离,从树反射的光(实线B)在视网膜后聚焦,并且在视网膜成的像是模糊的。图1(b)中:当观众将注意力移至树时,眼睛同时收敛到树的距离,并增加眼球的凸面以调节至相匹配的距离。眼球增加的光强将从树反射的光聚焦在视网膜上,而从房子反射的光不能聚集。当观看真实物体时,这些过程需要一直保持一致地运行。因此,需要一个硬接线连接它们的运行。一个过程的进展将自动地引起另一过程中同步和相匹配的进展[2]。

立体和自动立体显示器能给左眼提供一张图像,而给右眼提供一张不同的图像,但这两张图像都可通过平面二维成像元件生成,如液晶显示器面板。每个像素的光来自于一个平面(在某些情况下是两个平面),所以每个像素的光学观看距离实际上是相同的,即到屏幕的距离。光学观看距离可作为视觉系统的一个信号,即所有的物体是平面的并位于相同的距离,尽管立体信息能提供一些物体在屏幕后或前的信号。这就要求调节将眼睛聚焦在屏幕的距离(见图2)。

图2(a):当观看传统立体显示器时只有一个调节的准确位置。尽管房子和树是处于不同的立体距离(在左右两张立体图像中,树间比房子间有更大的双眼像差),它们或者都在焦点上(如果观众调节至一个正确的距离)或者都不能聚焦(如果观众调节至任何其他的距离)。图2(b):如果观众将目光转向前方的树,聚散度的改变将在调节上引起匹配的非自愿变化,导致整个显示变得模糊。图2(c):为了将显示带回到焦距,观众被迫对相关过程进行去耦合,并将调节固定在房子的距离,而集中到树的距离。只有当观看的物体处于屏幕的实际距离时(也就是将三维显示器作为二维显示器使用),镜头和焦点才能与距离相匹配,并能看到该物体的清晰图像(图2(a))。在立体内,放在屏幕后面的物体要求眼睛盯住屏幕后面,同时聚焦在距屏幕的距离,即观众必须努力分离聚散度和调节的耦合过程(图2(c)),否则整个显示将会变得模糊(图2(b))。该被迫的分离是立体显示器中眼疲劳的主要来源[3-5],并降低了图像质量,还可能在长期暴露中导致视觉系统疾病(尤其是儿童正在发育的视觉系统中)[6]。

2 体块显示器:准确的聚焦信号及有限的尺寸

体块显示器是一种可替代的三维技术,该技术可匹配调节及聚散度信号,从而避免了立体显示产生的冲突。一种名为Perspecta display(来自Actuality Systems公司)的体块显示器是一种可卷屏的多层显示器[7]。一个圆形的投影屏幕(直径约25cm)围绕其中心轴旋转,并经过一个球形三维立体掠过屏幕的表面。在每个刷新周期内,高速的视频投影仪将三维虚拟物体的198片不同二维薄片投影到上述旋转屏幕的198个方向上。三维物体的每个点由三维体内的像素代表(通常简称为三维像素),并且从该像素发出的光能够在聚散度和调节上准确地到达观众的眼内。另一种叫DepthCube(Lightspace Technologies公司)的体块显示器也使用高速视频投影仪来投影贯穿三维立体的多重二维薄片[8]。然而,DepthCube含有20个液晶散射百叶窗,而不是掠过该立体的屏幕。在任何给定的即时时间,20片百叶窗中的19片几乎是透明的,而另一个在用的百叶窗可当散射背投影屏幕使用。"掠过"百叶窗在功能上类似于掠过透视显示器的屏幕。

虽然这些体块显示器能够与它们所显示物体的调节和聚散度要求相匹配,但它们仍有一些缺点。主要缺点是它们描述的物体大小受到限制――这些物体必须在扫描三维立体的体内大小合适,例如在透视显示器直径为25cm的球内。这些显示器不能在同一工作台的对面放置两个物体,更不用说在远处地平线上放置物体,并只能在一个很小的调节范围内改变物体的聚焦能力。第二个缺点是它们不能准确地呈现闭塞。每个像素对观众来说是可见的,即使像素代表的是观看角度不可见的物体背面上的一个点。另外,大量像素的计算要求和利用传统视频卡技术来处理这些计算的难度都会产生额外的困难。例如,透视显示器的198个薄片中每一个分辨率为768×768像素,即该显示器必须提供每帧超过1.16亿像素、使得移动视频的计算无法使用目前的图形处理单元。

Akeley和他的同事已经开发出固定角度体块显示器。不同于多角度体块显示器,该显示器能正确地提供闭塞信号[9]。采用的方法有点类似于DepthCube的。在DepthCube内,图像薄片被放置在立体的固定距离处。然而,这些薄片总是开着的,并能使用分光镜进行光学叠加,而不是按顺序将这些薄片关掉和打开。单独的一叠薄片用来生成能够显示到每个眼睛的三维立体,呈现出准确的闭塞和那些依赖灯光效果的视角。然而,目前的原型中只有三个薄片,并且只有当物体放置在三个薄片中任一个的距离时才能产生该物体的准确聚焦信号。使用分光镜并结合光学组合导致的光损失会显著增加有问题的层数。当这些薄片放在距观看者距离为31.1、39.4、53.5cm时,该原型的聚焦信号最大纵深为22.4cm。

为了重现现实世界纵深感觉的全范围,三维显示器必须能将像素或体素放在从调节的近点(年轻观众约为7cm的聚焦距离)至无限远处的光学距离内。我们已经开发了许多扫描体素显示器,如体块显示器,这些显示器不仅能够克服调节/聚散度冲突,而且可将物体放在距观看者眼睛6.25cm至无限远范围内的任何地方――超过了匹配调节全方位所需的范围。

3 产生扫描体素显示器的方法

扫描像素显示器,例如虚拟视网膜显示[10,11],可双向扫描一束彩色和亮度调制的光束,并透过视网膜连续移动二维的单像素以形成图像(图3)。当光束双向扫描(左方的白色方块代表扫描仪)时,像素是从整个视网膜移动,形成了二维图像。为了简化说明,图中只显示3个像素。

我们已将一个多聚焦元集成到扫描光显示器中,使体素能够通过三维立体三向扫描(图4)。为了简化说明,图中只显示2个成像平面和5个像素。在图4(a)中,观众使用处于视网膜焦距范围内的、处于很后的平面调节至远处的地平线上,(图中两个圆圈A代表焦点)。处于后平面内的图形(例如,远处的山和云)将聚焦,而处于其他平面的图形将根据它们到观众焦点的距离等比例地变模糊(由视网膜后面的三个焦点代表――告诉当它们的光到达视网膜时光是如何光弥漫传播的)。在4图(b)中,观众已将调节转移到近点,增加了眼球的光强。那么,立体里面的前平面是在视网膜的焦点上,使该平板内的图形(例如,附近一颗树的一根树枝)清晰聚焦,而后平面内的山和云移出聚焦范围(焦点在视网膜的前面,并且当光到达视网膜时它是弥散的)。不同于体块显示器,该光没有投影到屏幕上(移动的或静止的),而是生成一个能够直接由眼睛看到的三维光束立体。通过将在镜头表面与其焦距之间的三维立体定位,该三维立体可放大并占据从镜头到遥远水平线伸展而来的虚拟空间。在观看真实三维物体的同时,眼睛可以聚焦在三维体内的不同点。

我们已经采用该方法设计制造了许多扫描体素显示器原型,这在其他文献中已进行过详细报道[12~14]。我们将简要介绍最近的一种原型,该原型使用一束扫描光束可将全彩色立体多平面视频直接呈现给每个眼睛。该光束在X轴和Y轴上光栅扫描前,先使用由OKO技术得到的变形膜反射镜微光机电系统器件"扫描"到Z轴上(图5)。该变形膜反射镜含有氮化硅薄膜,膜上涂有一层电沉积的铝反射层。反射膜的形状可通过将偏向及控制电压应用在膜和电极上来控制。没有外加电压时(图5(a)),膜形成平面镜,并从其表面反射的平行光束仍能保持平行。施加电压后,反光膜被静电偏向于电极,并形成一个能将光束聚焦到近点的凹抛物面镜(图5(b))。图中表明光束是从图形的底部进入,并被反射到右方。如果不在膜和电极(a)上施加电压,变形膜仍能保持平整,并没有改变从表面反射光束的焦点。如果施加电压(b),变形膜经静电偏向于电极,生成一个能将光束焦点变近的凹抛物面反射镜。介质电压的大小可在近点与光学像无限距(即平行光束)之间的任何位置改变焦点。

光束在使用变形膜反射镜扫描到Z轴上后,可通过旋转多边形反射镜(Lincoln Laser Co.)扫描到X轴上,通过使用检流计反射镜扫描仪(Cambridge Technologies)扫描到Y轴上,以此完成三轴扫描。这种三维扫描体素体被折叠反射镜光学分离,并转移到左、右眼。图6的上图是该完整光学系统的一个图形化概述。

在这个还处于理论证明的原型中,两平面被连续切换地扫描到眼内。为了提供显示的视频内容,在"快速翻转页"模式中呈现两个图像,该模式使用60Hz更新速度的偶数帧呈现第一个图像,而奇数帧用于呈现第二个图像。在图像页码翻转的同时,变形膜反射镜将改变扫描光束的焦点,导致将这两个图像投影到不同纵深的平面从而产生一个两平面体素体。观众会感觉到这两个平面的重叠为一个复合多层图像。通过自然地调节眼睛,观众可将在背景(图6(a))或前景(图6(b))的物体带入到视网膜的焦点上。通过迅速改变施加到变形膜反射镜的电压,一个连续转换的多平面图像就产生了。图6(a)中,观众将眼睛调节到距离,从而使背景平面聚焦,而图6(b)在前景平面中的树是有些模糊不清的。观众调节近些,可将树在视网膜上聚焦,而房子不能聚焦。通过向与其立体观看距离相匹配的体内平面提供物体,可使调节和聚散度的信号一致。图7展出了在该原型上显示的多层图像样品照片。

图7(a):相机聚焦在远处的体素平面上,体素平面描述了一个带有文字的砖墙。在顶端的照片中,一个含有蜘蛛网图像的体素平面是在相机平面焦点的前面(类似于人的调节点)。在底部照片中,含有蜘蛛网图像的体素平面通过变形膜反射镜光学改变以配合后面的体素平面。

图7(b):该显示器还可以用在透视增强现实度模型中,其中体素图像呈现到配有分光镜的眼睛,使虚拟物体光学放置于真实的世界。相机聚焦在前景平面的附近,并显示蜘蛛网。而含有石墙和飞机的后体素平面在相机平面焦点的后面。

图7(c):在顶端的照片中,两块体素平面一起排列在Z轴上,并且相机聚焦在这一点上,产生了一张统一聚焦的图像。在中间和底部的照片中,体素平面被分开,而且相机的焦点会在前面和后部体素平面之间变化。

4 客观地测量焦距范围与调节

为了评估原型的全部焦距范围,我们使用光束分析器测量了各个位置扫描光束的直径,并通过这些测量结果计算在变形膜反射镜控制电压范围内光束的分散度。相反,使用这些光束分散度可计算虚拟图像的观看距离和图像聚焦所需的调节数(图8)。该原型显示的虚拟图像可从离眼6.25cm(比人体调节的近点更近)移至光学无穷远处。图9是人体至显示器的调节屈光度强度D(1/焦距)的客观测量值,这些数值是通过红外自动验光仪获得。当像平面由变形膜反射镜前后光转向时,主体能准确地变换并使调节与像平面匹配。圆点代表的是响应10个主体的调节反应(时间及主体都取平均值),同时观察一个出射瞳孔直径为3.5mm的显示器。方块代表的是单个主体观看出射瞳孔在2.9~1.6mm范围的显示器时对时间的平均调节响应值。图中已用最小二乘法线性回归线拟合了每一组数据。

在我们以前的研究中有一个有趣的发现:响应扫描体素显示器的人体调节取决于扫描光束的直径。当扫描光束直径大于2mm时,主体会准确并一致地调节。但是,如果光束的直径减至0.7mm,显示器会产生针孔透镜的虚拟等价物。显示器焦点的大小会增加,调节开始在一个开环反馈回路中运行,而且在主体内部及主体之间都会变得更加多变。

5 单聚焦调制器方法的当前挑战

我们已经介绍了一种在立体里面连续转换投影双平面的基于概念的原型,并在Z轴有一定的分辨率。提高该分辨率的一种方法就是增加连续转换呈现的平面数,模仿体块显示器的排布,如引言中讨论的卷屏显示器。但是,不同于这种体块显示器,我们的扫描体素显示器不限于改变基于逐帧的Z轴体素。事实上,生成一个全三维的体素阵列在计算上是不会高效的,因为对于任何给定的场景,大多数体素没有被有效地用来呈现物体。更简洁的解决办法是建立体素的2.5维雕刻表面, 其中每XY单位坐标有一个体素,并且体素的Z轴位置可由单聚焦调制器动态调整。该解决办法在计算上更高效,并能更好地利用传统视频卡构架,因为该显示器可由配有一对Z轴纵深图的二维源像来驱动。在该显示器的每个刷新周期内,光束在二维散点图光栅中被移动,并使用二维源像的色泽和亮度值来控制三原色光源的强度,使用深度图动态控制"连续像素"基板上单聚焦调制器的位置。不幸的是,目前的变形膜反射镜只能够达到kHz聚焦调制频率,而不能达到改变在连续像素基板上的光束聚焦点所需要的MHz频率。

固态光电材料有希望成为变形膜反射镜的一种更快的替代材料。华盛顿大学正在研究新型的光电聚合物,这些光电聚合物将使在GHz频率下运行的空间光调制器成为可能,并且该频率超过了使用单调制器运行连续像素聚焦调节所需的速度要求。在等待这些更快调制器成功制备的同时,为了克服现有技术下单调制器的速度制约,我们正在开发包含多重聚焦平行通道的扫描体素显示器。

6 使用多重光源的扫描体素显示器

在上文所述的原型中,单一的三原色复合光束被聚焦调节并扫描到眼内。我们将完成新一代包含多种三原色光束的扫描体素显示器,每一种三原色光束在它们光学结合前放在不同的聚焦水平(见图10)。每一重像素流在光学联用及XY-扫描前放置在不同的聚焦水平,形成了2个三维立体,其中一个能用左眼看到,而另一个能用右眼看到。复合多焦点的三原色光束在XY平面扫描到观众的眼内,每种组成光束在立体里面会产生不同的平面,创造了一种看起来似乎在空中漂浮的分层多焦虚拟图像。不同于前面那种能连续转换生成多重平面的原型,新显示器能同时生成多重平面。不同光束之间的焦点差可由不同光强度的固定镜头(或透射镜)生成,还可由透过同一透镜的不同距离非平行光源生成。作为一种使用固定强度镜头生成焦点差的替代方法,每个光源可由一个单独的专门聚焦调制器提供(例如变形膜反射镜)。这样做的好处是平面之间的Z轴间距可动态调整到给定环境的最佳状态,如给定的场景、给定的观众或观众的给定状态(举例来说,如果能得到一个眼睛跟踪器或调节跟踪器,那么平面可以转移到最能代表观众兴趣的区域)。虚拟场景中的每个物体也可以被分配到一个单独的聚焦层,并且当物体移动时,该层的焦点可根据聚焦调制器调整以在纵深上能跟着物体。

使用多重光源生成不同平面的一大优势是多重焦点差可在同一光线上呈现,并能实现透明度和反射的准确像素描述。例如,一条鱼正在湖面下游走,从湖面上可以看到远处山的反射出现部分重叠,这是因为鱼和山在不同的光学距离。

7 结 论

如前所述,由于观众被迫将两眼的目光集中于某个位置,但指向不同的方向,眼睛不断地进行适应性调节和趋异,因此传统立体显示器在视觉系统内产生了疲劳信号冲突。目前的多视角体显示器只能克服一定观看距离之外的小物体的疲劳信号冲突,不能正确提供闭塞信号。我们提出了两种建立三维扫描体素显示器的办法,这些显示器可提高模仿自然的视觉感,可投影观看距离从6.25cm到光学范围之间的任何尺寸的物体,并解决了人眼调节中所有的信号冲突。

扫描体素显示器原型机可以实现商业化,产品包括轻型头盔显示器(lightweight head-mounted display, HMD)、可戴式计算机及其扩展应用或可以从远方观看的单机桌面电脑显示。使用微细加工技术(batch microfabrication techniques),可以低成本生产MOEMS(微光机电系统)扫描仪。由于红色激光二极管价格便宜,因此可低价制造便携式单色红扫描体素显示器。目前的便携式全彩色系统需要更高的制造费用。蓝色激光二极管很贵,并且寿命短,但据预计在未来几年内,成本会降低,寿命会提高。康宁公司、Novalux以及欧司朗公司都已经声明拥有MHz频率调节亮度的小型绿色半导体激光器,并不久将进入大规模商业生产。

不令人疲劳的三维显示器可用于传统立体系统常用的所有三维视图应用。然而,它们也有一些非常关键的应用。外科医生越来越多地采用需连续观看几小时显示器的微创方法(例如,内窥镜及腹腔镜检查)。三维显示器可使外科医生更好地指导体内的内窥镜,但医生必须在整个长时间的外科手术过程中保持头脑清醒,所以这些显示器不令人疲劳而且舒适是至关重要的。微创外科手术刀的操作是一种遥控操作,并且其他形式的遥控操作,如远程无人飞机的驾驶,也可从长时间观看都保持舒适的三维显示器中大大受益。最后,由于三维显示器可用于视频游戏,所以我们不能代表那些有感官障碍的幼儿,因为这些感官障碍可能在他们的视觉系统发育中产生疾病。在急救过程中医生需要花很长的时间观看显示器,而儿童更愿花甚至更长的时间集中在游戏视频显示器上。

参考文献

[1] H. L. F. v. Helmholtz and A.P. K?nig, Handbuch der physiologischen Optik.(Leipzig, L. Voss., 1909).

[2]E. F. Fincham, "The accommodation reflex and its stimulus," British Journal of Ophthalmology 35, 381-393 (1951).

[3]M. Mon-Williams, J. P. Wann, and S. Rushton, "Binocular vision in a virtual world: Visual deficits following the wearing of a head-mounted display," Ophthalmic & Physiological Optics 13, 387-391 (1993).

[4]P.A.Howarth," Empirical studies of accommod-

ation, convergence and HMD use," Proceedings of the Hoso-Bunka Foundation Symposium: The human factors in 3-D imaging (1996).

[5]D. M. Hoffman, A. R. Girshick, and M. S. Bank, " 'Vergence' accomodation conflicts hinder visual performance and cause visual fatigue," J. Vision 8(3):33, 1-30 (2008).

[6]S. K. Rushton and P. M. Riddell, "Developing Visual Systems and Exposure to Virtual Reality and Stereo Displays: Some Concerns and Speculations about the Demands on Accommodation and Vergence," Applied Ergonomics 30, 69-78 (1999).

[7]G. E. Favalora, J. Napoli, D. M.Hall, R. K. Dorval, M. G. Giovinco, M. J. Richmond, and W. S.Chun, "A 100-Million-Voxel Volumetric Display," Proc. SPIE 4712, 300-312 (2002).

[8]~[21]略.

(北京科技大学 黄秀兵,石琳译自《Information Display》07/2008)