教你怎么拽词:虚拟现实与增强现实简史

Date:2017/01/18

VR技术在发展初期可谓备受挫折、命运多舛,但随着VR基础性技术日臻成熟,互联网巨头Facebook和谷歌投入VR应用开发大战,VR技术的前景正日益明朗。

VR指的是通过数字手段创造出完全虚拟的环境,人们佩戴HMD(头戴式显示器)等设备就可以畅游虚拟世界,穿越沙漠和丛林、飞檐走壁、驾驶F1赛车、一枪击毙僵尸等等。

如今,很多VR应用可以让用户感到更加真实,并减少眩晕感。在某些VR环境中,用户可全身融入其中,如果还有其他“浸入者”,感觉则会更加明显。VR迷们将这种感受称为“存在感”:彻底融入其中,而不是坐在一旁观看。

重焕生机

2014年,Facebook斥资20亿美元收购了借众筹平台Kickstarter起步的VR公司Oculus。此次高调收购使VR再次成为业界焦点,但事实上,VR已经存在数十载了。20世纪90年代初,VR电影曾一度风靡,但是画面质量欠佳,且观众需要佩戴笨重的头戴式显示器,极大地影响到观影体验。不仅如此,其另一个重大缺陷是会使用户感到眩晕,因为画面的移动比用户头部的实际运动慢几拍。不过,随着VR体验越来越真实,该问题正逐步得到解决。

2003年,位于旧金山的Linden Labs推出了游戏“第二人生”(Second Life),VR曾借这款游戏火了一把。作为一个开拓性平台,“第二人生”的虚拟世界里有自己的货币,供玩家进行虚拟物品和服务交易,并购买虚拟资产。可口可乐等公司花钱在该游戏上打广告,甚至还有几个国家在游戏里成立了虚拟大使馆。

在这之后,VR的发展陷入困境。2009年8月,16岁的VR迷Palmer Luckey,加入了名为MTBS3D的3D媒体发烧友网络论坛。经论坛创始人Neil Schneider许可,Luckey在“DIY项目”版块创建了自己的论坛,与网友讨论如何利用零件制作简单的HMD。3年后,Luckey设计的首款Oculus原型机在VR界引起轰动,不到两年,Facebook就收购了Oculus。

为什么别人失败,而Luckey成功了呢?Luckey将自己的成功归因于好时机。他在研究VR时,正好赶上智能手机诞生。智能手机推动了传感器、陀螺仪、小屏幕等VR零件的普及,使其重量更轻、价格更低。同时,Luckey的成功也得益于众多技术突破,例如,将画面响应用户头部运动的时延降到最低的技术。

也有观点认为,摩尔定律可能是Luckey成功的真正“功臣”。华为媒体实验室战略负责人Jose Alvarez指出:“随着技术的改进,每瓦计算能力也在提高。这就意味着VR的眼镜和计算机屏幕会变得更加优质,观众可以畅享高清画面。”这正是摩尔定律在现实中的应用——每隔18个月,处理能力就能翻倍,软件也会变得更加先进,这就极大地改善了画面质量。

VR还不是消费级产品,现在预测VR“杀手锏应用”有哪些还为时过早。目前,其主要用于两大领域:娱乐和医疗保健。

用“颠覆者”这个老生常谈的词形容VR在娱乐行业的应用再合适不过了。VR的确可以彻底颠覆娱乐行业,为音乐会、球赛等虚拟活动带来前所未有的真实感。不仅如此,VR还可以给MMORP(大型多人在线角色扮演游戏)重新注入活力,“第二人生”和“魔兽世界”就是最好的例子。十年前,MMORP曾风靡一时,但是,当智能手机取代网吧成为年轻人的主要上网途径时,MMORP便开始逐渐衰退。如今,VR令其重生。

Alvarez说:“VR可以提供更高的分辨率、更快的数据传输速度和更强大的计算能力,为游戏创造近乎真实的环境,因此逐渐为游戏行业广泛采纳。此外,VR产品正日渐满足好莱坞和营销活动的预期。”

VR创造新世界的能力正是电影行业所需要的。据《洛杉矶时报》报道,好莱坞正大力开拓电影行业的新疆域。Steven Spielberg和Ridley Scott等一线导演正与VR公司合作开发电影内容。咨询公司Digi-Capital预计,VR将在2020年前创造300亿美元的收入,其中游戏和电影收入占很大比重。

VR在医疗领域也展现了巨大潜力。正如飞行员使用模拟器在驾驶舱训练驾驶技能一样,外科医生也可以使用VR进行复杂的远程手术。虚拟世界对创伤后遗症的治疗也很有帮助:通过可控的方式,向病人重现使他们感到压力的场景,帮助他们逐渐克服这种场景给他们造成的压力和恐慌感。

如何加速发展?

如何推动VR的普及呢?VR玩家主要关注如何在“质量和可获得性”方面做出权衡。Facebook和谷歌这两个最大的VR拥护者成为不同的代表。

Facebook代表“确保质量”的一方。他们认为,要想普及VR,最重要的是竭尽所能提供最优质的体验(即降低时延、提高分辨率等),而不考虑目前是否有大量受众愿意为之买单。他们指出,质量尤为重要,因为如果在VR发展初期出现一两个劣质应用,就可能会使用户感到如今的VR与20世纪90年代时糟糕的VR并无二致。但是,要想获得“优质体验”,需要多大代价呢?

以谷歌为代表的群体则站在另一方,他们表示,创造需求的关键是要尽可能降低VR设备价格,并提高可获取性。谷歌Cardboard的可折叠头戴式显示器,只需在硬纸板前配上两个镜头,后面插入手机即可。《连线》杂志曾对其赞美有加:“谷歌Cardboard打开了通往VR世界的大门。虽然要推出最佳的VR产品,谷歌还有很长的路要走,但是Cardboard出色地达到了人们的预期:进入虚拟世界。使用这款产品后,你一定会继续关注谷歌的其他VR产品。”

当然,以Facebook和谷歌为代表的双方并没有阻碍对方的发展,而是共同组成细分市场。真正的问题是,哪种应用才能使VR成为必需品?虚拟化Facebook能使社交媒体更具社交性,谷歌则能使地图和搜索功能更加直观,用户在使用时无需一页页点开。毫无疑问,这两家公司都想成为VR互联网Metaverse(一个虚构的网上VR空间,现称为“虚拟实境”)的主页。

五大难题亟待克服

问题在于,该趋势虽然存在,但在实现上有诸多难点,要想普及浸入式技术和应用,需要克服以下五大难题:

用户不再专注

斯坦福大学的Byron Reeves教授近期研究了部分学生使用智能手机和笔记本电脑的习惯,研究结果表明,学生们切换任务的速度非常快,平均注意力驻留时间只有19秒。而一些其他类似的研究结果也都表明:人类正在进入“频繁切换模式”。

这意味着什么?Tom Goodwin声称:“我们对各种刺激越来越上瘾,也越来越难以专注在某一件事情上,分散式注意力正向常态发展。试想一下,我们每天在各种媒体上消耗大量时间,还要吃饭睡觉,这究竟是怎么做到的?主要原因就在于我们会见缝插针,快速消化信息。”

我们的生活方式为什么会变成这样?Reeves教授认为,频繁切换任务,恰恰从侧面说明我们掌控了生活的主动权。“人人都想拥有主动权,喜欢一切尽在掌控之中,可以自由切换内容。可能信息还没看完,人们就不再关注了,直接关掉去干别的。”

有观点认为,浸入式体验有望改变或者修正人类的“频繁切换模式”,但Reeves对此并不乐观。他说:“假如我有一副VR眼镜,我可能会全身心地沉浸其中,忘了去切换,但对于大多数人来说,他们的注意力或许能够维持久一点,不过稍微过段时间,人们还是会渴望切换到不同的内容上去,这是现代人的天性。”

屏幕越来越多

人们在日常生活中接触的屏幕数量正在激增,这无疑促使人们的“切换模式”更加频繁。时代公司宣称,数字原生代几乎每隔2分钟就切换一次媒体平台(这其中涉及到很多屏幕),而35~55岁的人,每隔3分钟切换一次。

问题在于,每个屏幕所涉及到的操作系统几乎都是相互独立的,这意味着还有很多协同工作要做。多屏幕的存在,无疑是浸入式体验实现的重要障碍:如果用户在体验VR的时候必须摘下头戴式显示器才能接电话,或者在观看4K节目时还要留意平板电脑才能查看最新的社交媒体评论,那还有何浸入式体验可言?这样的例子不胜枚举。

技术瓶颈

4K、AR、VR等下一代浸入式体验都需要解决很多用户端的技术问题,例如在网络层面,带宽和时延显然是主要的瓶颈之一。浸入式技术的使用,需要消耗极大的带宽。Oculus VR首席科学家Michael Abrash估计,在VR体验当中,每只眼睛需要16K x 16K的画面分辨率,才能再现接近真实的图像。要传输如此庞大的数据量,目前的网络还远远无法支撑。

时延是当前网络所面临的另一挑战,因为仅仅传输海量数据是不够的,还需要对数据进行实时扫描、传送和重整,才能实现浸入式体验。以头戴式AR显示器为例,系统需要将摄像头捕捉到的现实世界视频和音频信息上传至云端进行处理,再将反馈回来的数字信息精确叠加在现实画面上,而且不能让人感觉到滞后,这要求时延必须少于100毫秒,但现在的网络实际时延是其20倍还不止。

ROADS体验

浸入式体验是否可以脱离于网络而实现?回答是肯定的。当前的浸入式技术几乎都是封闭的系统,无需联网也能实现。但是数字原生代的要求更高,而他们终将统领这个世界,封闭而独立的系统,显然无法满足他们随时随地的体验需求。

Tom Goodwin表示:“在21世纪初,人们通常把手机称作‘第二屏’。而现在,智能终端已成为人们接触的首要屏幕,其他屏幕都已退居其次。”这意味着随时接入网络已经成为屏幕的主要作用之一。对此Goodwin解释称:“近距离和即时性使得最近的屏幕成为我们联接网络的主要入口。”

VR所使用的头戴式显示器距离我们眼睛最近,因此,它必须能够实时在线,便于交互。该体验称为ROADS,即实时(Real-time)、按需(On-demand)、全在线(All-online)、服务自助(DIY)和社交化(Social),这是未来用户对于互联网体验的基本需求,浸入式体验当然也不例外。

行业质疑

受限于技术条件和产品化的困难,浸入式技术的发展并不是一帆风顺。在VR刚刚诞生时,由于人们的期望过高,体验不佳,还会造成晕动症,因此饱受诟病。AR也遭到诸多质疑,人们甚至还发明了Glasshole(由Glass和asshole拼起来的骂人词汇)一词对其加以嘲讽。很多专家都认为,浸入式技术用处不大,只是供人把玩的小众游戏,永远不可能像智能手机一样普及。

那么,人们能找到安静的地方,不受外界干扰,而且这个地方要有可靠、优质、低时延的网络接入吗?或许可以。

增强现实:融合虚拟与现实

现实世界再也不像以前那么能锁定我们的注意力了,各种设备屏幕不断地分散人们的注意力,且这个趋势还在加剧。Tecmark的调查显示,每个用户每天平均查看智能手机200多次,40%的被调查者承认会条件反射式地去检查邮箱,66%的人会条件反射地查看Facebook。扣除睡觉时间,每天200次看手机的频率就意味着不睡觉时每5分钟看一次手机。

技术权威人士Don Tapscott、斯坦福大学Byron Reeves教授等专家认为,当前的数字原生代比前辈人更加擅长任务转换(从而更擅于应对干扰)。数字原生代经常“一手处理现实任务,一手玩手机”。但没有心理学家能够确定,人类思维已经进化到可以同时处理二项任务而不相互干扰,而人脑在这方面的局限短期内也不会改变。

人类能够放弃电子屏幕么?很难!

技术能提供解决办法么?可以!

当下的情况是,对于人的注意力来说,真实世界和虚拟世界是相互排斥的,两者对人的注意力是相互竞争的,而AR能融合真实和虚拟世界。

源于1990年代的“增强现实”,在2013年因为谷歌眼镜的热潮,而进入大众视线。然而,谷歌眼镜(至少是其原迭代版本)离真正的AR还有差距。华为媒体实验室战略负责人Jose Alvarez指出,因为谷歌眼镜只提供文本和简单的图画的叠加,只能算对现实的补充而不是增强。

业界所理解的AR(增强现实),是对现实世界加上虚拟层,从而增强现实世界的效果。这个定义很重要,因为AR既是原因也是结果,至于它的实现形式则无关紧要,既可以是头戴式设备(如微软的HoloLens)、也可以是智能手机或者平板电脑(屏幕显示的照片上有箭头和其他指示型标志),甚至是其他方式(3D全息增强的2D地图)等。

华为媒体实验室的Jose Alvarez表示:“实现AR最大的挑战之一就是计算能力。计算机视觉的算法必须非常强大,才能让机器理解事物并精确追踪物体。目前,只能采用更加强大的半导体,否则很难在功耗低的移动设备中实现计算机视觉能力。”

此外,网络必须能处理大量现实世界数据,识别并准确测量现实物体,然后将虚拟信息反馈到这些物体上。Alvarez认为:“AR对网络的要求很高,要想捕获现实物体并加上虚拟信息标签,需要极大的网络带宽。AR首先要通过网络把画面上传到服务器进行分析计算,然后再把结果传回显示界面上,这就产生了时延,而AR对时延的要求是小于100毫秒,当前网络还无法满足这一要求。”

上述这些挑战让AR在日常生活中难以普及,至少在短期内无法实现。因此,AR目前只能在少数特殊的场合得以专门应用。

目前看来,AR最合适的应用场景是指导类应用。Alvarez表示:“当前AR可以应用在汽车导航。如果你开车时搞不清方向,AR能让方向箭头自动叠加显示在挡风玻璃上,这样你就能在箭头指示的情况下继续开车。这些箭头是为你的路线定制的,非常实用。假如你开车去拜访朋友,那你朋友的住址可能就叠加显示在AR路途上,这完全能够实现。”

此外,AR还可以应用在旅游业。当你来到一个陌生城市,你可以将自己的移动AR设备指向一个建筑物,假如这个建筑物是个旅馆的话,设备就会自动告诉你房间价格,那么你就能在设备视图中预订房间。这也是很可能实现的。

AR指导还能被应用在远程任务操作中。未来借助AR,一个年轻的医生也能在云端人工智能或者远程高级医生的指导下完成复杂手术;一个初级的技术工程师也能在远程高级工程师的指导下完成复杂的修复工作,所以AR应用前景无限广阔。

事实上,很多人认为AR的商业用途甚至使得其前景要比VR(虚拟现实)大。人们本能地认为,与创造虚拟世界的VR工具相比,我们更需要AR设备,来完成现实世界的各种任务,减少对手机屏幕指示的依赖性。

Alvarez认为人们应该以更加积极、长远的眼光看待AR,他说:“AR将会强化我们的认知能力,让人类获得以往不具备的能力。参照搜索引擎的历史,就应该知道,AR的未来一定很光明。20年前,谁也没有想到我们能够如此轻松地获取海量信息,而现在我们对强大的搜索引擎早已习以为常。”

未来我们对AR的感受将和现在对搜索引擎的体验很类似。AR将会极大丰富和便利我们的生活,让我们对其习以为常。我们的认知能力也会获得极大提升。比如我们不会在陌生城市迷路,也不会在聚会上看着对方眼熟而无法想起对方的姓名。AR能够让人们免除这些忧虑,解放我们的思维,让我们集中精力从事其他重要事务。

AR/VR将是人类下一个,也可能是最后一个待开发的宝地。谁能够最先洞悉未来,谁就最可能获得极大收益。