编译/VR陀螺 云吞
自结束智能手机业务后,诺基亚便一直在寻找新的商机。在几年的调研后,来自芬兰的公司决定进军VR 360度相机领域。
诺基亚在今年三月发布了当时售价6万美元的OZO相机,并且在8月把价格降低到了4.5万美元。目前,该产品已经在多个市场开始发售,公司也在不断推出软件和服务来满足刚刚兴起的VR相机行业。
我们在加州硅谷的诺基亚研发基地与Guido Voltolina,OZO的领头人进行了一次访谈。Voltolina介绍了OZO在动作捕捉和同时处理数据方面的强大优势,并且谈到了公司接下来在VR方面的拓展计划。
(Q- VENTUREBEAT A- Voltolina)
Q:能否谈一下您为何决定制作OZO VR相机?
A:其实这个项目和部门的名称叫做“存在捕捉(Presence Capture)”。早在Facebook还没有收购Oculus之前,我们就已经注意到VR正在到来。显而易见的是,VR的一部分将会是基于计算机的体验,如VR游戏。但我们当时想到:“如果VR变成一种新的媒介,那么就不仅仅是计算机体验这么简单。人么你会想要去捕捉一些东西,包括他们自己、他们的生活以及改变世界的事情。”
我们必须考虑究竟是什么设备能够尽可能多的收集数据,然后重现VR让我们沉浸的那种真实的感觉。我们现在仍然可以看到2D 360度图像,但这几乎是我们在制造“真实存在于那里”的3D视听效果时的一个“副作用”。
我们的团队开始按照这个想法建造设备。我们设计了一款一体的产品,而不是像许多人那样把许多照相机集成在一个架子上。OZO不是一台好的2D相机,但绝对是一台出色的VR相机。整个相机的外形最终看起来像一个头盖骨,上面的摄像头分布与人类的瞳距相似。相机有八个摄像头,每个摄像头所能拍摄的范围都有很大的重叠。我们能够为左右眼分别捕捉两层像素,并且完全符合你的瞳距。许多相机集成架上的摄像头距离隔得太远,放在VR中会使得物体看起来很大。
在这套方案出来后,我们又安装了八个麦克风,使得拍摄时声音也可以被同步收录。通常情况下,如果我听到那个角落传来声音我会下意识的转身。而在OZO上,我们能够做到当声音传来时,摄像头可以转动确切的角度来面向声音,尽管相机的后部并没有摄像头。我们为相机集成了3D音效和3D视频,因为真正的沉浸感需要这两个因素。
当你观看2D电影时,导演执导你正在看着屏幕,因此能够通过切换镜头来表现剧情的发展,或者根据对话的进度来拉近或拉远镜头。而在VR中,声音是吸引你注意到不同地方或人物的关键。
OZO的基本概念是捕捉现场的活动。人们可以去到平时因为各种原因无法去到的地方。就像如果埃及的金字塔被摧毁了,我们就再也去不了了。但是如果有关于金字塔的VR影像的话,我们就可以像在现实中一样参观它们。你也可以把他看做一台回到过去的时光机。你可以捕捉一个事件并且经常性的重复感受它们。也许20年后你的儿子和女儿可以像你一样再一次感受今年的感恩节晚餐。
Q:您为什么认为这是一个好的决定?
A:这就跟照片和视频技术的发展一样。一开始黑白照片只对一小部分人普及。富裕的家庭每年都能拍摄一次全家福。但是现在,我们每个人的手机上都有一个高分辨率的摄像头。视频出现之后,人们就会花钱雇人来拍摄整个婚礼的过程。然后家用录像和数码相机诞生了,但是它们相互之间并没有取代。照片并没有取代文字,视频并没有取代照片。我们仍然发短信,仍然分享照片,仍然在Youtube上传视频。我们用不同的媒体来记录不同的事情。
VR只是另一种媒体。作为一个新媒体来说,我们关注如何用VR来捕捉现实生活。同时我们也要考虑如何传送视频和输出视频的技术。OZO诞生之后我们又制作了OZO Live和OZO Player。我们将这些软件授权给视频制作公司,让他们可以制作他们自己的高质量的VR播放器,或者流媒体直播OZO拍摄的视频。
举个例子。我们正在奥斯汀城的一场音乐会上。一个制作公司在舞台的四周摆放了8台OZO。这就是我们最开始的目标——演唱会第一排的体验很棒,但是我想去普通人去不到的地方。我想去到舞台上,站在Mick Jagger或者谁的旁边。在现实生活中你是没有办法做到的,无论你愿意花费多少钱。
Q:OZO和其他的360度相机有什么不同?Facebook也推出了一款类似相机。
A:目前VR拍摄大部分的解决方案都是多台相机结合,每一台都需要固态硬盘卡和电线。因此如果是25台相机的话,就会有25张固态硬盘卡、当你拍摄时,你没有办法看到你拍了些什么。只有在输出所有视屏并且后期剪辑之后你才能看到成品。
OZO最大的不同点就是尽管它有8个摄像头,但是我们制作了一个中控系统来实时处理和合并所有的数据。OzO在输出时仅仅用一根数据线输出到你的文件夹里或者你的头盔里。你能够实时看到和调整相机正在拍摄的东西。对于VR相机来说,能够看到相机正在拍摄的东西就是关键的不同点。
OZO的另外一个特点是,它是一台独立的、用电池供电的设备,并且仅仅用了一张固态硬盘卡。你可以把它装在无人机上、汽车上进行拍摄,十分的灵活。整个相机只有一个人头般大小,而圆滑的设计是一个很大的有点。一些可以安装16个或25个相机的架子显得太大了。
如果你想要捕捉不同场景下的景象时,你可能会用一个安装了16个相机的架子。但是如果你需要更多的相机怎么办?并且其中的相机很有可能会出故障。你对相机数量的需求越大,出故障的可能性也越大。
Q:OZO的售价是多少?
A:每个OZO卖4.5万美元。它的首创性是推动价格增长的重要因素。相机一直以来被认为是单镜头的、只有一个传感器的。所有的零件能够让你拥有很好的分辨率,但只有一个传感器。当你将8个摄像头合成在一起,SOC芯片要协调所有的传感器,而这样一个理论上的系统是不存在的。我们不得不创造了一个FPGA(现场可编程门阵列)来处理这种情况。相机可以以每秒30帧的速率同步合成2K乘2K的视屏,这一数据速率是庞大的。目前并没有一种附件可以在承担得起的数量下实时编码8个流数据。
在传感器方面,我们采用了正方形传感器,因为从算法上来说这是对鱼眼镜头最优的。目前大部分传感器都是长方形的,这会使得许多传感器根本不会被用到。我们也需要所有的图片被充分合成。如果有许多滚动快门的话,曝光后的同步率是永远达不到100%的。你会得到8张不同的图片,在重叠时没有办法完全匹配。我们必须使用全局快门,使用的人不多并且更加昂贵。
所有的镜头都是定制的,因为相机的算法之前并不存在。所有的配件几乎都是为了最终的拍摄目的而创造的。正是因为之前没有人使用过,这些配件就显得格外昂贵。
Q:如果相机以这个价格出售的话,目前会有什么样的买家呢?
A:我们今年二月起在北美开始销售OZO。现在我们已经拓展到了全球,包括欧洲和中国。我们主要的客户是已经在制作VR内容的工作室。当他们看到OZO时,立马就明白了它的强大之处。这台相机很贵,但它能够节省下来的时间,特别是在拼接和后期制作阶段,是完全划得来的。
你可以想象,当你用分别的相机拍摄时,你根据一台相机的位置调整了演员的位置,然后用另一台相机继续拍摄,而且最后才可以看到底拍了些什么。如果要重新拍的话,需要花费的金钱是巨大的。
目前VR体验主要来自于电影的附加市场。这可能是某一部电影的VR版本,或者VR版的广告。而直播的工程是很大的,我们每周都能看到有人在实验VR直播。我们刚刚结束在中国直播草莓音乐节。
Q:目前来看哪一种模式比较受欢迎?直播还是录播?
A:这取决于影片的主角是谁。是不是直播并不是很重要,重点是明星是谁。我们曾经直播过《爱丽丝梦游仙境》的首映礼,歌手Pink在首映礼上进行了现场演唱。当然这吸引了很多观众。我们也和OneRepublic合作了一首新单曲的MV,他们发布了2D的MV然后又推出了VR版。这不是直播,但是在社交网站上,粉丝们都很激动能够以不同的角度来观看VR。粉丝们可以通过一遍又一遍的观看来发现新的东西。
另一个非常受欢迎的是电影《彼得的龙》VR版。在这个过程中你可以像真的一样骑在一条龙上飞翔。你可以看到周围的翅膀和尾巴。这个视频就像一场空中飞行一样。你可以飞过新西兰。而你骑在一条龙上对于许多粉丝来说都是极大的吸引。因此故事和故事里的角色是很重要的,如果有明星的话就会更好。
Q:您下一步打算做什么?是否有一份计划书?
A:下一步将会有两个方向。一是完善我们的解决方案。如果数据量越来越大的话,我们就需要更加高效的传输这些数据。去年是Cardboard的一年。而今年我们见证了第一台Oculus和HTC头显的上市。更多的更加清晰的设备将会不断上市。沉浸感的程度也在不断上升。
同时,至少了解2D 360度视频的人数也在上升。这给了我们发展沉浸式VR的动力。我们目前的想法是大力发展OZO Live和OZO Player。
Q:所以会提高分辨率吗?
A:当然是分辨率,但总体上来说还是质量。我们总是说分辨率是因为这样描述质量比较通俗易懂,但是很多时候分辨率已经高到肉眼无法分辨。视觉质量正在不断提升,拼接质量也是如此。我们已经发布了3个版本的OZO Creator软件,可以让你进行高质量的3D拼接。
另外一个领域是用多个OZO进行现场直播。我们会支持超过一个相机的VR视频制作,还会和讲解相结合,或者在不同的地方视频制作等等。
Q:价格有可能降下来吗?
A:我们一开始的售价是6万美元,夏天时已经降到了4.5万美元。这是因为最开始几个月我们生产最早一批机器时,我们不确定能不能为全世界大规模生产。我们决定从北美开始试水,看相机能不能正常的使用,然后再决定要不要规模化生产。八月时我们做出了决定,价格也随之而降。鉴于这是一款专业级相机,许多出租设备的公司也会拥有这台设备,就像出租索尼或者松下的高端摄像机一样。
Q:相机的配件会不会在将来变得和专用集成电路一样?你认为可以达到规模经济吗?
A:这是有可能的。我们总是要权衡生产规模和时间。如果一个集成电路要高效的话,就必须要有数十万个小的元器件。同时你的产品也不能换代太快。以数码相机来说,尽管它们在更新换代,但是每一代的变化都不会太大。以VR相机今天在市场中的地位来说,我们还处在非常初期的阶段。只要经济上达到了专用集成电路一样的水准,这个设想就会实现。
Q:如何评估VR内容的增长?能够计算出一共输出了多少时长VR内容吗?
A:我们会一直监测3或4个主要的主要的领域。第一个就是头盔设备上的下载率。这一数据包含了Cardboard,但是会分成不同的种类计算,因为你很难知道是否一个人在使用Cardboard。也许你把他给了你的孩子,但最终被丢在了垃圾堆里。但是像三星Gear VR就不同,尽管我们不知道使用的频率,但至少我们有能力进行计算。而且当人们花了500美元或700美元时,这台设备还是会得到使用的。
高性能头盔的安装基础很重要,然后流向VR制作的投资金额也很重要。这些VR内容大部分都是为了市场营销,比如宣传电影和产品。你的受众越多,就会有越多针对这些受众的营销。这是另一个重要的驱动力。
我们也会监测主要的VR内容平台,比如Oculus Store、Little Star、迪士尼VR等等。有多少内容你可以观看呢?与一年前相比,这个答案是令人震惊的。从数十到数百,我们很快就会有成千上万的内容。尽管这其中有很大一部分并不总是令人惊叹,但是总体的质量还是在上升。
顶级VR体验的质量有了质的飞越。你也许不会记得第一条流行的短片内容,它是关于一个男人和他的狗在弹钢琴。当时人人都觉得很惊叹,但你现在再看就会觉得特别无聊。而新的视频总会让你去追寻。
有一个名叫Magnopus的工作室,他们制作的电影《雨果》拿了奥斯卡奖。这个工作室制作了一个VR短片叫做《The Argos File》,并且拿了奖。他们用了OzO进行拍摄。这个短片是关于动作和犯罪的,你可以通过受害者的眼睛来感受故事的进展。整个影片发展非常快,你可以感受到那种真实的紧张感。
Q:所以360度相机会很快发展为成熟的行业,还是说仍处在试验阶段?
A:我们认为这是一个很有前景的行业,但还没有到达成熟的阶段。最佳的比较对象是功能机和智能手机。早期的功能机与iPhone相比,简直是天壤之别。你只能用那台电话来打电话,电池能够支持几个小时。现在VR行业正处在这个阶段。
当然我们很快就会进展到iPhone的那个阶段,但是具体怎样是很难想象的。对我们来说一个基本的常识是:我们世界中的每一幅图片都是长方形的,就算IMAX也不过是面积很大的一块长方形屏幕。但是像《我的世界》和其他的VR游戏一样,原本矩形的世界变成了360度。现在孩子无法理解为什么我们之前如此狭隘。
对我来说,这一概念就是能够提升VR的东西。当然我们不能给你仅仅依赖于这一系数。功能机和iPhone相比,这一系数是惊人的。谁都不知道在前面等待着的是什么。PS VR已经是非常大的进步。这一设备已经可以在你的客厅安装和使用。更多的环节正在被打通,这也是为什么我们相信行业在发展的原因。
我们需要不停的创新和尝试新的事物,就像OZO一样。前路有太多不确定性,这也是第一个吃螃蟹的人必须要承担的风险。
Q:和索尼的合作将会开发更多的VR内容?
A:当然。我们和迪士尼达成了合作协议,包括迪士尼旗下所有的工作室,像是漫威、卢卡斯、ABC等等,一共有13个还是14个。这已经是非常大的进步。索尼影业也包括了索尼音乐。从电影到电视节目到音乐录影带都有。当我们在商谈合作时,我们总会看得更远。
我们也和华纳兄弟合作生产。电视剧《重案组》就使用了OZO拍摄,但仅仅是其中的某一集。与一个大集团合作是非常好的,因为我们可以涉足更多不同的娱乐领域。
Q:是否已经有人开始进行更长时间的视频拍摄?
A:已经有人在进行多集电视剧的拍摄。导演了《Grease》的Randal Kleiser创作了10集的VR剧《Defrost》。在这部剧中,你是一个在冬眠的人的视角,然后你逐渐的解冻。你见到了你的家人,但是你已经不记得他们了。所有的表演都是围绕你的。你坐在一个轮椅上,然后被推到了医院里。每一集的时长大概是15分钟,而我已经能看到制作出60或90分钟时这种类型片子应该有的方向。直播方面已经能达到60分钟。
Q:OZO是否还有别的应用例子?我曾经看过从篮球场馆顶部拍摄的视角。
A:有一个人带着OZO爬珠穆朗玛峰,而我们甚至没有帮助他。他就这么买了一台OZO然后爬了上去。他制作出了在一号营地和二号营地的体验。然后还有运动,可以把OZO放在第一排,放在篮子里或者放在赛车上。人们去过各种各样神奇的地方,比如危地马拉的火山里。
与普通的纪录片不同,你可以自由自在的环顾四周。当然还是会有故事的成分,并且也会有娱乐的成分。如果是静音的话就会显得非常无聊。如果就你一人行走在热带雨林中,很快你就会失去兴趣。但是如果有人为你介绍你看到的东西,并且同时你可以随意走动,那么就会很有意思了。
在新闻中,你可以想象,你正处在事件的中心,就算是记者也无法真正知道究竟发生了什么。你的视角不受束缚,这是很庞大的一个场景。你可以不断重复观看一个事件,每次都会有新的发现,因为你有全部的数据留存。
红牛经常在极限运动等方面运用VR。还有新闻、突发事件、音乐等等。VR体验不是视频的替代品,还是补充品。试想你来到我家一起观看一场比赛。我们正在盯着屏幕,然后社交媒体上有人说:“嘿快看下主队的板凳球员。”然后你就可以戴上VR然后去看看到底发生了什么,同时我们仍然在电视上看着比赛。
Q:我喜欢VR音频工作的方式,包括音频是如何将你带入那个特定的场景的。
A:当然。我们认为音频驱动了一半的身临其境的感受。如果仅仅使用立体声和混合声是并不准确的。
我很好奇这一技术将去往何处。有一些早期的相机拥有多达36个模块。为什么不用这么多?难道不是更好吗?
折衷之处就在于数据的量和你能得到的好处。我们用8个摄像头创造了两层像素。但是我们在数据的某个节点就停下了,因为我们想要监控实时直播的情况。我们想要的是实时可行的工作流。就好像一些相机可以捕捉大量的百万级像素,但是你要转换数据才能看清楚图片。
同时还有拼接缝的问题。如果你增加相机的数量,确实是可以增加分辨率,但同时也有更多的拼接缝需要修补。然后成本也是需要考量的。拼接缝越多后期需要计算的也越多。如果非常有趣的一幕上出现了拼接缝,我的大脑就会下意识的记住,然后在之后的剧情中我就会特意去留意。
我们减少了摄像头的数量是因为我们想要更加灵活的处理拼接缝的问题。我可以把这条缝移左或者移右来避免上述问题。但如果缝太多的话,无论怎么移都会影响到附近的缝。
您如何看待相机的应用问题?目前有好莱坞的电影摄像师、有普通消费者、还有GoPro的狂热爱好者。看上去不同的相机适用于不同的人群。
市场的顶端就是所有的金钱和时间很充裕的地方。如果我在顶端,我可以很好的拍摄和完善我的作品。这也意味着我能捕捉到的数据是最好的,因为我有大把的时间和金钱。
但是当你的预算变得紧张时,不仅是在时间、金钱上,还有可用的人员。并不是说工作人员没有按照步骤来工作,而是他们一人身兼多职。在一个大制作里有摄像师、有灯光师、有音效师、有助手等等,但是一个小制作里,可能只有五个人左右,一个人会同时是导演和摄影指导,另一个人会同时是灯光师和音效师。
最终出现了一个人就是一个团队的情况,像是那些在战争地区的自由记者,拍摄婚礼的摄影师或者为大公司制作培训视频的人。这些制作的价格在5千美元到1万5千美元之间。他们必须工作得很快,因为他们要在一个星期里挣到那些钱。前期的准备时间变得非常宝贵,后期拼接和输出也非常重要,因为要迅速的给客户看然后得带报酬。
OZO现在正在往独立制作的方向发展。它对一人的团队非常有用,但是价格还是过高了。如果我拍摄婚礼,我可能会去租一台OZO。我很有可能同时做普通的拍摄和VR拍摄,把VR拍摄作为我和别人的不同之处。就算客户并不想要VR版本,也会趋向于拥有这项技术的人,因为这代表着最先进的水平。
2D 360度视频和VR视频正在迅速发展,但是离普通视频的普及程度还很遥远。就是像我说的,我们仍然处于功能机的时代。
听起来我们目前正处在一个很有趣的区域中。
确实是很有意思的。对我来说最迷人的就是我们看着同一个视频却有着不同的体验。我可以和你分享许多你没有注意到的事情。另一个人可以再跟我们分享我们俩都没有注意到的事情。从社交的角度来看是很神奇的。我们同时观看并不意味着我们看到了同样的事。也许第二次我会试着从你的角度来观察。这变成了一种非常有趣的机制。
Q:在即将到来的CES上你们会有什么新动作吗?
A:当然我们会有一些新的成果。总体上来说我们一整年都在更新我们的产品,因为我们设计的方面比较多。我们目前有相机,有OZO Live软件,有OZO Player还有其他的可以让观看体验、拼接效果和直播效果更好的产品。
Q:诺基亚在这个项目中参与了多少?有多人参与其中?
A:几百左右。诺基亚科技一共有800到900人,包括数码健康、数码相机和授权团队。当然,我们一直在招聘。
Q:大部分工作在何处完成?芬兰吗?
A:主要的R&D部门是在芬兰,这是这个项目诞生的地方。现在大概是65%在芬兰,35%在加州的森尼维尔市。加州的竞争十分激烈,有太多的VR企业和大把的VR投资。专业的知识成了稀缺的资源,就像硅谷任何一次科技浪潮一样。只要新的浪潮一出现,最集中的投资就会在这里展开争抢。
Q:那么AR呢?您是否有所关注?
A:当然有。AR是另外一个方面,目前有两种含义。一个是你周围真实的AR,另一个也是AR视频捕捉。你可以想象的是,我可以捕捉到一个地方的一段视频,然后通过AR来加工这段视频。这并不仅仅像字幕或者叠层,每一次的展示也并不一定一样。
同样的,你看的是同一个视频,但是观看方式的不同和操作方法的不同会让你获得不同的信息。有可能在同一段开会的视频中,出席的人不一样,或者房间有所变化。
你会注意到一些融合正在产生。电脑产生的VR和录制的VR将会很容易的合并在一起,尤其当播放平台是一样的时候。
关注微信公众号:VR陀螺(vrtuoluo),定时推送,VR/AR行业干货分享、爆料揭秘、互动精彩多。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)