编译/VR陀螺 豌豆
Meta CTO兼Reality Labs负责人Andrew Bosworth于12月18日在Meta官网发表一篇以“Living in the Future”为主题的长文,重点提到了2023年Meta在人工智能和元宇宙领域的发展,并畅想未来生活。以下为文章的核心要点以及正文部分编译:
比尔·盖茨曾经说过,“我们总是高估在一两年中能够取得的成绩,而低估了长达5年甚至10年的能取得的进展。”个人的突破往往是以非线性的方式积累起来的,直到突然之间,在未来的某个时刻成为焦点。俗话说,取得突破的方式有:“Gradually, then suddenly”(量变引起质变)。在Meta取得了堪称疯狂的技术进步12个月之后,我(Andrew Bosworth)认为2023年是“suddenly”的一年。
上个月,Meta庆祝了Fundamental AI Research(FAIR)实验室成立十周年。当Meta在2013年启动该实验室时,整个行业都对AI在未来将发挥的作用感到无比兴奋,而早期的机器学习应用已经在Facebook上发挥了核心作用。当时,很少有人能想象到AI会取得如此令人瞩目的进展。事实上,就在两年前,许多人可能还对此表示质疑。
展望2024年,另一个重要的里程碑即将到来:自Meta开始在Reality Labs研发未来新的计算平台以来,已经过去了10年。AI和元宇宙这两项新兴技术代表了Meta对未来最大的长期赌注。而在2023年,Meta开始看到这两项技术以产品的形式集成在一起,供多数人使用。
人工智能
这一年的亮点之一是Meta的Llama和Llama 2受到了开发者社区的欢迎,下载量超过1亿次,目前仍在不断改进。在印度,Jio对其进行了快速微调,为其5亿多客户提供了新的服务工具。在HuggingFace的开放式LLM排行榜上,以Llama 2为基础构建的项目层出不穷,并获得了较高的关注度。而这些只是托管在那里的13,000多个Llama变体中的一小部分。
与任何新技术一样,如果每个人都能使用AI,那么它将产生更大的影响。就在不久前,大多数人还无法通过文字提示生成精美的图片。但如今,我们已经在全球数十亿人使用的产品中加入了基于AI的协同创作生成图像、聊天助手、写作助手和智能图像编辑器等工具。
图源:Meta
平台的转变
根据Meta在过去一年中看到的变化表明,AI已成为人们与机器互动的主要方式。一切都已准备就绪,新型设备能够以前所未有的方式感知、理解我们周围的世界并与之互动。
而搭载AI技术的Ray-Ban Meta智能眼镜就展示了这样一条道路。Meta AI助手结合了视觉和语言理解能力,能够从用户的视角观察并理解现实世界。Meta正在智能眼镜上测试新的多模态AI功能。启用该功能后,智能眼镜可以翻译用户正尝试阅读的外语,或者为用户拍摄的照片添加有趣的主题。而且,它们可以免抬手完成多种操作,用户无需掏出手机或操作应用程序。
Andrew Bosworth展示智能眼镜的多模态AI新功能 (来源:Meta)
(Andrew Bosworth此前在Instagram透露,新的Meta多模态AI计划在2024年正式面向公众发布,目前仍在测试阶段。并亲自佩戴Ray-Ban Meta智能眼镜测试了该功能:他面朝墙上的壁挂装饰,向智能眼镜询问:“嘿Meta,告诉我你看到了什么?”他的手机则显示:“我看到一个加利福尼亚州形状的木雕,上面安装了LED灯,形成了一个美丽而现代的装饰品。”)
Meta认为,前沿AI最强大的表现形式之一就是像Meta AI这样的助手,它能理解用户周围的世界,做到全天候支持且无需提示。眼镜是实现这一目标的理想外形,它可以从用户的视角观察和聆听世界,目前已经为社会所接受,用户可以选择全天佩戴,让自己时刻保持专注。
在Reality Labs,团队投入了多年时间研究实现这一目标所需的技术,比如超低功耗、始终在线的传感器和能够理解用户所处环境的机器感知系统。Meta不仅仅是在开创一种新型AR设备,还计划将在未来数年内继续推动它的发展。
图源:Meta
MR和空间计算代表了另一条发展道路。这些技术逐步改进,成为备受关注的焦点,对过去50年一直占主导地位的个人计算模式产生了根本性影响。
多年来,让尽可能多的人使用这些新技术一直是Reality Labs的首要任务,因此在今年9月发布首款消费端MR头显是Meta在2023年的另一个亮点。
在Meta Quest 3发布后的几个月内,应用榜单排名前20的应用程序中有7个是MR内容。我们看到了人们重视这些MR体验的强烈信号。目前Quest商店中已经有数百款可体验MR的应用,其中大多数用户都尝试过MR功能。当多数人都掌握了这样一种新技术时,人们的创作能力将体现出来:
图源:Meta
随着越来越多的人接触到MR技术,开发者也学会了如何利用它的强大功能,我们将在2024年看到这一进展的加速。无论是在Xtadium上观看身临其境的NBA比赛,还是在Pianovision上通过MR学习音乐,可以看到MR提供了在其他任何设备上都不可能实现的体验。
前瞻性观点
对新兴技术进行长期押注并非易事。它不能保证能取得成功,而且需要花费大额投入。但这也是一家技术公司所能做的最有价值的事情之一,并长期保持影响力。今年,Meta最大的两个长期技术押注都趋于成熟并出现了交集,这提醒了我们对未来技术保持健康投资的重要性,也让Meta对未来十年的创新计划有了更清晰的认识。
在人工智能领域,下一步将如何发展?大多数研究人员都认为,我们仍有很多机会利用现有技术建立更大更好的语言、图像和视频模型。但还有一些根本性的突破和全新的架构有待发现,而Meta的AI研究团队正在探索这些架构,希望取得根本性突破。
这意味着,我们将继续研究“具身智能”(embodied AI)等领域,旨在建立能像人类一样体验世界的模型。我们的研究人员(Meta AI首席AI科学家Yann LeCun)认为,要实现比拟人类的AI,系统必须对世界的运作方式有更深入的了解,而我们的团队已经在这方面取得了进展,未来几年仍有大量工作要做。
在Reality Labs,Meta的研究人员正在推进一些非常有前景的技术,这些技术将使下一个计算平台的实现成为可能。多年来,这项研究取得了突破性进展,例如Quest Pro和Quest 3上的Pancake镜头,以及Mark Zuckerberg和Lex Fridman今年尝试的Codec Avatars原型。而这只是冰山一角,Reality Labs研究的突破将支持Meta能够在未来几年推出一系列行业领先的产品。
但在我提到的所有技术中,最有价值的技术是今天已经掌握在人们手中的技术。Meta在2023年取得的进展意味着生成式AI正在成为热门应用程序的核心,混合现实(MR)技术现已成为市面上主流头显的核心,雷朋与Meta合作推出的智能眼镜首次让AI以人类的视角看世界。这是Meta建设未来的过程中激动人心的时刻,更重要的是,我们就生活在这样一个伟大的时代。
参考文章:
https://about.fb.com/news/2023/12/metas-2023-progress-in-ai-and-mixed-reality/
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息