AI AR融合新机遇,雷鸟创新与阿里云共创智实融合世界,AI与AR碰撞,雷鸟创新携手阿里云开启消费电子新纪元

本文围绕AI与AR的融合展开,介绍了AR眼镜在当下科技发展中的重要地位和发展趋势,着重讲述了雷鸟创新与阿里云在AI AR领域的合作,包括合作的背景、具体成果以及未来的发展方向等内容。

AI AR融合新机遇,雷鸟创新与阿里云共创智实融合世界,AI与AR碰撞,雷鸟创新携手阿里云开启消费电子新纪元

当下,科技领域正经历着一场前所未有的变革。AR(增强现实)眼镜,正凭借其独特的魅力,被广泛认为是取代手机成为下一个超级终端的有力竞争者。近两年来,随着Meta、苹果等科技巨头纷纷入局并大力投入,再加上供应链的日益成熟,AR眼镜逐渐走进了更多人的视野,成为这一波XR(扩展现实)热潮中的最大受益者。

与此同时,AI大模型的横空出世和飞速迭代,宛如为第四次工业革命装上了强大的引擎,它以势不可挡的姿态革新着各行各业,不断创造出全新的商业模式。

在2024年下半年,不带显示的AI眼镜如同一颗耀眼的新星,席卷了整个科技行业。相关机构预测,其未来市场规模将超过千亿美金。AI眼镜的火爆,也让更多人坚信,“下一个iPhone时刻,将由AI AR创造”。

然而,作为连接物理世界与数字世界的重要桥梁,AI AR并非简单的“1 + 1”加法运算。AR的应用场景复杂且特殊,对反应速度和交互方式都有着极高的要求。

雷鸟创新作为国内AR眼镜行业第一梯队的企业,一直致力于AI与AR的融合研发工作。公司在AI生态领域投入了大量的人力和物力,积极探索AI AR的最佳融合方式。面对当下AR产品AI体验不佳的问题,雷鸟创新与阿里云携手合作,共同探索出了一条智能化合作创新共赢之路。

AI AR,消费电子的新机遇

相较于手机、PC等传统终端设备,AR的发展历程相对较短,直到近几年才将落地产品推向大众市场。不过,随着政策的支持以及AI大模型的加速发展和落地应用,消费电子行业迎来了新一轮的发展机遇。

机构统计数据显示,2024年上半年,国内消费级AR设备销量同比增长49%,这一数据充分反映出市场对AR产品的广泛认可。多家AR公司负责人也多次在公开场合表示,AR眼镜将是AI的理想载体,在空间计算时代,它将展现出独特的价值和潜力。

IDC观点认为,AI在硬件搭载方面有多种选择,手机、PC、AR眼镜都是不错的载体。但对于AR这种轻量级硬件而言,AI的加入将极大地丰富其应用场景,尤其是在生活助手类应用中,能够显著提升使用的便捷性和准确性。

中商产业研究院在报告中指出,在AR设备中,AI技术能够帮助设备更好地理解用户的意图、行为和所处环境,从而为用户提供更加个性化的体验。随着相关技术路径的逐渐成熟,未来AI AR眼镜有望在效率提升类场景中实现突破,并向消费级市场放量。预计短期内,AI AR眼镜的出货量将达到百万级别,中期有望实现千万出货量,未来更有望成为下一个过亿的创新终端产品。

雷鸟创新是国内AR产业的早期探路者之一,自创立至今已有三年多的时间。公司仅用了不到一年的时间,就登上了中国消费级AR市场占有率第一名的宝座。在AI AR的探索方面,雷鸟创新也始终走在前列,并多次在公开场合强调公司在AI与AR融合方面所做出的努力。

雷鸟创新创始人兼CEO李宏伟表示,“AR眼镜将赋予AI与人类高度一致的感官能力,使AI真正成为人们的‘外脑’,增强人们对视觉信息、音频信息的处理能力。AI AR将是行业发展的重要趋势。我们坚信,未来2 - 3年,AI带来的最重要的新硬件就是AR眼镜,下一个iPhone时刻将由AI AR来创造。”

过去,AR眼镜虽然能够同时呈现数字世界和物理世界,但二者相互隔绝,缺乏交互和联动性。在AI发展的初期,其应用主要集中在软件优化等基础领域,并未直接打通物理世界与数字世界之间的联系。

然而,近两年来,AI的发展速度超越了以往任何历史时期,性能得到了极大提升,主动性和应用场景也更加广泛和深入。

随着AI大模型的融入,AR不仅能够呈现现实世界与虚拟世界,还能借助AI和算法接管和驱动数字世界,并与物理世界建立连接,实现与现实场景的交互。它能看你所看,听你所听,在你眼前、耳边重构我们的视听世界。

正如李宏伟所说,“AI AR的融合,不仅能够实现过去手机的应用场景,还能成为非常实用的AI智慧助手。更重要的是,它们将实现虚拟与现实的深度融合,带来整个世界的数字化变革。”

跨越,深度定制AR场景专属大模型

在明确了AI AR的发展路径后,2024年,多家AR企业开始将产品与AI融合落地,并进行新的思考。

一个明显的信号是,在年底这段时间,作为承托AR眼镜的AI眼镜产品频繁推出,不仅有雷鸟创新这样的垂直厂商参与,还有创业者和大模型企业纷纷入局。

尽管入局者众多,产品琳琅满目,但真正能够直击用户需求,连通数字世界和物理世界的产品却寥寥无几。其中的关键问题在于,AI与AR的融合并非简单的加法运算,大模型的选择以及场景化深度优化至关重要。就像苹果的Siri,由于在很多场景下无法准确回答问题,而被众多用户弃用。

李宏伟指出,与大模型对话也是如此,如果准确率不能达到80%以上,用户就会失去使用的意愿。例如,使用AR眼镜识别路牌,如果只有一半的识别概率,将会极大地影响用户体验。用户在产品体验中,最看重的就是确定性。就好比发微信消息,若只有50%的送达概率,这样的产品肯定无人问津。

“我们需要判断的是,谁将在大模型领域长期处于领导者地位,这也是我们选择与阿里通义合作的原因之一。”

作为目前市面上大模型产品的第一梯队,通义的基础模型和多模态能力表现出色。

其中,Qwen2.5全系列模型在18T Tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更丰富的知识储备、更强的编程和数学能力。视觉语言模型Qwen - VL - 72B具备自主操作手机和机器人的视觉智能体能力。大规模音频语言模型Qwen - Audio,在语音聊天部分融合了语音识别和自然语言理解,无需多个模型衔接,实现了端到端大模型,能够识别音乐、情绪、环境声音等。

AR眼镜搭载通义千问卓越的多模态识别能力后,能够实时处理图像、文字、视频和音频等多种输入形式。

例如,当用户在路边看到一栋建筑或不认识的植物时,通义借助AR眼镜的摄像头能够识别物体并进行详细介绍。对于用户眼前的物理世界,通义也能进行精准描述,这不仅有助于用户深入了解所处环境,还能为视障人群带来“看”世界的可能。

同时,AR眼镜在通义大模型的加持下,还具备即时翻译功能,支持中文与英语、日语、韩语、法语、德语、俄语等多国语言互译。即使用户身处陌生国家,也能与当地人从容交流,大大提升沟通效率。

然而,仅仅依靠大模型的通用能力实现AR眼镜在多个场景下的交互还远远不够。

雷鸟创新选择通义,还有一个更为重要的原因,即双方都致力于实现虚拟世界与现实世界的深度融合,并愿意为面向用户进行深度研发投入。虽然市面上有很多优秀的通用大模型,但在AR眼镜上的应用体验却不尽如人意,关键在于这些大模型没有针对AR眼镜的需求进行深度定制和匹配。

李宏伟表示,“很多AR厂商只是简单地将大模型接入产品,这是行不通的。目前的通用大模型虽然功能强大,但对于AR涉及的场景,还不够深入和完善。我们看好阿里云通义大模型的现在和未来,双方达成共识,不能仅仅在AR眼镜上安装一个通用大模型,而是要针对AR的场景进行定制和适配,培养出一个高度符合该应用场景的大模型,让AR眼镜真正融入用户的日常生活。”

2025年1月7日CES期间,雷鸟创新正式发布雷鸟V3 AI拍摄眼镜。这款新品搭载了其与阿里云通义共同打造的业内首个专门面向智能眼镜的AI大模型。该定制化模型不仅能够更好地理解眼镜场景下的用户需求,还能为Agent提供更精准的知识支持和决策依据,从根本上提升了AI眼镜的交互体验。

得益于此,雷鸟V3的AI平均响应速度为1.3s,远超Ray - BanMeta及其他接入通用模型的AI眼镜;V3的AI识别准确率高达98%,堪称用户真正全能的百科助手。在此基础上,雷鸟V3还将陆续上线RayNeo电台、探索视界2.0、手机通知AI总结播报、QQ音乐点播、AI新闻播客、全场景录音总结、支小宝扫码支付等丰富功能,让AI真正服务于用户的日常生活。

之后,雷鸟创新计划在第二季度发布的AR眼镜X3 Pro,也将搭载与阿里云深度定制和融合后的通义大模型。

在产品研发过程中,双方投入了大量的人力和物力,针对具体场景进行训练和提问,对硬件端侧的模型进行优化,以满足AR场景下的需求。

以AI翻译为例,常规的通用大模型通常根据接收到的语言信息进行单一翻译,缺乏与具体场景的深度融合,导致翻译内容有时显得生硬。此外,翻译速度也是重要指标,若仅接入现有的通用大模型,整体体验将不够顺畅。

为了提升AI体验,雷鸟创新和阿里通义进行了多方面的训练工作。一方面,提升了翻译速度,相比当前市面上通用大模型的翻译,搭载定制通义大模型的RayNeo AI反应速度至少提升一倍。

另一方面,除了速度提升,通义还针对旅行、点餐、购物等多个细分场景进行优化,借助AR眼镜识别当前环境、对话人的表情、手势等多个信息源,更好地理解用户的使用场景,从而给出更准确的翻译结果。

在视觉方面,AI AR要接管物理世界,首先要能够对现实世界的场景进行准确反馈。然而,物理世界复杂多变,例如路牌,其材质、大小各异,在不同光线下的反光程度也不同。为了提高识别准确率,阿里云和雷鸟创新共同进行增量训练,通过不断采集训练和优化,提升复杂场景下的识别准确率。

此外,AR眼镜的AI智慧助手也是一个多信息输入的场景,需要构建一个新的分类模型,针对不同指令做出低延迟、高质量的响应。

当然,以上只是部分场景,未来雷鸟创新和阿里通义还将针对更多细分场景进行底层优化,真正实现“接管数字世界,改变物理世界”的目标。

共创智实融合世界

当前,AR正处于蓬勃发展阶段,但仍处于上半场的初期。值得一提的是,AI AR是为数不多在上半场就由中国厂商深度参与甚至主导的产业。

雷鸟创新与阿里云在AI AR领域的深度合作,将进一步加深用户对AI落地场景的感受和理解,推动AR走向大众市场,实现数字世界与物理世界的连接。

谈及与阿里云的合作,李宏伟表示,AI在新场景下,在物理世界的落地进入了关键时期,阿里云所做的工作非常有价值,双方的合作开创了行业的新模式。未来,行业标准将被重新建立,即AR接入的大模型需要进行深度定制化和重新训练,以满足场景化需求。

然而,目前的场景探索还远远不够。随着技术的不断提升以及AR在更多场景的探索,AI AR还有进一步融合的空间。例如,在对话翻译时,能否将字幕显示在对方嘴边?李宏伟设想,“戴上AR眼镜后,每个人说话时,嘴边都会显示一个对话框,就像游戏中的场景一样,人们可以与世界各地的人无障碍交流。”

他还认为,有了AI的加成,AR眼镜未来不仅能够理解文字、图片和视频,还能理解空间,从而实现虚实融合的游戏,比如跑步时收集金币。

另外,随着大模型落地的不断深化,端侧应用成为趋势,手机、PC已有AI大模型端侧应用的实践。日前,阿里云将“通义千问”大模型部署在联发科的SoC上,通过量化、参数剪枝和知识蒸馏等多种技术手段减小模型体积。在端云协同技术的推动下,带来了低延迟、隐私保护、离线能力、节省带宽和实时处理这五大优势。

对于AR眼镜而言,由于受到体积、续航等方面的限制,目前端侧大模型的应用仍在探索中,例如需要审慎选择参数量,综合考虑功耗与性能进行更多研究,这也是未来雷鸟创新和阿里云需要共同协作解决的问题。一旦端侧大模型应用落地,AR眼镜将能够更快地响应用户指令,端云协同技术通过在设备端处理敏感数据,将大幅提升AR眼镜用户的数据安全性和隐私性。

场景在变化,趋势和需求也在变化,但不变的是数字世界与物理世界的加速融合。对于雷鸟创新和阿里云来说,AI AR目前仍处于发展的前半程,二者的融合还需要不断精进。

本文介绍了AR眼镜在当下科技发展中的重要地位和发展趋势,阐述了AI与AR融合为消费电子行业带来的新机遇。重点讲述了雷鸟创新与阿里云在AI AR领域的合作,包括合作背景、选择通义大模型的原因、定制专属大模型的过程及成果等。同时,探讨了AI AR未来的发展方向和面临的挑战,强调了数字世界与物理世界加速融合的趋势,以及双方合作在推动行业发展中的重要作用。

原创文章,作者:逸玥,如若转载,请注明出处:https://www.kqbond.com/archives/5577.html

(0)
逸玥逸玥
上一篇 2025-03-26
下一篇 2025-03-26

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注