没有死磕眼镜,字节跳动为什么选择做AI耳机?

一场大模型应用的阳谋

字节跳动旗下大模型产品“豆包”的首款智能硬件落地选择了耳机。

和外界对产品发布的高度关注度鲜明对比的是 ,字节跳动的动作尤为低调。没有举办发布会,也没有管理层对外发声,名为“Ola Friend”的产品准时在电商平台上线。

产品介绍视频没有复杂的参数和解析大模型技术,只是针对如何使用这款耳机给出了三个场景:随时随地的英语陪练、旅行路上的电子导游,以及闲暇时的情感陪聊。

据媒体报道,一个月前,字节跳动以约5000万美元全资收购了开放式耳机品牌Oladance。“Ola Friend”则是这场闪电式收购后,首个对外发布的产品。

这笔收购的幕后推手是字节跳动AI硬件团队负责人Kayden(本名刘成城)。其是36氪集团创始人,后加入字节跳动。有前项目成员告诉剁椒,Kayden负责相关业务后,提出希望整合团队实现大模型在终端的落地。

与Meta联合雷朋发布智能眼镜类似,字节跳动在耳机产品上策略也是唤起其AI应用来实现和用户的人机交互。不同的是,耳机产品的移动性和成熟度被业界更为看好。

耳机更适合作为大模型落地载体

10月10日10时,“Ola Friend”开始线上预定,七天之后用户需要支付尾款。这款AI开放式耳机提供四种配色,售价为1199元,目前只中国市场发售。单只耳机的重量为6.6克,官方称是同类产品中最轻的,佩戴几乎无感。

“Ola Friend”与Oladance于2023年7月发布的“Oladance OWS Pro”外观相似。对此,官方直播间主播介绍称,“Ola Friend”在OWS Pro的开放耳机的优势之外,增加了AI的功能。

图:左为Ola Friend,右为Oladance OWS Pro(来源:京东和亚马逊)

根据产品演示,AI能力主要体现在,用户可以通过语音或操作唤醒字节跳动旗下的豆包应用,实现人机对话互动,帮助用户完成英语对话训练、场景下的问题搜索,以及闲聊时情感陪伴。

尽管目前产品仍在预售阶段,但一些互联网博主已提前拿到产品参与体验。经过两天的佩戴后,刀青(化名)告诉剁椒,这款耳机与豆包强绑定,所以对日常使用这类应用多的人来说,会是一个很好的选择。耳机的质量也很轻,时间长了甚至会忽略在使用。但是,他也期望字节跳动可以更开放,可以调用除了“汽水音乐”之外的更多音乐App。

AI耳机的热度这几年正在快速上升。2018年,人工智能公司出门问问率先对AI耳机进行尝试。随后,科大讯飞入场发布了和办公场景紧密结合的iFLYBUDS系列产品,提升了撰写、摘要总结和翻译等特定功能的准确率。其他厂商如塞那和Cleer等则选择了娱乐、教育和运动健身等赛道。

上述公司的产品往往聚焦于某个特定场景需求,所以用户对其也会打上特定的标签。“Ola Friend”和其他产品相比最大的不同的是,能够深度丝滑调用字节跳动产品,这也是这款耳机更接近大众所认知“AI耳机”的原因。

与此同时,开放式耳机的模式正在成为市场的新趋势。根据IDC数据显示,2024年上半年中国开放式耳机市场强势增长,出货1184万台,同比增长303.6%。IDC认为,随着头部厂商的深入布局和消费者认知的提升,市场会从窗口期逐渐过渡到洗牌期,头部品牌有望重塑市场。

市场普遍认为这一市场的发展方向是,拓宽产品使用场景、增加附加价值,以及渠道多元化布局,而这恰恰是字节跳动的优势。

字节跳动通过盘活自身产品资源来培育新产品的策略已不陌生。“Ola Friend”在用户使用音乐场景下,豆包大模型率先调用的便是其旗下的汽水音乐。未来,具有着强搜索需求的用户对话将利用字节跳动庞大的内容储备,从而实现更精准的推荐。此外,将AI耳机与飞书结合在办公场景落地的可能性也不容忽视。

图:Ola Friend官方直播间

一位前耳机行业的创业者告诉剁椒,与眼镜类产品相比,耳机类产品的移动性更强,因此适用场景也更加丰富。这款耳机不仅可以作为大模型应用的载体,还能作为字节跳动集团其他业务的硬件入口,蕴含着巨大的想象空间。

最后,AI耳机产品也更适合互联网营销。尽管产品仍在预售期,但抖音和小红书等平台上已有多位博主发布体验测评内容。“Ola Friend”不仅延续了Oladance选择运动时尚博主展现耳机外部、功能优势的策略,还增加了数码博主等对大模型应用的呈现,一些博主引用了“科幻电影照进现实”的话术。

图:已有众多博主发布产品体验测评

不过,目前来看,用户对这款产品的市场接受程度仍待检验。截至剁椒发稿时,抖音平台上的销售量不足1000部;官方直播间,剁椒观看主播激情热卖的半小时内,10多位在线观众未有下单的动作,在售的库存数量也只有10台黑白配色和不足10台黑色产品。

从产品来看,Ola Friend的AI能力依赖于豆包大模型,如果大模型当前无法支持某些AI功能,那么这款耳机也是无法实现。在直播中,有用户询问是否能实时完成同声传译,主播就曾坦言无法支持,只能由用户向豆包提问某句话如何英语表达。

背后是字节大模型的发展需求

对于这款产品的发布,加一资本创始合伙人金龙告诉剁椒,就是字节跳动的“软件”与Oladance“硬件”的结合。

Oladance成立于2019年,由前音响设备公司Bose高管李浩乾和多位前工程师创立。在被字节跳动全资收购前,Oladance是一家通过重构与声音相关设计、创造新市场的初创公司。在TWS(真正无线立体声)耳机大行其道时,他们推出了OWS(开放式穿戴立体声)专利技术,将家庭影院的体验移植到耳机上。

图:Oladance将家庭影院的体验移植到耳机上。(来源:Oladance官网)

尽管Oladance的产品可以通过唤醒Siri完成一定的人机交互,但是在发布“Ola Friend”前,AI并不是这家公司的底色。Oladance的产品以无佩戴感、音响级声效和超长续航而备受关注。

品牌传播主要聚焦于运动时尚,田径选手吴艳妮曾为其运动系列产品代言。

这些特点也是黑蚁资本、蓝驰创投等早期投资者选择投资Oladance的原因之一。

于是,获得融资不到一年,这家公司就迅速完成了外部投资者退出的操作,最终被字节跳动全资收购。国家信用信息公示系统显示,2024年3月,深圳市大十未来科技有限公司(Oladance所属主体)的三大外部机构股东退出,投资时长不足一年。仅过去五个月,公司股东再次变更,由天津字节跳动科技有限公司全资持股,出资额为128.37万元。

反观字节跳动,自2012年成立以来,其一直将数据挖掘和推荐引擎技术作为公司产品的核心。在2016年推出抖音的同时,这家公司成立了人工智能实验室,这是系统性研发的开端。虽然字节跳动并未在大模型热潮初期迅速入局,但到2024年初,其成绩已经在业内引起广泛关注。

根据第三方机构QuestMobile的数据,2024年7月,AIGC应用豆包的月活跃用户数已达3042万,领先于第二名百度文小言两千万,后者仅为1008万,而月之暗面的Kimi智能助手、阿里巴巴的通义、昆仑万维的天工、科大讯飞的讯飞星火均未突破千万。

表:2024年7月AIGC应用月活跃用户规模 (来源:QuestMoblie官网)

字节跳动的优势在于人才密度、GPU资源和技术积累等方面,尤其是在算法的早期研发及AI在多个字节跳动旗下产品中的应用。这些因素使得字节跳动在应用场景的探索中并未落后。

不仅如此,字节跳动在大模型领域做到了一鸣惊人。2024年5月,在火山引擎春季Force·原动力大会上,字节跳动首次正式发布自研的豆包大模型(原云雀大模型)。当火山引擎总裁谭待公布Pro-32K版本推理输入价格低于行业99.3%时,字节跳动再次改变了中国互联网产业的格局。

图:豆包大模型定价远低于行业引起关注。(来源:字节跳动)

过去这近一年时间里,字节跳动全面押注AI原生应用。基于豆包大模型,其打造了一系列产品,让整个公司从原来的“超级APP工厂”升级为“超级AI应用工厂”, 抖音、番茄小说等业务也已接入该大模型,这些产品中不乏亿级用户量的应用。然后,字节跳动将这些资源与豆包大模型整合,与跨领域行业合作。

OPPO、荣耀、华硕电脑和极氪汽车等企业已相继宣布接入字节跳动的大模型服务,类型涵盖智能手机、PC和汽车等不同的电子消费终端。不仅如此,字节跳动还联合头部企业通过建立生态联盟的方式,扩展对行业的影响力。此外,招商银行、海底捞、超级猩猩和复旦大学等行业也有相应的大模型应用落地场景。

谭待曾表示,豆包大模型日均处理文本达1200亿Tokens,生成3000万张图片。他说,“只有大量的使用量,才能打磨出优秀的模型。”

字节跳动破局硬件的关键

想要将大模型落地的字节跳动,过去在硬件探索方面的历程并不顺利。

2019年,字节跳动收购了本土品牌锤子手机,随后推出了坚果手机和TNT显示屏套件等产品。2020年,字节跳动成立了“大力教育”品牌,通过智能台灯等产品切入教育领域。然而,这些探索最终未能取得预期成果,字节跳动将原锤子团队并入教育硬件团队。

2021年,字节跳动高调宣布以90亿元收购VR设备商Pico。后来的媒体报道显示,字节跳动向Pico投入了大量资源,包括技术专家、大IP合作以及全平台的流量支持。仅2022年春节期间,Pico的总曝光量高达11.3亿人次。然而,尽管投入巨大,却未能带来相应的盈利。

AI作图

当下,AI耳机正成为大模型厂商切入硬件市场的最佳选择。研究机构IDC中国研究总监潘雪菲告诉剁椒,从人机交互的角度来看,可穿戴设备比手机和平板更贴近用户,在AI的加持下,其潜力巨大。与没有显示功能的智能眼镜相比,耳机产品本身的产业链更加成熟、用户基数也更加广泛。

从当前技术来看,潘雪菲认为让耳机成为一个独立的AI终端仍比较有挑战性。这需要在狭小的耳机空间内集成能够支持AI运行的处理芯片和充足的电池,同时还要解决功耗带来的诸多负面影响。因此,采用唤醒模式的方案可能是最为合适的选择。

但从长远来看,AI可穿戴设备厂商有机会重新定义市场。2023年底,券商民生证券分析师吕伟在一份研报中指出,这次由大模型带来的AI浪潮不同于移动互联网先“硬”后“软”的发展模式,而是以软件为基础设施先行定义一切,而这正开始推动终端重构的空前硬件创新潮。

他认为,以耳机为代表的终端战略地位因此得到了提升,带来了全新机遇。他预判耳机的升级路径将是从蓝牙配件、WiFi 联网到移动信号联网,最终成为随时随地可以使用的独立智能助理。与此同时,他在另一份报告中指出,AI耳机作为全新的品类,各家厂商竞争尚不充分,市场热情和需求较为乐观。

从硬件本身来看,耳机设备上游相对固定,成熟的方案已广泛可用。以电源管理芯片为例,思远半导体的客户包括小米、OPPO、联想、小天才、百度、JBL、哈曼、传音等数十家国内外企业,而Oladance也在其中。半导体上市公司恒玄科技(688608.SH)也宣布其芯片被“Ola Friend”采用,该公司的产品还被“OV小米”和漫步者的耳机使用。不过,截至发稿时,恒玄科技已在官方公众号上删除了该内容,同时该公司尚未回复剁椒的邮件询问。

对于字节跳动来说,还有另一个好消息。AI耳机市场的竞争似乎不会重演智能音箱“千箱大战”的局面。潘雪菲表示,虽然耳机和音响有相似之处,但耳机行业的竞争不会那么激烈。智能音箱通过低价产品迅速渗透市场,而耳机作为电子消费品,已在市场上获得了充分的渗透和认知度。因此,尽管互联网厂商纷纷布局AI大模型,但在耳机领域的推进仍然是循序渐进的过程。

不过,也有声音认为,字节跳动作为大模型服务商,销售AI硬件的目标在于寻找合适的应用场景,以便为其他厂商提供解决方案。这是另一种思路。一位行业分析师告诉剁椒,“互联网厂商没有核心硬件,所以无论是从成本考虑,还是从资源投入产出比考虑,重要的是AI大模型的落地,而产品形态在这个节点并不重要”。

“今天是A,明天可能是B,但对所有厂商来说,最重要的是AI大模型。”

如果你需要付费使用ChatGPT等AI工具,可以开通虚拟卡进行支付。4399Pay就是一家专门提供国际虚拟信用卡的平台,并且可以免KYC;有兴趣的朋友可以添加客服TG(@dabai717)进行了解。