方寸之间听懂世界——AI同传耳机“时空壶”诞生记
“一块豆腐两块,买三块要花几块?”尽管来中国工作已有时日,面对中文里的“烧脑”提问,从事演员行当的西班牙人大卫还是会显得力不从心。
一次偶然的契机,大卫接触到一款名为“时空壶”的人工智能(AI)同传耳机。“现在不仅听得懂,而且不会在感谢同事时说‘我会给你好果子吃’了。”他说。
一听一说间,如何跨越语言障碍?4月初,记者在深圳时空壶技术有限公司体验到了“时空壶”的方便实用——两个说着不同语言的人,各自佩戴一只耳机,通过连接手机端App,来言去语便可即时互译,实现“无感沟通”。
灵感源自巴别鱼
“意外!”深圳时空壶技术有限公司创始人田力如此描述创业灵感的闪现。
“十多年前,我的父母在欧洲旅游时突发疾病。面对医生询问,却因手机中的翻译软件操作繁琐、识别迟缓,险些延误救治。”田力说。
这次经历深深触动了田力。他意识到,依靠翻译软件虽能解决简单的日常沟通问题,但人与人之间的交流,仍需一种“沉浸式”体验。
我们需要什么样的翻译设备?
道格拉斯·亚当斯小说《银河系漫游指南》里巴别鱼的形象浮现在了田力的脑海中。
巴别鱼是这部小说中的一种虚构生物,植入耳内,可实时翻译宇宙任何语言,消除交流障碍。
田力说:“耳机,不正是一个完美的‘巴别鱼’吗?”
当使用者说话时,语音识别技术精准捕捉声音,并将其转化为可处理的文本信息;在倾听者的耳中,耳机则将翻译后的文本,转化为自然流畅的语音输出。
把灵感和构想装进商业策划案,田力将初代“时空壶”构想放在了海外众筹平台Kickstarter上,先获取用户的反馈,再决定项目的可行性。
在这一过程中,“耳机只能翻译、不能听歌,功能有点少……”这样的反馈层出不穷。
田力陷入沉思:要不要向用户妥协?
“产品本身体积就很小,如果按当时的元器件集成水平,即便做出一个‘既能、又能、还能’的产品,各种功能都会大打折扣。”田力分析道,“就像瑞士军刀,功能叠加只会让每个刀刃都不锋利。”
经过反复斟酌,田力决定:“即便众筹金额会受限,也要先保证翻译功能好用。”
2018年,在获得数百万美元天使轮融资后,初代“时空壶”同传耳机的商业案从文件走向代工厂,随之量产。
布局亚马逊、架设独立站、投放广告……成功出圈后,“时空壶”的出海之路按下了加速键。
反复验证破难题
初代“时空壶”同传耳机略有所成,让田力和团队下定决心乘胜追击。
2019年,“时空壶”ZERO系列翻译机在日本众筹资金超过7000万日元,在中国台湾也取得不错的成绩,众筹金额超过2200万新台币。
然而,这款随身翻译机发布还不到两个月,境遇急转直下。
“我们当时向工厂下单了20万台,但随之而来的差评让退货率不断上升,直到现在还有几万台积压在仓库里。”田力说。
田力与团队“闭门思过”。通过拆解用户反馈的2000多条意见,他们发现,核心痛点是降噪功能差导致翻译效果不佳。
这一次经历,也让田力与团队认识到,要将产品推向市场,还需要在不同场景里反复验证。
“过去市场上没有这类产品,所以每一步都是‘从0到1’的探索。”深圳时空壶技术有限公司研发负责人石伟说。
从实验室到工厂,再从工厂到市场,3年间三代产品迭代,这样的验证周而复始。
在这一过程中,团队破解了“双工通信”难题,改写了传统蓝牙耳机的单向传输特性,创新算法让两只耳机实现双向实时互译。产品也从入耳式到挂耳式,再到多语多向同传AI翻译终端,不断丰富。
“我们研发了一套全球首创的算法,它可以在方向上和距离上对声音进行判断。”田力说,“这样使得收取的声音能被翻译得更为精准。”
与此同时,“时空壶”独创的矢量降噪算法,通过三麦克风阵列实现声音定向捕捉。
“这如同为声音世界装上了‘显微镜’。”石伟说,他们追求的终极目标是利用降噪技术,完全消除说话者以外的杂音、噪声。
“无感沟通”在路上
一边不断升级通信、降噪技术和算法,一边从用户和同声传译从业者的反馈中弥合语言背后的逻辑差异,田力的目标是实现“无感沟通”。
记者采访时了解到,目前同声传译最快的响应速度是2秒到3秒,而且这只有世界顶尖译员才能做到。
2023年,记者在深圳高交会现场与德国采购商通过“时空壶”交流时,尚有几秒延迟;如今当记者再用新产品与他人测试时,几乎感觉不到“时差”。
“我们在全球范围内布局200余台服务器,以确保海内外用户都能有良好的体验。”田力说。
在企业文化墙上,不仅展示着每一代产品,也记录着产品背后的用户故事。
“现在我什么都可以听懂了!”在2023年杭州亚运会期间,乌兹别克斯坦代表团使用“时空壶”了解中国文化时,副团长卡莫尔丁·埃尔加舍夫发出了由衷的赞叹。
时下,搭载Babel OS同传系统的新款耳机,支持40种语言、93种口音即时互译,已远销全球170多个国家和地区。
“这是发到美国的,这是发到法国的,这是发到西班牙的……”在深圳时空壶技术有限公司的仓库里,公司首席市场官吴卫兵表示,“时空壶”海外销售额占比达70%,今年的订单已经排到将近6个月之后了。
当前,这个平均年龄只有28岁的团队,已集合算法、声学、嵌入等领域的50多名研发人员,手握100多项全球专利认证。
“技术因解决问题而生,解决问题只能一步一个脚印来,没有任何捷径。”田力说。