文| 铅笔道 记者 程用杰
“听觉是人类感知情感最重要的手段之一,‘聆感’是‘聆听感动’的结合,科技应该是帮助人们能更好的传递情感与交互。”聆感智能联合创始人宋柏勋(此后称为Peter)说。结合 “听”(listen)和“感”(sensation),且以“听”为出发点,这便成为了公司英文名“Linsation”的来源。
去年9月,钟涛和Peter在香港注册公司,正式创立“聆感智能”,专注于人和机器的语音交互产品的研发。团队初期没有开发终端的产品,为客户打造以智能语音晶片为主的交互解决方案。
当前,“聆感智能”共同参与研发的产品分为三个系列。海豚系列,作为智能家居的交互入口,专攻高阶音响,车用或者工业级应用;蝙蝠系列,专供IoT(物联网)和智能家电,为IoT智能家居解决方案提供语音交互服务;蜂鸟系列,为穿戴式设备,比如手环和无线耳机等电子消费品提供超低功耗的语音晶片方案。
当前,Peter正在寻求Pre-A 轮融资,额度约为300万美元。他表示,因为公司总部设在香港,战略上更倾向国际化,除了目前已在深圳成立全资子公司,下一轮可能会在海外设置办公点。之前,去年12月,公司获得80万美元的天使轮融资。
注:宋柏勋承诺文中数据无误,为内容真实性负责。铅笔道作客观真实记录,已备份速记录音。
文艺和科技的结合
清晨,上海田子坊,晨跑的Peter累了想找个地方休息。无意间,他走进街角一间小日式咖啡店,店里轻柔的音乐,让他因为汽车按鸣声而焦躁的心,安静下来。他说,声音能够影响人的情感,这是他想创业的初衷。
Peter是一个文艺男,很难相信他其实是理工科出身。他博士毕业于台湾成功大学电机所,研究方向是仿人耳听学讯号处理,拥有15年以上半导体与声学工作经验。
Peter之所以能将文艺和科技中找到平衡,也许跟他喜欢太极有关。他认为,太极拳是一项亦张亦弛外柔内刚的运动,主张静心内修,讲究松和柔。在太极的哲学中,他找到矛盾的一种处理方式。
同时,太极也是Peter和钟涛相识的纽带。彼时,两人是哈曼(国际知名音箱生产厂商)的同事,在一起上太极课程的过程中认识。两人的性格正好相反,Peter性格欢脱外向,钟涛性格严谨务实,这种互补的性格成为两人一起创业的重要原因之一。
以2017年智能语音的市场,巨头纷入,以低价补贴方式抢占入口。以智能音箱为例,这些产品,他们虽然创造使用者新的交互方式的体验,但国内多数的产品忽略了声音的本质,还没有形成一套成熟的语音测试标准来控制产品的性能。
去年9月,钟涛作为CEO,Peter作为CTO,两人在香港注册公司,正式创立“聆感智能”,专注于人和机器的语音交互研发。在早期阶段,团队不开发终端的产品,为客户提供一系列智能语音的解决方案。
让耳机像人耳一样工作
在最初,Peter选择的切入点便是仿人听觉作为技术研发的核心。这意味着放弃传统的机器思维,而选用人的思维。
人的声音可以用两个维度来形容,一个是时间轴,另一个是频率。人在讲话的时候,声音可以演化成时间和频率组成的2D图像,声音高高低低,好似山峰山谷,声纹就像是共振墙。
在训练语音的时候,团队会将声纹的共振建模,再通过大量的统计模型,电脑就可以根据这些模型做比对。一段语音素材,经过比对,就能匹配成对应的文字,再加上统计模型,机器学习和映射关联,海量数据的支撑下,比对结果就会越来越准确。
对于一段掺杂着噪音的声音,传统的算法会猜测噪音,或是训练噪音特征来进行降噪处理,但人类并不是这样做的。一般来说,人与人在语音交流的环境,通常都是伴有一定程度的噪音或杂音的,每当这时候,人的逻辑不是拆解噪音,而是通过专注行为来选择自己想听哪个声音,从而锁定语者的声音特征,并通过大脑思考,来理解声音的意义或是更上位的情感。
这就是为什么在嘈杂的酒吧里,人跟人还是可以交流,因为噪音的调变相对人声来说是高频的,人会专注在追踪有共振腔的人声上而忽略噪音的干扰。同时,语速不同也会影响人对语义的理解,如果听不懂的时候,适度放慢语速就会帮助理解。
基于这个原理,在语音模型训练上,“聆感智能”主要有两种方法。一是,找人录音,在实验室采集人声后,让它适应各种模拟噪音源的环境,不分白天黑夜,让机器跑数据;二是,由数据公司提供素材,团队训练模型。人教会机器如何定义数据、标记数据,让机器形成自己的数据逻辑去收集海量的素材。
建造语音实验室
“聆感智能”的初期盈利模式,主要依靠给客户提供不同模块的解决方案。当前,公司专注于超低功,在语音交互的听觉装置使用,可支持边缘计算的语音晶片。
在智能语音领域,大公司基本上都有自己的实验室,但中小企业几乎没有实验室,想做测试的时候就很不方便。因此,今年7月,公司建成语音实验室,可以提供开放的语音实验室的测试与服务。
Peter介绍,最初建设实验室,就是想在方便自己的同时,也做一个开放的实验室环境,能让同行,甚至是竞品公司都可以使用。国内在语音测试方面还没有形成共识,随着市场教育和更多的普及,实验室有望让公司能够有计划参与到行业标准规范的制定当中。
声学实验室主要有两个用途:一个是做声学验证,将设计好的各种产品,经过产品、模组、语音等层面的测试,验证其是否合格;另一个是语音产品的交互认证,通过自动化接入不同公司的标准来配合测试,验证其是否合格。
在销售方面,“聆感智能”目前是代理商模式协助销售公司模组与晶片。因为公司目前不直接生产终端产品,和供应商都是合作关系,因此业务比较容易拓展。其合作伙伴分为三类:一是声学器件类,比如AAC(瑞声科技),楼式电子,美律电子等;二是晶片商类,国内外不同的晶片商;三是算法类,团队会整合算法伙伴和自有的技术融合后整体授权卖给客户。
当前,“聆感智能”团队共有9人,创始人团队均在国际知名的语音公司有过10多年的从业经验。
Peter表示,在未来将会尝试针对听觉装置(hearable device)等不同类型的产品进行开发,进一步将生理讯息的侦测整合到听觉装置,用于健康保健方面,并于临床做可行性的尝试和评估。
/The End/
编辑 | 吴晋娜 校对 | 南镜
优质项目"融资首发绿色通道":创业者请加微信qianbidao01,务必注明项目名称;或发送BP至wujinna@pencilnews.cn。
如需转载文章请联系铅笔道微信客服号铅笔道小铅笔(微信号:qianbidao2018)获取授权资质,否则我们将依法追究相关责任。
热门评论
目前还没有评论~