独家 | 前哈曼高管做智能语音晶片让耳机像人耳一样工作获投80万美金

创新公司独家 | 前哈曼高管做智能语音晶片让耳机像人耳一样工作获投80万美金

程用杰2018/11/19

文章约2200字,阅读需要6分钟

Peter说：“声音的维度就像是咖啡，有很多层次，咖啡的产地，冲泡的温度与手势、都会形成咖啡不同的口感，很细腻，也很复杂。”

Peter说：“声音的维度就像是咖啡，有很多层次，咖啡会因为产地、温度与手势而形成不同的口感，很细腻，也很复杂。”

文| 铅笔道记者程用杰

“听觉是人类感知情感最重要的手段之一，‘聆感’是‘聆听感动’的结合，科技应该是帮助人们能更好的传递情感与交互。”聆感智能联合创始人宋柏勋（此后称为Peter）说。结合 “听”（listen）和“感”（sensation），且以“听”为出发点，这便成为了公司英文名“Linsation”的来源。

去年9月，钟涛和Peter在香港注册公司，正式创立“聆感智能”，专注于人和机器的语音交互产品的研发。团队初期没有开发终端的产品，为客户打造以智能语音晶片为主的交互解决方案。

当前，“聆感智能”共同参与研发的产品分为三个系列。海豚系列，作为智能家居的交互入口，专攻高阶音响，车用或者工业级应用；蝙蝠系列，专供IoT（物联网）和智能家电，为IoT智能家居解决方案提供语音交互服务；蜂鸟系列，为穿戴式设备，比如手环和无线耳机等电子消费品提供超低功耗的语音晶片方案。

当前，Peter正在寻求Pre-A 轮融资，额度约为300万美元。他表示，因为公司总部设在香港，战略上更倾向国际化，除了目前已在深圳成立全资子公司，下一轮可能会在海外设置办公点。之前，去年12月，公司获得80万美元的天使轮融资。

注：宋柏勋承诺文中数据无误，为内容真实性负责。铅笔道作客观真实记录，已备份速记录音。

文艺和科技的结合

清晨，上海田子坊，晨跑的Peter累了想找个地方休息。无意间，他走进街角一间小日式咖啡店，店里轻柔的音乐，让他因为汽车按鸣声而焦躁的心，安静下来。他说，声音能够影响人的情感，这是他想创业的初衷。

Peter是一个文艺男，很难相信他其实是理工科出身。他博士毕业于台湾成功大学电机所，研究方向是仿人耳听学讯号处理，拥有15年以上半导体与声学工作经验。

Peter之所以能将文艺和科技中找到平衡，也许跟他喜欢太极有关。他认为，太极拳是一项亦张亦弛外柔内刚的运动，主张静心内修，讲究松和柔。在太极的哲学中，他找到矛盾的一种处理方式。

同时，太极也是Peter和钟涛相识的纽带。彼时，两人是哈曼（国际知名音箱生产厂商）的同事，在一起上太极课程的过程中认识。两人的性格正好相反，Peter性格欢脱外向，钟涛性格严谨务实，这种互补的性格成为两人一起创业的重要原因之一。

以2017年智能语音的市场，巨头纷入，以低价补贴方式抢占入口。以智能音箱为例，这些产品，他们虽然创造使用者新的交互方式的体验，但国内多数的产品忽略了声音的本质，还没有形成一套成熟的语音测试标准来控制产品的性能。

去年9月，钟涛作为CEO，Peter作为CTO，两人在香港注册公司，正式创立“聆感智能”，专注于人和机器的语音交互研发。在早期阶段，团队不开发终端的产品，为客户提供一系列智能语音的解决方案。

让耳机像人耳一样工作

在最初，Peter选择的切入点便是仿人听觉作为技术研发的核心。这意味着放弃传统的机器思维，而选用人的思维。

人的声音可以用两个维度来形容，一个是时间轴，另一个是频率。人在讲话的时候，声音可以演化成时间和频率组成的2D图像，声音高高低低，好似山峰山谷，声纹就像是共振墙。

在训练语音的时候，团队会将声纹的共振建模，再通过大量的统计模型，电脑就可以根据这些模型做比对。一段语音素材，经过比对，就能匹配成对应的文字，再加上统计模型，机器学习和映射关联，海量数据的支撑下，比对结果就会越来越准确。

对于一段掺杂着噪音的声音，传统的算法会猜测噪音，或是训练噪音特征来进行降噪处理，但人类并不是这样做的。一般来说，人与人在语音交流的环境，通常都是伴有一定程度的噪音或杂音的，每当这时候，人的逻辑不是拆解噪音，而是通过专注行为来选择自己想听哪个声音，从而锁定语者的声音特征，并通过大脑思考，来理解声音的意义或是更上位的情感。

这就是为什么在嘈杂的酒吧里，人跟人还是可以交流，因为噪音的调变相对人声来说是高频的，人会专注在追踪有共振腔的人声上而忽略噪音的干扰。同时，语速不同也会影响人对语义的理解，如果听不懂的时候，适度放慢语速就会帮助理解。

基于这个原理，在语音模型训练上，“聆感智能”主要有两种方法。一是，找人录音，在实验室采集人声后，让它适应各种模拟噪音源的环境，不分白天黑夜，让机器跑数据；二是，由数据公司提供素材，团队训练模型。人教会机器如何定义数据、标记数据，让机器形成自己的数据逻辑去收集海量的素材。

建造语音实验室

“聆感智能”的初期盈利模式，主要依靠给客户提供不同模块的解决方案。当前，公司专注于超低功，在语音交互的听觉装置使用，可支持边缘计算的语音晶片。

智能语音实验室。

在智能语音领域，大公司基本上都有自己的实验室，但中小企业几乎没有实验室，想做测试的时候就很不方便。因此，今年7月，公司建成语音实验室，可以提供开放的语音实验室的测试与服务。

Peter介绍，最初建设实验室，就是想在方便自己的同时，也做一个开放的实验室环境，能让同行，甚至是竞品公司都可以使用。国内在语音测试方面还没有形成共识，随着市场教育和更多的普及，实验室有望让公司能够有计划参与到行业标准规范的制定当中。

声学实验室主要有两个用途：一个是做声学验证，将设计好的各种产品，经过产品、模组、语音等层面的测试，验证其是否合格；另一个是语音产品的交互认证，通过自动化接入不同公司的标准来配合测试，验证其是否合格。

在销售方面，“聆感智能”目前是代理商模式协助销售公司模组与晶片。因为公司目前不直接生产终端产品，和供应商都是合作关系，因此业务比较容易拓展。其合作伙伴分为三类：一是声学器件类，比如AAC（瑞声科技），楼式电子，美律电子等；二是晶片商类，国内外不同的晶片商；三是算法类，团队会整合算法伙伴和自有的技术融合后整体授权卖给客户。

当前，“聆感智能”团队共有9人，创始人团队均在国际知名的语音公司有过10多年的从业经验。

Peter表示，在未来将会尝试针对听觉装置(hearable device)等不同类型的产品进行开发，进一步将生理讯息的侦测整合到听觉装置，用于健康保健方面，并于临床做可行性的尝试和评估。

/The End/

编辑 | 吴晋娜校对 | 南镜

优质项目"融资首发绿色通道"：创业者请加微信qianbidao01，务必注明项目名称；或发送BP至wujinna@pencilnews.cn。

如需转载文章请联系铅笔道微信客服号铅笔道小铅笔（微信号：qianbidao2018）获取授权资质，否则我们将依法追究相关责任。

聆感智能>

智能音频方案服务商

程用杰发表457篇文章

我是本文作者程用杰，关注科技和企业服务，对农业、教育也很感兴趣，相关行业创业者求报道，咱们微信聊聊：13651112465。（加好友请注明公司、职位、事由哦）