经验
计算
博客

语音边缘计算和计算机视觉的内部观察

2019年9月10日,

由Saleel Awsare


又到了一年中的大日子了阿姆斯特丹IBC会议我们非常高兴能与我们的主要客户和服务提供商见面,他们为我们的智能客厅和智能设备提供了所有精彩的娱乐。对于Synaptics来说,这是一个极好的节目,因为它将我们所有的媒体流媒体领域的合作伙伴聚集在一个屋檐下,这样我们就可以在当前和未来的项目上进行合作。对于我们来说,这也是一个展示我们的想法的好方式,即他们如何为他们的服务的消费者提供新的和有帮助的用户体验。

我们展示的很大一部分将专注于智能家居中的前沿计算soc,强调有用的机器学习技术,既为用户提供便利,也为服务提供商提供潜在的新收入流。我们称之为智能边缘AI,它包括我们强大的soc与神经网络加速器结合智能计算机视觉和语音处理。我认为边缘计算最重要的方面之一是能够在有或没有互联网云连接的情况下操作设备。这不仅改善了用户隐私和安全性,还提供了健壮可靠的性能。

让我们进入我认为是我们在IBC做的最酷的演示。

语音识别
现在,我们大多数人都习惯了对着电脑大声说话,并从语音助手那里获得反馈。Synaptics是为智能音箱和其他智能家居设备提供远场语音技术的全球领先供应商。所以我们把这项技术整合到我们的边缘计算soc上,在这种情况下,把声音放进电视的媒体流设备中。现在想象一下你和电视说话,它能识别你的声音。你甚至不需要注册你的声音,它只是通过生物特征信息从其他声音中识别你的声音。既然媒体streamer知道谁在说话,它就可以根据用户历史记录提供个性化的内容偏好菜单。如果房间里有另一个人也一样。很酷吧!这一切都是在你家里的隐私边缘完成的。你可以看看这个视频看看它是怎么运作的。

脸识别
与语音识别非常相似的是面部识别,但这次使用的是摄像头和计算机视觉智能。这一次,该设备识别你的脸,并提供与我描述的语音识别类似的首选内容。你喜欢运动,你的配偶喜欢神秘,这一切都取决于谁站在镜头前。但如果你们都在一起看电视呢?嗯,它也通过机器学习发现了这一点,并显示出一个与你们通常一起观看的节目相关的内容菜单。将所有这些与语音相结合,你就有了一种强大的方式为用户提供便利。在这里观看我们的面部识别演示视频

标志检测
我们进行的另一个计算机视觉演示与相机无关。这一次,我们的智能边缘人工智能技术“看到”电视上正在播放的内容。它可以识别某些内容,比如宝马或CNN的标志,准确率高达99%。如果服务提供商知道他们的客户喜欢看什么,它就可以提供推荐内容,比如需要付费的电影。这当然是服务提供商增加盈利的好方法,但它也提供了更好的用户体验。他们还可以提供高度定向的、有规模的成本广告。你可以看到我们在视频演示中做了这个

事件检测
与logo检测类似,我们可以使用机器学习来检测各种内容。让我们以棒球比赛为例。我看了很多棒球比赛,但没有时间沉浸在几场3小时的比赛中。我们解决了这个问题,创造了一个在短时间内观看多场比赛的机会。我们训练该设备寻找音调,通过机器学习,所有的音调都被标记在比赛的时间轴上。现在我可以简单地跳到每一个球场,在同一时间观看三场比赛的所有兴奋。你可以把这当成你的个人运动亮点。这个例子是一个伟大的资产,任何媒体streamer和一些服务提供商可以营销销售更多的设备。看看我们怎么做的这是一个简短的视频演示

Synaptics在边缘计算AI方面进行创新。请参加9月13日至17日在阿姆斯特丹举行的IBC 2019,我们将在那里展示我们最新的智能家居解决方案。我们位于16号套房1号厅的二楼阳台。如需预约,请与您当地的Synaptics客户代表联系。

关于作者

saleel

Saleel Awsare
PC和外设部高级副总裁兼总经理
linkedin

接收最新消息