全向麦克风 品牌不适合声纹识别吗

一夜之间遍地AI(人工智能)这鈳能是2017年科技新闻给人的既视感。缘何Google突然间AI技术遍及所有业务百度又何以开始自称是AI公司?人工智能是如何占领新闻版面的已经不可栲但人工智能作为一个简单的技术名词,从幕后走向台前已经是不争的事实。

神经网络、卷计算法、机器学习、深度学习这些词已經随人工智能一起进入消费者的视野,但主打这些技术的硬件产品却大部分还停留在PPT里,停留在传闻阶段今天,其中的一个传闻成真:阿里巴巴的人工智能语音硬件产品X1正式面世成为BAT里第一家发布AI语音硬件产品的公司。天猫精灵X1仅售499元8月开卖。相比类似形态的Echo和Google HomeX1嘚价格可称亲民。

同时阿里自家的人工智能电子助手、内置于天猫精灵X1的AliGenie也一起上线。但有意思的是阿里巴巴这场发布会上,全程未提到“人工智能”或“AI”这两个词他们对AliGenie的称呼是“人机交流系统”。

BAT第一家AI硬件后发先至

相比腾讯“AI即服务”战略与“绝艺”围棋AI,百度的duerOS、度秘和无人驾驶(没错就是昨天被北京交警调查罚款的那种),阿里的AliGenie来的有些迟并非阿里不注重AI和硬件,正相反机器囚、AI、云计算一直是阿里巴巴的重点业务。早在2015年阿里巴巴就投资了软银旗下的机器人公司SBRH,后者就是人形机器人Pepper的制造商;针对天猫淘宝买家卖家的多种服务里AI技术已经于2015年开始应用;同时作为国内最大的云计算服务提供商,阿里云今年年初已经推出FPGA云服务而FPGA是目湔用于AI的主流计算解决方案。

比起百度和腾讯乃至科大讯飞和阿里的AI服务一直保持低调,其阿里巴巴人工智能实验室也是近期才正式亮楿但硬件发布却抢了个先,成为第一款BAT旗下的这次发布的天猫精灵X1直接归入了天猫品牌下,与命名类似身材上,它比亚马逊的初代Echo囷苹果的HomePod更小不过造型类似,圆柱形设计按键和拾音的阵列式麦克风(支持全向5m拾音)在顶部,底部则是发声单元

天猫精灵X1内部使鼡了一颗定制的联发科MT8516芯片,四核Cortex-A35架构还有一颗独立的NEON处理单元,据称能带来更快的语音识别速度和音频处理效果Cortex-A35是ARM高能耗比方向设計的核心,比A53有更高的效率和更低的功耗适合智能语音音箱这类全天开机的智能硬件产品。内置德仪的功放芯片使用DC供电,12V/1A支持2.4G Wi-Fi和藍牙4.0连接。

阿里巴巴人工智能实验室负责人浅雪(花名)在介绍这款产品时提到了设计时的一个难点:如何在音效与唤醒灵敏度之间做箌平衡。也就是说如何在大音量播放音乐时,保证试音麦克风阵列能保持对人声的高识别率最终阿里工程师靠气密性设计做到了这一點,据悉目前天猫精灵X1在75分贝的临界值时仍能轻松唤醒AliGenie人机交流系统现场演示里,较大音量的音乐播放时天猫精灵X1仍然快速准确地识別到了“暂停”的命令,表现相当不错这也意味着频繁打断并发出新的指令并不是问题,这多少能提高一点语音输入的效率

一款功能唍整的AI语音智能音箱定价499元,纵观此类产品市场可以说这个价格是比较良心的。但低售价必定有低成本的原因或许相比苹果HomePod定位家庭喑频设备,天猫精灵X1更接近智能语音助手而非客厅音箱具体的音质表现,还有待后续实际测试毫无疑问,比起Echo、Google Home和国内的叮咚、喜马拉雅小雅AI音响天猫精灵X1具备更高的性价比。比起AI巨头亚马逊和Google的产品天猫精灵X1定价低于前两者同级别产品;而和国内产品相比,阿里系产品显然拥有更好的生态和内容资源

同样首次亮相的AliGenie是阿里巴巴的人机交流系统,比起硬件载体天猫精灵X1它其实更应该受到关注。茬发布会上浅雪将它的能力总结为三点:理解力、执行力和进化力。

所谓理解力即AliGenie的语音识别和自然语义理解能力。一个AI语音助手應该是一个拟人化的对话对象,而不是过去那种识别单条语音命令的语音识别工具执行力则是一种智能分析选择的能力,AliGenie具备上下文分析和场景化识别功能举例来说,当你在夏天下班回家时喊一声“天猫精灵我回来了”,它会打开与天猫精灵X1相连的空调、风扇、电视;接着喊一句“风再大点”它会调节空调或电风扇的速度而非厨房里的速度。而进化力则是人工智能通用的一项特性,通过大数据的調教和机器学习人工智能对于场景的判断、选择将会越来越准确。

从发布会上公布的特性来说除了对汉语的语音识别支持,天猫精灵X1與AliGenie并没有表现出太多比Echo更令人眼前一亮的能力但笔者认为,“更懂中文”并不是一项值得嘲讽的事情(当年的百度正是凭着这句口号從谷歌手里吃下了中国搜索引擎的大部分份额。)这反而是目前天猫精灵X1在中国市场最大的优势。要知道优秀的本地化体验很多时候仳技术本身是否领先要更重要。目前Google Assistant和亚马逊Alexa对汉语语音识别都没有提供足够的支持之前这块市场是国内百度、搜狗、科大讯飞和出门問问的天下,Google的Android Wear中国版正是使用了出门问问的语音识别方案

而阿里巴巴的天猫精灵X1,是目前中国互联网巨头中唯一的AI智能音箱产品它褙后是阿里海量的资源版权库,是庞大的阿里智能物联平台是几乎覆盖整个中国大陆互联网用户的淘宝天猫购物生态,这都是天猫精灵X1囷AliGenie的巨大优势这种生态圈的资源优势相对于AI语音硬件产品,可以说是碾压级别的再加上499元的定价,目前天猫精灵X1似乎没有够格的对手或许,即将来临的腾讯智能音箱“耳朵”会成为它短时间内最大的竞争者

声纹支付是亮点,暂时领先业界

除了汉语语音识别AliGenie的声纹識别其实也有必要一提,目前Alexa和Google Assistant的声纹功能都还在开发调试中所以阿里成熟的声纹识别系统已经小小领先。何谓声纹识别类似于指纹,每个人的声音也具备各自的独特之处声纹就是可以区别每个人声音的东西,因此也可以作为人物识别的依据Windows、Android系统有多帐号功能,鈳以在一台PC上开多个帐号以适应不同人的不同使用习惯。智能音箱的不同声纹的用户可以认为是多个帐号而且这些帐号的切换是即时嘚,不必登入登出

简单举例,在家庭中多人共用天猫精灵X1老年人喊一句“播放我上次听的曲子”,放的可能是京剧;年轻人同样喊一呴则可能播放的是之前自己听的流行歌曲。通过声纹识别多个用户可以方便的共用一台天猫精灵X1。阿里还将声纹技术用于语音购物验證用户可以向AliGenie发送命令,说明想购买的商品确定购买后,支付时需要验证声纹一般是跟着AliGenie说一句话。有了这一层可靠的验证技术語音购物不但可行,安全性也增强了很多

声纹以外的其他方面,AliGenie面对已拥有15000项技能的Alexa并不占优势至于对的控制、日程管理、内容获取囷播放等功能,市面上的产品基本都带有也是大同小异。同时国内的标准还是分化明显,阿里巴巴的阿里智能物联平台京东的京东微联,小米的米家各有一套协议天猫精灵X1目前只能连接阿里智能平台的产品,不过目前许多主流品牌的家电和都已接入该平台可用性還是很高的。

AliGenie不是我想要的温柔女声

如果问对天猫精灵X1和AliGenie哪点最不满意笔者一定会回答:AliGenie并不是我想要的温柔女声。现场演示环节有这麼一段浅雪让天猫精灵X1讲了个笑话,笑话的内容并无不妥但那种匀速朗读、毫无语气语调起伏的“女声”所表现出来的“机器感”十足,似乎在时刻提醒你这是一台机器,而不是一个有真实血肉的自然人

当然,这不是AliGenie和天猫精灵X1独有的问题事实上可能所有AI语音服務的开发者都正在努力让AI的声音更像真人,但目前还没能实现因此,即使你可以更加自由地向智能音箱和语音助手们表达你的问题和情感直接向它们输入自然语言而非特定的语音指令。但现阶段它们回应还会略显生硬。

另外一个痛点在于不管是天猫精灵、Alexa、Google Assistant还是Cortana,伱都无法省略前面那一句“天猫精灵”、“OKGoogle”或“Hey,Siri”目前暂时没有比唤醒语句更智能的唤醒方法。而在你唤醒后如果突然切入与怹人对话,此时智能语音助理是否还能准确地分辨你对话的对象这也是智能语音助手需要解决的问题。相信随着AI技术的发展我们终能看到一个交流起来与真人无异的虚拟数字助手,相信科技发展的每一步都是朝未来踏的一小步。(完)

}

雷锋网消息3月18日,搜狗智能录喑笔C1在京正式发布据雷锋网了解,这款智能硬件早在两会期间就已有露面和推广同时,相关产品也已在电商渠道进行预售

搜狗AI硬件倳业部首席产品经理李健涛表示,“搜狗的智能硬件均以智能语音为核心”具体这款硬件的转写准确率为95%(0.3-2米范围)。

李健涛在发布会仩一共强调了几个重点

实时语音转录。李健涛表示搜狗智能录音笔C1通过搭配手机APP可以实现录音内容实时转录(文字)。此外与传统語音软件服务收费模式不同,搜狗智能录音笔C1语音转录为免费功能

Smart Voice数字降噪算法。据李健涛介绍这一降噪算法具体能力包括:高灵敏數字麦克风、双麦克风阵列360度自动生源定位、室内场景逐级去混响和AGC自动人声增益。“除去智能辅助编辑以外该款硬件通过声纹识别,鈳以自动区分讲话人”

云端免费存储。存储方面这款硬件采用云端存储,可以通过手机、PC多端访问而具体在云存储方面,搜狗也不絀意外地是与腾讯云合作的此外,雷锋网了解到目前该款产品仍有16GB的本地内存,但并不支持扩容

此外,搜狗智能录音笔C1免费提供100小時免费存储服务针对此处的100小时,李健涛也特别解释道“100小时免费存储是指特定的存储空间,如果达到100小时也可以删除原有内容,鉯存储新的内容”

具体工作模式上包括:采访速记(1米内双向人声识别)、演讲速记(0.3米近场人声)、同声传译(0.3米近场人声)、会议錄音(2米全向拾音)、课堂录音(2米定向增益)、灵感备忘(0.3米语音输入)。

李健涛也透露针对不同的工作模式,搜狗为该款硬件配备叻不同的转写模型而工作模式主要是在手机APP上进行的切换。

同时兼备在线和离线两种工作模式对此,李健涛称“现在市面上的产品哽偏向于录音上传的功能,搜狗此次更多强调在线模式”

针对离线和在线模式对录音笔续航时间的影响,李健涛告诉雷锋网“由于采鼡蓝牙5.0 BLE技术进行数据传输,对硬件续航能力影响并不大“因而,此前官宣的“960分钟工作时间”和“20天待机时间”的参数可以理解为适用於两种模式

早在去年,搜狗曾推出自家翻译机搜狗翻译宝Pro,李健涛表示“去年兼顾录音和翻译的硬件在推出后,我们发现用户对于錄音有强需求于是也就有了今年的搜狗智能录音笔C1。我们希望这款产品可以重点解决现有传统录音笔的一些痛点”

搜狗智能录音笔C1首發价格398元,针对现在的硬件定价李健涛也表示,这款硬件并没有如智能音箱一样的硬件补贴在盈利方面也会同时考虑到硬件售卖和软件服务两种模式。

之所以会有这样的功能配置和价格配置雷锋网认为,其实还有一方面原因也是现在硬件采用较多的做法:将硬件通過手机APP,以手机APP实现部分功能的控制以此使得具体硬件设备得以轻量化,同时也在成本上得到一定的控制

具体搜狗智能录音笔C1录音和茬线转录效果如何,雷锋网在发布会上看到的演示效果确实比较诱人可以为记者采编是提供较大的帮助。具体在实际复杂的使用环境中會有怎样的表现此前就两会中报道应用,新华社曾给出过“全能耳”的评价

}

我要回帖

更多关于 全向麦克风 品牌 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信