江南-高信噪比MEMS麦克风驱动人工智能交互

[导读]在英飞凌,我们一向深信出色的音频解决方案对晋升消费类装备的用户体验相当主要。我们果断不移地致力在立异,在自动降噪、语音透传、灌音室灌音、音频变焦和其他相干手艺方面获得了显著前进,对此我们深感高傲。作为MEMS麦克风的领先供给商,英飞凌集中资本改良MEMS麦克风的音频质量,为TWS和耳罩式耳机、笔记本电脑、平板电脑、会议系统、智妙手机、智能音箱、助听器乃至汽车等各类消费装备带来出色体验。 在英飞凌,我们一向深信出色的音频解决方案对晋升消费类装备的用户体验相当主要。我们果断不移地致力在立异,在自动降噪、语音透传、灌音室灌音、音频变焦和其他相干手艺方面获得了显著前进,对此我们深感高傲。作为MEMS麦克风的领先供给商,英飞凌集中资本改良MEMS麦克风的音频质量,为TWS和耳罩式耳机、笔记本电脑、平板电脑、会议系统、智妙手机、智能音箱、助听器乃至汽车等各类消费装备带来出色体验。 今天,我们糊口在一个冲动人心的时期,人工智能正在完全改变平常糊口,而ChatGPT等东西正在经由过程直不雅的文本和语音交互从头界说工作效力。跟着人工智能系统的不竭前进,传统的贸易模式、崇奉和假定正在遭到挑战。语音在新兴的人工智能生态系统中饰演甚么脚色?作为企业带领者,我们是不是需要从头思虑我们的信心? 生成式人工智能的鼓起是不是会下降高质量语音输入的主要性,或高质量语音输入是不是会成为普遍采取人工智能办事和小我助理的需要前提? 人工智能,从得力助手到最好的伴侣 人类不但会按照问题的内容,也会按照发问的情势调剂本身的回覆,这是很天然的工作。人类的声音供给了各类线索,可用来判定发问者的春秋、性别、社会和文化布景和情感状况。另外,辨认所处的情况(如机场、办公室、交通或跑步等体育勾当)也有助在肯定发问者的意图,并响应地调剂谜底并更好的对话。 虽然人工智能的能力有了长足的前进,但人们依然认为,基在人工智能的辅助东西缺少准确猜测人类发问意图或特定信息将若何被解读的能力。为了改良人机交互,人工智能在做出修辞选择时应斟酌三个要害身分:对听者的领会、听者的情感状况和情况布景。 在很多环境下,仅凭领受到的音频旌旗灯号就足以提取有效的信息并做出恰当的反映。例如,斟酌一下与素未碰面的人进行德律风或音频会议的环境。更主要的是,斟酌一下在没有机遇当面交换的环境下,一小我在频频扳谈后对另外一小我的感知是若何成长和转变的。 比来的研究注解,即便人工智能的说话反映气概产生细小的转变,也会致使人工智能的社交能力和个性产生较着转变。我们有来由假定,在恰当的声音输入程度下,将来的人工智能系统将可以或许作为有用的火伴阐扬感化,表示出人类伴侣的行动,例如扣问并真正聆听谜底,或只是聆听并在恰当的时辰保存判定。 人类若何体验音频旌旗灯号? 与任何说话交换一样,音频信息也利用说话和文字来转达思惟、感情和不雅点。另外,调子、速度、音量和布景噪音等其他交换元素也会影响对信息的整体感知。 从科学的角度来看,人耳基在两个要害身分来感知音频旌旗灯号:频率和声压级。声压级(SPL)以分贝(dBSPL)为单元,暗示环绕情况年夜气压振荡的声压幅度。100dBSPL的声压级相当在割草机或直升机发出的庞大噪音。声压级规模内的最低点(0dB)等效在20µPa的声压振荡,这代表具有最好听力的健丰年轻人在1kHz频率下的听力阈值。所有与说话有关的人类声音都属在100Hz至8kHz的频段。按照ISO 226:2023 尺度,响应的人类听力阈值如图1所示。 图1:听力阈值:按照ISO 226:2023,人在反复实验中做出 50%准确检测反映的声级 如图1所示人耳对 500Hz至6kHz 规模内的频率特殊敏感。这些频率上的任何频率均衡问题城市对声音和乐器的感知质量发生重年夜影响。500Hz至4kHz 之间的频率包括了人类语音中影响语音清楚度的年夜部门信息。具体来讲,2 kHz 摆布的频率尤其主要。5kHz至10kHz 的频率对音乐很是主要。这些频率为声音增加了 "活力 "和 "亮度"。但是,这些频率包括的语音信息相对较少,只有咝声,即 "zhi"、"chi"和 "shi"等词开首的嘶嘶声。下降 6-8kHz摆布的咝声会对语音清楚度发生晦气影响。 我们年夜大都人都知道,人类的听力阈值会跟着春秋的增加而降落,如图 2 所示。 图 2: 该图显示了分歧春秋段本体正常的男性在单声道耳机凝听前提下的听阈衰减环境。请留意,女性也有近似的图表,其听力弱减水平随春秋增加而略有下降(ISO7029:2017) 值得留意的是,即便是轻度听力损掉(年夜大都人的听力损掉产生在40至50岁之间)也会对小我糊口发生重年夜影响。例如,得了轻度听力损掉的人在喧闹的情况中跟不上集体谈话可能会碰到坚苦。另外,他们还可能错太重要的听觉提醒,如正告旌旗灯号或警报。 今朝的音频硬件是不是足以知足将来人工智能的需要? 既然我们已对人类若何感知音频旌旗灯号有了更好的领会,那末让我们从头审阅一下最初的问题,即当前和将来的人工智能需要甚么样的音频输入质量,才能到达与人类无异的程度。 今朝市场上的年夜大都消费类装备都利用MEMS麦克风记实音频旌旗灯号。MEMS 麦克风是人工智能小我助理的首要音频捕获手艺,利用人工智能助理手艺的装备今朝已最先在市场上发卖。 MEMS 麦克风的灌音质量取决在其动态规模(dynamic range)。动态规模的上限由声学过载点 (AOP) 肯定,它界说了麦克风在大声压级时的掉真机能。麦克风的自噪声肯定了其动态规模的下限。权衡麦克风自噪声的方式是信噪比(SNR),它界说了麦克风的自噪声与其捕捉的旌旗灯号(活络度)之间的比率。不外,就我们的会商而言,信噪比有些不适合,由于信噪比的自噪声利用了A计权(A-weighting),而A计权实际上是基在人类感知音频旌旗灯号的能力来界说的。 假如音频旌旗灯号的预期领受者是人工智能,则相干的麦克风的等效噪声级ENL(equivalent noise level)是权衡机能的更适合参数,由于它疏忽了录制声音的人类感知身分。等效噪声级ENL指的是在没有外部声源的环境下麦克风发生的旌旗灯号。等效噪声级ENL以分贝(dBSPL)为单元,暗示与麦克风自噪声不异电压的声压级。 值得留意的是,不管后期采取何种声音处置方式,低在等效噪声级ENL的任何声音信息根基上城市丢掉,没法恢复。是以,假如音频链路中没有其他元件在旌旗灯号达到人工智能算法之前引入噪音,麦克风ENL便可以被视为人工智能算法的听觉阈值。应当留意的是,这是一个高度简化的假定,由于音频链中凡是还很多其他组件,包罗声道、防水庇护膜和音频处置链路。 请参考图 3两种MEMS麦克风等效噪声级ENL曲线与人类听力阈值的直不雅对照。 图 3:中端和高端MEMS麦克风的1/3倍频程等效噪声级ENL与典型男性听力阈值的比力 红色线条的是信噪比为65dB(A)的麦克风的等效噪声级ENL曲线,麦克风集成了防尘设计。响应的MEMS麦克风今朝已用在多家供给商出产的多款高端智妙手机中。 下面的紫色线条暗示英飞凌最新高端数字麦克风的等效噪声级ENL曲线,该麦克风具有立异的防护设计,可实现防尘防水结果。这款麦克风代表了当前的手艺程度,本年才在高端平板电脑上发布。我们估计,到本年年末,机能相当的麦克风将呈现在高端智妙手机上。值得留意的是,将麦克风的自噪声下降 5-10dB是一项重年夜成绩,特殊是斟酌到声压是利用对数刻度来暗示的。 固然英飞凌在下降高端MEMS麦克风的自噪声方面获得了显著进展,但与人耳比拟,麦克风在分辨低声压级的能力方面仍有很年夜差距。特别是2kHz四周,对确保人类听众取得高程度的声音清楚度相当主要。年青人的听觉能力与英飞凌最早进的麦克风之间的差距跨越12dBSPL。与今朝高端手机中利用的麦克风比拟,差距较着更年夜,到达17dBSPL。需要再次指出的是,这一评估仅斟酌了MEMS麦克风的自噪声,并未斟酌音频链中会进一步下降整体机能的额外噪声源。 今朝MEMS麦克风手艺的局限性在包括年夜部门人类语音信息的频率规模(500Hz - 4kHz)内最为较着。即便是市场上最早进的MEMS麦克风,其声音理解能力也只能到达60岁白叟的程度。按照现稀有据,可以公道地估计,利用最新MEMS麦克风手艺的人工智能虚拟助手将呈现与老年人近似的听力障碍,特殊是在需要在喧闹情况中或远距离跟读对话的环境下。 总结与瞻望 人工智能的飞速成长不但不会减缓,反而会加快MEMS麦克风向更高信噪比成长的趋向。固然最新的MEMS麦克风还没法与人耳的音频质量相媲美,但英飞凌在下降麦克风自噪声方面获得的进展有益在现有和将来的人工智能。进一步改良音频链路将是加强人工智能能力的要害,例如四周情况分辩、语境理解、感情意识、措辞者辨认和多人对话记实。有了更好的音频输入,人工智能与人类的互动体例将能与人类之间的互动相匹配,乃至八两半斤。 另外,人机交互程度的提高将促进新的基在人工智能的用例和办事。例如,想象一下将来的微软Copilot,它不但能总结团队会议内容,还能供给对扳谈空气的整体评估。将来的人工智能辅助功能也许可以基在人类的语音和音频,凸起显示重点或依照主要性进行排序。另外,还可以添加教导功能,为用户供给有效的建议,帮忙他们更好地将将来的对话引向所需的标的目的。 试想一下,人工智能可以对新的求职者进行第一轮面试,或仅凭音频就可以辨认措辞者,其平安级别足以知足网上购物的需要。 所有这些可能只是将来人工智能的一小部门,将来人工智能的听力能力将到达或跨越人类。凭仗我们的加强型 MEMS麦克风解决方案,英飞凌很侥幸可以或许介入这一冲动人心的路程。 作者:Gunar Lorenz博士 英飞凌科技手艺市场高级总监 校订:丁越 英飞凌科技消费、计较与通信营业年夜中华区 首席工程师

欲知详情,请下载word文档 下载文档

北京2024年8月27日 /美通社/ -- 在8月23日举行的2024年长三角生态绿色一体化成长示范区结合招商会上,软通动力信息手艺(团体)股分有限公司(以下简称 软通动力 )与长三角投资(上海)有限...

要害字: BSP 信息手艺

上海2024年8月26日 /美通社/ -- 本日,高端全合成润滑油品牌美孚1号联袂品牌体验官周冠宇,开启全新路程,助力泛博车主经由过程驾驶去摸索更广漠的世界。在全新发布的品牌视频中,周冠宇和分歧布景的消费者表达了对驾驶的酷爱...

要害字: BSP 汽车制造

上一篇:江南-存储器 下一篇:江南-ST