​启闳半导体科技(江苏)有限公司QiHong Semicon TECHNOLOGY (JIANGSU) CO.,LTD

电子邮箱  
密码      忘记密码?
  注册
七年三代AI芯片,启英泰伦的智能升级路
来源:半导体行业观察 | 作者:李寿鹏 | 发布时间: 2022-08-05 | 919 次浏览 | 分享到:



据介绍,启英泰伦在新一代产品实现了两大核心技术突破,一是增加了离线自然语言语义处理,支持离线NLP;二是增加双麦深度人声分离技术,无需记住任何命令词,同时具备识别能力和理解能力,支持用户以自然的方式随心和设备交互。


首先看行业首次突破性的离线NLP方面。


在之前,业界普遍认为只有云端才能实现NLP,但启英泰伦最新的技术已经可以采用端侧智能语音芯片实现NLP,将语音处理放在端侧,既保障了用户的体验感,又能降低云端搭建和运营成本,降低网络带宽消耗,也能提升用户使用的安全性。而为了帮助下游客户实现敏捷开发、快速落地的目标,启英泰伦还推出了语音AI平台。该平台支持10000用户同时开发,即时生成NLP模型,提供更自然的语音交互能力。


其次,从启英泰伦的演示我们可以看到,通过芯片的深度人声分离技术,语音模块仍然可以良好识别到目标人声。这标志着现在的语音设备可以适应几乎所有的应用场景,也包括推广环节的嘈杂人声场景。


至于上文谈到的 2.0 版本命令词自学习技术。据何云鹏所说,该技术对不管自然噪声,音乐噪声和电视噪声都具备良好的适应能力,在 60 到 65 分贝噪声条件下依然具备良好的识别表现,这已经非常接近大数据训练模型的效果,其效果已经明显的与跟随我们的同行拉开了差距。


“可以说该技术终于从功能和性能上彻底解决了方言口音的问题。该技术可以支持的词条数,可以多达 50 多条。我们的合作方甚至可以利用这个技术去开发各种小语种的识别应用。”何云鹏告诉记者。


基于这些突破,启英泰伦推出了具备算力更高、高度集成和算法新高三大特点的新一代芯片。


从芯片算力来看,CI130X系列芯片内置 BNPU 3.0 和支持 DSP 指令扩展的 RISC CPU 两大内核,主频高达 240MHz,并具有 640KB 系统 SRAM。这就使其不但拥有更灵活的计算性能、还具备更强的可编程性,支持高并行向量运算。


来到芯片集成度方面,CI130X系列芯片集成了 Audio Codec 的模拟 MIC 接口,数字 PDM 麦克的DMIC 接口,通用的 ADC以及 MCU 常见的串口,PWM,GPIO 等接口。此外,芯片还还进一步集成了 4 线 Nor Flash, 3 路 LDO 的 PMU,还有高精度的 RC 振荡器等。大大简化了开发者的设计。


最后,在算法性能方面,CI130X系列芯片支持几乎全部信号处理技术和识别技术。包括单麦自适应降噪,降混响,回声消除,DOA(语音定向),波束形成,盲源分离,语音活动检测等传统信号技术。