标签: 语音识别
布尔诺科技大学的SE-DiCoW革新语音识别技术
研究团队在语音识别领域取得了重要突破,开发出了一种名为SE-DiCoW的新技术,能够让计算机在复杂的多人对话环境中准确识别出每个人说的话。在日常生活中,我们经常会遇到多人同时说话的场景,比如会议室里的讨论、采访现场的...
千问语音识别模型Qwen3-ASR开源:可识别52个语种与方言
据了解,Qwen3-ASR是由Qwen开发的一系列功能强大的语音识别模型,包括两个强大且全面的语音识别模型Qwen3-ASR-1.7B与Qwen3-ASR-0.6B,以及一个创新的语音强制对齐模型Qwen3-ForcedAligner-0.6B。Qwen3-ASR系列的语音识别模型...
谷歌发布MedGemma 1.5与MedASR,升级医疗影像与语音识别能力
1月14日消息,谷歌宣布推出升级版医疗多模态AI模型MedGemma1.5,以及全新的医疗语音识别模型MedASR,为开发者提供开放、可扩展的AI工具,用于医疗影像解读、电子病历处理和语音病历转写。MedGemma1.5在原有MedGemma1的基础上,...
支持多方言 26款迈腾B9语音识别准确率超95%
语音助手基于科大讯飞方案,支持20秒连续对话,普通话、四川话、粤语均可精准识别,95%以上的识别准确率实现双手解放。叠加自研AI大模型矩阵后,AI本地生活、用车助手、新闻推送等功能全面覆盖,新增的AI短视频随心搜更贴合...
1秒定位船舶,语音识别率近九成!吴淞海事局自研系统将推动安全监管向智能化迈进
吴淞海事局相关负责人表示,经过前期多轮优化,该系统语音识别率已接近90%,可以帮助值班人员1秒定位船舶,同时还可以结合实时的通航环境,为不同的意图标记风险等级,为船舶提供精细化的航行安全保障。下一步,吴淞海事局将...
解锁AI语音控制新玩法:语音识别模块在各行业的创新应用场景
智能语音识别控制器是一种集成了语音识别、自然语言处理和智能控制功能的电子设备或系统。用户通过语音指令来操作、管理或控制其他设备、系统或应用,无需物理接触或传统交互界面(如按钮、触摸屏)。AI人工智能语音识别控制模块...
不止于“听话”智能语音识别控制器如何靠图形编程实现多路设备管理
智能语音识别控制器是一种融合语音识别技术、物联网通信技术与设备控制模块的智能终端设备,核心功能是将人类自然语言指令转化为设备可执行的电信号,实现对各类终端设备的语音操控,广泛应用于智能家居、工业物联网、智慧农业...
提升农业语音识别技术在智慧农业中的应用效果 介绍
智慧农业场景中,农户常因双手操作农具、田间环境复杂,难以通过触屏或按键控制智能设备,农业语音识别技术本应成为便捷交互的核心工具,但传统技术受方言、噪音、功能单一限制,应用效果不佳。而江苏叁拾叁想要做到的就是提升...
台大突破:AI语音识别实现方言精准理解
这个看似简单的问题,其实涉及到一个困扰语音识别技术多年的难题。来自国立台湾大学的研究团队在2025年10月发表了一篇名为《Pseudo2Real:Task Arithmetic for Pseudo-Label Correction in Automatic Speech Recognition》的...
语音识别遇上扩散大脑:剑桥-清华-伊利诺伊团队让机器听得更准确
这项由剑桥大学菲利普·伍德兰德教授、清华大学张超教授以及伊利诺伊大学香槟分校等顶尖学府合作完成的研究,发表于2025年9月的ArXiv平台(论文编号:arXiv:2509.16622v1),首次将扩散大语言模型技术引入语音识别领域。...