北京市语言声学与内容理解重点实验室

基本信息 开放实验室名称北京市语言声学与内容理解重点实验室
类型北京市重点实验室
认定部门北京市科学技术委员会认定时间2011年6月
依托单位中国科学院声学研究所
所属功能平台首都科技条件平台
所属领域电子信息
负责人颜永红
服务特色语言声学与内容理解实验室于2002年知识创新工程的支持下成立,隶属于中国科学院声学研究所,同时是中科院重点实验室和北京市重点实验室。 实验室的主要研究方向包括语音信号处理、语音识别、语种识别、说话人识别、关键词检测、以音频为载体的信息掩蔽(水印)、目标音频检索、基于内容的音乐检索、语音音色变换、数字化家庭等。 实验室承担了国家863、973、国家网络与信息安全中心、国家自然科学基金、中科院知识创新工程和中科院百人计划等项目;具备了具有国际水平、国内领先的音频/语音信息分类和处理平台,主要包括:非特定人大词表连续语音识别系统、语种识别系统、说话人识别/确认系统、识别置信度评价及关键词检测系统、基于哼唱的音乐检索系统、固定音频检测系统、语音音色变声系统、噪声消除系统、音频水印编解码系统等。 在产业化方面,中科信利语音实验室能够提供国际一流的语音技术产品和解决方案。研发产品涵盖服务器平台(电信级)、桌面平台和嵌入式平台(无线终端设备,PDA, 掌上设备等)。中科信利研发的电信级语音识别产品已在国内20余个省级电信运营商和各类金融、能源、互联网企业的客服中心中进行商业化运营;桌面平台语音识别产品已成为英特尔数字家庭台式电脑的捆绑软件;嵌入式平台产品已集成于国内多家手机厂商和智能家庭设备厂商的产品内。
科研队伍和骨干专家中国科学院语言声学与内容理解重点实验室,专注于语言声学、以音频信息处理为主的数字媒体内容理解技术研究。拥有一支以中青年为骨干的一百余人的核心研发团队,其中“百人计划”入选者3人,国家杰出青年基金获得者1人、“新世纪百千万人才工程”国家级人选1人、科技支撑项目首席科学家1人、研究员10人、副研究员19人, 其中海外留学归国人员12人。
科研成果实验室累计获得授权发明专利42项、软件著作权登记100余项,有40余项发明专利正在审查中。已在高水平国际国内期刊和国际会议发表论文300余篇。在国内外语音技术评测中多次获得第一名,包括:2003和2004年度的国家863语音识别技术评测第一名、2004年国家网络安全中心的语音关键词识别评测第一名;2003年在美国NIST语种识别评测中取得第三名,2006年至2009年,连续在国际音乐检索比赛MIREX中取得多项评测指标第一名,2010年在国家****中心语音识别评测中获得第一名,2012年在国家某部委特种语音技术评测中获得第一名,2013年在国家两个部委特种语音技术评测中获得第一名,2014年在国家网信办举办的特定音频分析系统评测大赛中语种/说话人/关键词识别均获得第一名。获得省级科技进步一等奖2项。最近五年承担国家863重点、国家973、国家自然科学基金重点、国家科技支撑、多个部委等科研项目四十余项。与中科院新疆理化所、百度在线网络技术(北京)有限公司、山东共达电声股份有限公司合作,建立了三个联合实验室。语音核心技术在移动互联网、电信、广电、终端等行业得到广泛应用,基于实验室核心技术的产品在中国移动23个省得到实际应用,打破了国外公司对中国语音识别市场的垄断;先后给百度、腾讯、阿里巴巴等企业提供语音识别核心引擎。特种语音技术已实际应用于相关领域的几个国家级工程中,有多项成果已经进入相关部委装备清单。
代表仪器设备

代表仪器设备

名称1

磁盘阵列

原值(万元)

171.6

厂商及型号:

中科曙光DS900-G20

主要性能参数:

1、最大驱动器数量:1440

2、控制器形状 2个控制器(在26U机柜中,合计12U);

3、内存 256GB

4、闪存 24TB

5PCI扩展插槽数 24个;

6、支持存储网络 FCFCoEIP SAN(iSCSI)NFSCIFSHTTPFTP

7、操作系统版本 Data ONTAP 8

功能用途:

语音信息处理

专业服务机构名称北京科岳中科科技服务有限公司
负责人郭庆山联系人崔洪梅电话82628024
邮箱cuihongmei@nctt.ac.cn邮编100086
地址北京海淀中关村保福寺桥100号