北京大学数字视频编解码技术国家工程实验室

基本信息 开放实验室名称北京大学数字视频编解码技术国家工程实验室
类型国家重点实验室
认定部门国家发展和改革委员会认定时间2006年
依托单位北京大学数学科学学院
所属功能平台高性能计算机及虚拟三维生成技术平台
所属领域电子信息
负责人高文
服务特色数字视频编解码技术国家工程实验室(简称“NELVT实验室”)由国家发展改革委员会宏观指导,在教育部领导下,依托北京大学建设,同时在研究开发以及测试与集成应用方面与支持单位华为技术有限公司、国家广播电影电视总局广播科学研究院、中国科学院计算技术研究所及其所属的联合信源数字音视频技术(北京)有限公司等密切合作建立平台。工程实验室研究采用开放模式组织,设立开放课题以及聘请高水平客座研究人员。
通过组织领导视频编解码国家标准制定,积极参与相关国际标准制定,建立完善的视频编码与系统技术标准体系;针对标准需要的关键技术,开展视频编码的核心算法研究,成为本领域核心专利的重要产出中心;推进视频编解码专利池的建立,吸收、集成本领域国内、国际先进专利技术,实现标准制定和专利许可的联合创新和良性互动;建立数字视频研究开发的开放平台,支持国内企业和科研机构开展研究开发工作,配合标准的出台与实施,研制编解码核心软件、芯片IP核和原型产品,引导和推动国内产业界的规模化投入;搭建试验、测试、验证和示范平台,建立客座研究员聘任和开放课题机制,成为视频行业的实验开发和测试验证公共支撑服务中心和专业人才的培育中心。
科研队伍和骨干专家科研队伍:
数字视频编解码技术国家工程实验室有科研人员27名,研究生41名,管理人员3名。
骨干专家:
高文,北京大学信息科学技术学院教授,数字媒体研究所所长,数字视频编解码技术国家工程实验室主任;兼任IEEE T-CSVT(视频技术学报)AE(副主编)、IEEE T-AMD(自主神经计算学报)AE(副主编)、JVCI(视频通信与图像表达期刊)Editor(编委),以及IEEE视频信号处理和通信技术委员会(VSPC)委员、IEEE多媒体系统与应用技术委员会(MSA)委员、国家信息技术标准化委员会多媒体分委员会主任委员、数字音视频编解码技术标准(AVS)工作组组长等;是香港科技大学、清华大学等的兼职教授。主要研究领域为智能人机交互与多媒体技术,侧重于计算机视觉、模式识别与图象处理、多媒体数据压缩、多模式接口以及虚拟现实等的研究。近十年主要研究兴趣包括视频编码与分析、手语识别与合成、人脸识别、数字图书馆等。
科研成果多功能感知技术——静止图像压缩技术
多功能感知技术是中科院百人工程项目,静止图像压缩技术是其成果之一,1997年7月中国科学院主持召开鉴定会,通过了对该项成果的技术鉴定。静止图像压缩技术提出了基于后向自适应局部纹理方向识别的预测模型BAROLTO,并可有效解决“模型稀释”问题的Poisson统计模型。对JPEG测试集合的实验结果表明,在最大允许误差为1时,基于这两个模型的高保真图象压缩系统效率比IBM公司的SUNSET系统提高4.1%,比HP公司的LOCO_Ⅰ/JPEG-LS系统提高5.3%。该项技术将Context概念引入DCT系数矩阵,提出了DCT与Context相结合的大压缩比静止图像压缩方法,在国际上处于领先地位。
多功能感知技术——手语自动翻译与虚拟人合成
手语自动翻译与虚拟人合成技术也是多功能感知技术的成果之一,在中国手语识别方面,首次研究了大词汇表(达1000以上的汉语词汇)的手语识别问题,正确识别率达92%-95%,并提出帧预技术,明显提高了系统的识别速度。在手语合成方面,利用虚拟人合成技术首次合成了3163个基本中国手语词汇的手势,不但具有较好的可懂度,且达到手语与语音的词内同步播放。该成果在中国手语识别与合成方面属于奠基性的工作,取得突破性进展,处于国际领先水平,其所研制的面向中国人的正常人与聋哑人的实时双交流系统属国际首创。
代表仪器设备
专业服务机构名称北京北达燕园微构分析测试中心有限公司
负责人江向峰联系人北大基地电话010-62565921
邮箱lc@labpku.com邮编100871
地址北京市海淀区中关村北大街123号科方孵化器2306室