大数据应用服务技术北京市工程实验室

基本信息 开放实验室名称大数据应用服务技术北京市工程实验室
类型北京市工程实验室
认定部门北京市发展和改革委员会认定时间2014年3月
依托单位中国科学院计算机网络信息中心
所属功能平台
所属领域电子信息
负责人黄向阳;实验室主任:黎建辉
服务特色北京市工程实验室的主要功能包括:开展支持大数据应用服务的云计算关键技术研究开发、大数据融合管理和关联发现关键技术研究开发、大数据分析与可视化关键技术研究开发,形成大数据管理系统、大数据并行处理引擎、大数据分析与挖掘工具集;汇聚支持大数据相关技术与系统测试的多形态基准测试数据资源和程序库,建设服务于大数据相关技术研发成果的测试平台;通过食品安全、智能交通、中小企业管理信息化和新材料创新等大数据应用进行示范验证;产出各类论文、标准、建议与原型;大数据应用服务技术相关产品研发、成果转化和应用;大数据应用服务技术交流、扩散与服务;人才培养等。
工程实验室的主要任务是通过对支持大数据应用服务的云计算、大数据管理与发现、分析与可视化等技术的研究;汇聚各类基准测试数据集和基准程序库,建立服务于大数据研发成果的测试平台,产出各类论文、标准、建议与原型;在食品安全、智能交通、中小企业管理信息化和新材料创新等大数据应用进行示范验证,积极开展国际学术交流以及产学研合作,包括软硬件销售、集成开发及公益服务;培养相关人才,提供大数据应用服务技术产业重大工程技术、标准的评价与咨询服务,实施知识产权战略,为大数据应用服务科研界和产业界提供新技术测试和辐射平台。
科研队伍和骨干专家工程实验室建设队伍包括院士、知名专家等组成的20名技术委员会以及64名高中级研发成员,通过工程实验室每年培养30名的大数据应用服务符合性人才。
实验室主任拟聘黎建辉研究员担任。黎建辉,男,1973年出生,现为中国科学院计算机网络信息中心主任助理、科学数据中心主任,研究员,博士生导师,CODATA 中国委员会秘书长。2007年获得中国科学院计算技术研究所博士学位,主要从事大数据存储与处理、多源异构数据融合等方向的研究工作,做为负责人正在或者已经承担过国家自然科学基金重点基金、科技部科技支撑计划、国家科技基础条件平台“基础科学数据共享网—理化生物天文空间”、中国科学院战略性先导科技专项“数据资源中心及其关键技术”、中国科学院信息化专项“科技数据整合与共享工程”、院地合作、国际合作项目等20多项。发表论文70余篇,其中SCI收录4篇,EI收录40多篇,国际期刊3篇,主持获国家标准一项,申请国家标准1项,参与了2项国际标准的研制,获得国家发明专利3项,实用新型专利1项,申请国家发明专利20项,获得软件著作权20余项。是2012 International Conference on Networking and Distributed Computing的General Chair,国际顶级会议the ACM KDD 2012和2013 Workshop: Big Data Mining的PC Member,2013 IEEE 9th International Conference on e-Science的Local Organizing Co-Chairs。荣获:2012年度“中国产学研创新奖”,2012年度中科院科技创新“交叉与合作团队”计划,2011年“国家科学进步二等奖”,2011年度“中国科学院院地合作奖先进个人二等奖”,2008年“国家环境保护部一等奖”。
科研成果工程实验室通过关键技术的研发,发表相关论文8篇,申请发明专利6项,并获得2项发明专利;形成两个主要平台:
(1)云计算平台。实现对计算、网络等相关资源的虚拟化,虚拟机的全生命周期的管理,各类资源的全流程、多粒度的运行监控,异构服务器和异构虚拟化计划的统一管理等。部署方式分为公有云、私有云以及混合云,其中公有云的环境已有1000多台虚拟机,为国防科大、中科院、中科院出版集团提供服务;私有云目前已经在中科院地理所等10几个单位部署使用。
(2)云存储平台。实现对存储资源的统一管理和服务技术,将块存储、文件存储和对象存储一同整合到统一存储中,提高存储资源利用率,简化管理和降低总体成本;并提供针对大数据存储需求,实现了基于C/S的大数据存储传输服务,并对外发布兼容Window/LINUX传输客户端,支持TCP大窗口传输、并发传输、加密传输、压缩传输、断点续传等功能。目前已为340多个用户提供200TB的存储服务。
代表仪器设备

名称1:

流式大数据实时处理与服务集群

原值(万元)

152.816

厂商及型号

Dell R720集群

主要性能参数

处理集群由40台dell 720组成,每节点配置双e5-2600处理器,32G内存,6块300G高速15000RPM磁盘,万兆网卡和SAN HBA卡;集群处理能力480个cpu核;总内存1280GB;配置72TB本地15000RPM高速SAS磁盘;集群内部通过万兆网络线速互联;同时集群具备SAN存储高速数据交换能力

功能用途

用于流式大数据应用的测试与服务

名称2

48光口低延时万兆线速接入交换机

原值(万元)

10.4985

厂商及型号

Force10 S4810

主要性能参数

dell S4810交换机,低延时,配置48个万兆10GBase-T/10Gb SFP+端口,2个40Gb QSFP+端口,可扩展到4个40Gb端口,背板带宽1.2TB以上,包转发率900Mpps以上,所有端口全线速交换

功能用途

用于设备高速网络互联交换

名称3

存储服务器

原值(万元)

12.40571

厂商及型号

Dell R720xd

主要性能参数

dell 720xd,配置2个md1200磁盘扩展柜,36块4TB磁盘,双cpu,64G内存,万兆网卡

功能用途

用于大数据应用研发和测试存储


专业服务机构名称北京科岳中科科技服务有限公司
负责人郭庆山联系人崔洪梅电话82628024
邮箱cuihongmei@nctt.ac.cn邮编100086
地址北京海淀中关村保福寺桥100号