查看原文
其他

CNCC技术论坛 | 建立基准测试为基础的数据中心计算开放研究生态

中国计算机学会 中国计算机学会 2021-01-27


2018中国计算机大会(CNCC2018)将于10月25-27日在杭州国际博览中心(G20会场)举行,大会主题为「大数据推动数字经济」(Big Data Drives the Digital Economy)。


10月15日前报名可享优惠,详见文末信息。


根据IDC的数据统计,以大数据、人工智能和互联网服务为代表的数据中心计算市场份额已经远远超过了高性能计算。目前,数据中心计算负载和数据完全控制在工业界,除了有限的学术合作(包括学生访问),学术界完全被隔离;出于保护商业秘密,工业界的巨头们也彼此隔离。与传统的高性能计算研究(学术界可以深入了解负载和数据)相比,数据中心计算的研究存在巨大的挑战,需要学术界和工业界的团结和合作。该论坛从负载和数据出发,先讨论如何建立领域统一的评测指标和基准测试程序,在此基础上进一步研讨体系结构、系统、数据管理和算法等领域如何协同工作,以及学术界和工业界如何共同发展。


时间:2018年10月27日  13:30 – 17:35

地点:杭州国际博览中心会议区一层103A会议室


主席





詹剑锋


简介:中科院计算所博士生导师和系统结构国家重点实验室研究员,中国科学院大学岗位教授。目前研究方向包括:基准测试, 并行与分布式系统,领域相关的软硬件协同设计,医学/科学大数据系统。创建了基准测试领域跨学科国际会议 Bench (International Symposium on Benchmarking, Measuring, and Optimizing)。担任并行与分布式系统领域权威国际期刊TPDS的编委。在国内外期刊和会议上发表论文约140篇,申请专利近40项。代表性研究工作有: Data motifs、可扩展和统一的大数据和AI基准测试项目BigDataBench;集群和云计算系统软件(已转移到上市公司曙光);数据中心节点操作系统(转移给华为);先后获得国家科技进步二等奖、中科院杰出成就奖,IISWC 2013 最佳论文奖和华为技术贡献奖。个人主页: http://prof.ict.ac.cn/jfzhan。


共同主席

曹政


中科院计算所计算机系统结构方向博士,加州大学戴维斯分校博士后;2009~2016年就职于中科院计算所,副研究员,青促会会员,主要负责曙光系列高性能计算机的研发工作;撰写期刊及会议论文70余篇,获专利授权30余项。2017年加入阿里巴巴集团,任资深技术专家,在基础设施事业群(AIS)负责下一代阿里巴巴数据中心架构的研发。


特邀讲者





须成忠


IEEE Fellow。中国科学院深圳先进技术研究院首席科学家、曾任美国韦恩州立大学电子与计算机工程系教授系主任。须成忠博士是美国华裔教授学社理事。中国自然科学基金会2010“海外杰青”获得者。2011年入选国家“千人计划”和“广东省领军人才”计划。2015年出任全球IEEE分布式处理技术委员会主席。他是国家云计算和大数据重大专项咨询委员会委员,中科院感知中国先导专项总体专家组成员,国家云计算检验检测服务平台负责人。他也是广东省云计算信息安全工程实验室主任。须成忠的主要研究方向主要研究方向包括并行与分布式系统,云计算和大数据。迄今在相关领域的一流学术期刊和会议上已发表SCI/EI 论文250 余篇,其中包括100 余篇IEEE/ACM 会刊和其他一流国际期刊论文。他的两本专著《Load Balancing in Parallel Computers》(Springer, 1996) 《Scalable and Secure Internet Services and Architecture》(CRC Press, 2005)受到业界广泛关注和引用。至今他的论文已被引用8500 多次。须成忠现任多家国际著名学术期刊的编委,包括IEEE Transactions on Computers, IEEE Transactions on Parallel and Distributed Systems, IEEE Transactions on Cloud Computing, Journal of Parallel and Distributed Computing和《中国科学:信息科学》。他积极参与了60 多个该领域的国际学术会议的组织及评审委员会的工作,并担任十多个国际会议的大会主席或程序委员会主席。


演讲题目:基于机器学习的数据中心智能调度


摘要:数据中心的核心关键是资源调度与管理。数据中心面临平台异构多样,任务请求动态多变,在离线混部应用相互干扰等挑战。传统的调度管理方法无法满足资源管理精细化与自动化的要求。相比而言,机器学习办法擅长在不确定的环境中谋求类人智能,数据中心计算环境的不确定性及应用的多样性为机器学习提供了理想的应用场景,数据中心的管理积累了大量的数据,为基于机器学习的智能调度创造了必要条件。演讲将着重讨论相关路线的机会与挑战和我们在阿里云数据中心的初步研究成果。



魏巍


阿里巴巴工程师。目前在阿里巴巴基础架构事业部AI架构与应用团队工作,专注于深度学习算法,异构计算加速(GPU,XPU等),软硬件调优以及机器学习算法在医学图像领域和高光谱图像领域的应用。加入阿里之前在密歇根大学做图像算法博士后研究,以及在三星美国研发中心做GPU应用及构架建模。


演讲题目:AIMatrix:阿里巴巴Benchmark计划的AI基准测试集


摘要:阿里巴巴正在制定一套能够体现阿里巴巴业务特征的Benchmark,其中AI Matrix是一个测试AI软件框架和硬件平台的标准。它旨在为用户提供一个测量不同AI软件和硬件的平台并且比较它们的性能。最终我们希望它可以帮助用户了解影响AI硬件性能的因素并帮助用户改进硬件设计。AI Matrix包含四类测试:底层测试,单层测试,完整测试,和合成测试。测试粒度逐渐增加。底层测试着重于AI硬件计算中重要的GEMM计算;单层测试着重于评价神经网络里面的每一层;完整测试着重于评价不同应用领域的完整模型;合成模型会综合不同的模型输入,生成一个符合统计特征的模型。




Xiaoyi Lu

Dr. Xiaoyi Lu is a Research Assistant Professor of the Department of Computer Science and Engineering at the Ohio State University, USA. His current research interests include high performance interconnects and protocols, Big Data Analytics, Parallel Computing Models, Virtualization, Cloud Computing, and Deep Learning system software. He has already published more than 100 papers in major International conferences, workshops, and journals with multiple Best (Student) Paper Awards or Nominations. He has delivered more than 100 times of invited talks, tutorials, and presentations worldwide. He has been actively involved in various professional activities in academic journals and conferences. Recently, Dr. Lu is leading the research and development of RDMA-based accelerations for Apache Hadoop, Spark, HBase, and Memcached, and OSU HiBD micro-benchmarks, which are publicly available from http://hibd.cse.ohio-state.edu. These libraries are currently being used by more than 290 organizations from 34 countries. More than 27,300 downloads of these libraries have taken place from the project site. He is leading the research and development of MVAPICH2-Virt (high-performance and scalable MPI for hypervisor and container based HPC cloud). He is a member of IEEE and ACM. More details about Dr. Lu are available at http://www.cse.ohio-state.edu/∼luxi.


演讲题目:Paving the Way for RDMA into High-Performance Data Centers


摘要:The increasing demands of high-performance data processing and communication in modern data centers have been driving the networking speed increase from 1Gb/s to 100Gb/s or higher. The traditional Sockets-based TCP/IP protocols can no longer keep up with the increasing performance demand. Consequently, the advanced capabilities of RDMA (i.e., Remote Direct Memory Access) enabled networks are paving the way for designing novel high-performance communication and I/O protocols in data centers, blurring the boundary between local and remote data access. However, fully utilizing RDMA-capable networks for the end applications is still full of challenges. 



李晓阳


百度异构计算资深架构师,百度AI推理引擎Anakin主要作者。主要从事AI异构计算平台设计和算法优化。对计算机视觉算法和深度学习学习算法在异构硬件上的部署和优化有丰富的经验。


演讲题目:百度AI推理引擎实践


摘要:当前,AI技术广泛的应用在搜索、语音识别、图像识别、自然语言处理和自动驾驶等领域。随着应用场景及任务的复杂度增长,AI推理过程的计算量也呈现爆炸式增长。为了满足AI算力需求,各硬件厂商分别推出不同的异构硬件解决方案。然而差异化的硬件架构需要其适配的软件平台,造成部署困难。在此背景下,百度开发了一款开源、跨平台、高性能AI推理引擎Anakin。本次主题将主要介绍Anakin推理引擎的设计思想,异构硬件性能表现以及未来发展路线图。



田磊磊


高级技术专家,在阿里云计算存储服务-文件存储团队从事分布式存储领域工作多年,有着丰富的分布式存储开发经验。


演讲题目:阿里云文件存储的高性能架构演进之路


摘要:阿里云文件存储是基于飞天盘古的分布式网络文件存储。随着近几年人工智能,高性能计算,基因等领域的兴起,大数据存储成为其中至关重要的一环。尤其是对存储的性能提出了更高的要求,要求高吞吐,高iops,低延时。本次报告首先将介绍阿里云文件存储如何架构在飞天盘古之上,然后介绍我们在高性能方面遇到的机遇和挑战,最后会介绍我们在高性能计算领域的实践。

Panel 主持人

郑   晨   中科院计算所 博士


Panel 嘉宾:

程   虎   中科院软件所  研究员/博士生导师

须成忠  中国科学院深圳先进技术研究院  研究员

查   礼   中科院计算所副研究员

程   华   无锡江南技术研究所  高级工程师

任祖杰   杭州电子科技大学  副教授

曹   政   阿里巴巴 博士

魏   巍   阿里巴巴  工程师

Xiaoyi Lu  Ohio State University  Research Assistant Professor

李晓阳   百度  异构计算资深架构师

田磊磊   阿里巴巴  高级技术架构师


Panel嘉宾简介





程虎


中国科学院软件研究所研究员、博士生导师,美国纽约科学院院士。曾任国际期刊 Computer Standards & Interfaces 编委,IJCAI 顾问委员会委员,国际神经网络学会会员,IEEE软件工程标准委员会委员,国际标准化组织(ISO)几个计算机语言标准工作组组员。1974年作为第一作者与曹东启研究员合写《编译程序入门》,科学出版社出版,在国内业界有一定影响。先后参加国家“七五”、“八五”、“九五”和“十五”重点科技攻关项目,并主持“编译系统开发”专题,开发过Lisp语言编译系统,FORTRAN77语言编译系统和Java伴侣软件,多次受到国家、电子部和中科院奖励。承担军用共性软件课题分别开发了三个非Ada语言到Ada83语言的自动转换系统。在人工智能、专家系统和神经网络方面,1987-1989年和1994-1995年先后两次分别承担国家自然科学基金项目“智能计算机核心语言的研究”和“联结机制与符号机制相结合建立专家系统的方法”的研究。带领博士生从事神经网络方面的研究与应用,研究成果多次在国际会议和软件学报上发表,得到国内外同行专家的广泛关注与认可。在开展研究开发工作的同时,为硕士研究生授课和精心培育了数十名硕士研究生和若干名博士研究生,有两位获得院长优秀奖学金,一位获得亿利达奖学金。他也获得华为奖教金的鼓励。



程华


无锡江南技术研究所总师,中科院计算所计算机系统结构专业博士,清华大学计算机系博士后,美国俄亥俄州立大学访问学者,硕士生导师,中国计算机学会理事、高性能专委会委员、女计算机工作者委员会常委。长期从事系统评测研究及工程实践,主要研究方向为系统性能评价、国产化系统评测和低功耗评测。研究成果转化为2项国家标准和5项军用标准,是自主可控度评估、系统集成评测、操作系统评测等重要测试标准的制定者,为推动信息系统国产化做出了重要贡献。获“中国标准创新贡献奖”一等奖1项、省部级科技进步一等奖1项(序3),二等奖3项(序1,1,9)。



任祖杰


杭州电子科技大学计算机学院副教授,兼任之江实验室项目管理处处长。于2010年浙江大学计算机学院博士毕业,主要研究方向为数据中心系统与大数据存储。主持国家自然科学基金、浙江省重点研发计划、阿里巴巴“AIR”计划项目等多项课题,并作为核心成员参与多项国家科技支撑计划,863项目。近期在IEEE TPDS、TSC等会刊上发表多篇论文,获IISWC 2012大会最佳论文奖,获2017年浙江省科技进步二等奖。



郑晨


中科院计算所计算机系统结构方向博士,2017年毕业并就职中科院计算所博士后,目前于先进计算机系统研究中心系统软件实验室工作,主要研究方向包括数据中心操作系统,大数据基准测试程序,性能优化和网络安全等,申请相关国内外专利6项。


更多信息详见大会官网:http://cncc.ccf.org.cn


即日起至10月15日,报名且缴费成功即可按优惠价格参加CNCC2018! CCF会员参会、参展可享优惠。



请扫描二维码报名参会


咨询电话:010-6260 0336   邮箱:cncc_pr@ccf.org.cn

中国计算机学会 


微信号:ccfvoice           

长按识别二维码关注我们

CCF推荐

【精品文


点击“阅读原文”,报名参会



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存