随着chatgpt、sora等大模型和相关生成式ai技术取得日新月异的进展,如何基于开源软件生态系统、结合中国实际情况,构建适合中国学术界和工业界所需的大模型,并进行模型训练、推理、部署和服务,已经成为广泛关注的重要话题。
本论坛邀请学术界和工业界专家进行报告分享,探讨支撑大模型的ai基础设施技术,以及相关开源软件生态如何支持大模型的发展和革新,为学术界和工业界的研究者和从业者提供一个交流探讨该领域最新进展和发展趋势的平台。
01
论坛组织委员会
李浩源(alluxio)
马郓(北京大学)
02
论坛议程

03
论坛报告嘉宾简介

刘譞哲
报告题目:大模型时代的系统软件:挑战、机遇与实践
报告摘要:
以大模型、大数据、大算力为核心要素的人工智能应用,开始呈现出具有大规模、广分布、高动态、非确定的复杂特征,传统软件理论诸多假设正在被打破。本次报告将从计算机系统栈角度出发,分析大模型时代系统软件的基本抽象、组成原理、资源管理、编程模型等面临的挑战和机遇。
报告人简介:
刘譞哲,北京大学博雅特聘教授,国家杰出青年科学基金获得者,国际计算机学会(acm)杰出科学家。主要研究方向为系统软件,近年来主要研究兴趣是大规模分布式智能计算系统,包括大模型系统、泛在智能体系统、云计算系统等。在sosp/osdi/asplos/sigcomm/nsdi/mobicom/mobisys/icse/fse/www/imc/sigmetrics等发表论文80 余篇,获国际万维网大会www最佳论文奖(best paper award,中国首个)。曾获国家技术发明一等奖、教育部“青年科学奖”、教育部科技进步一等奖等科技奖励。主持国家自然科学基金、国家重点研发计划等科研项目10余项;担任ieee open software services 奖励委员会主席、ieee technical committee on services computing(tcsvc)副主席、中国计算机学会服务计算专委会副主任等学术服务。

陈全
报告题目:面向神经网络高效推理的多级软件栈优化技术
报告摘要:
神经网络推理是重要的计算任务,且部署在云平台或高性能边缘节点上以实现动态感知的弹性扩展。为实现神经网络推理,其软件栈包括加速器虚拟层、资源管理与编排层、及应用推理框架层。如何在整个软件栈的各层次进行系统性优化,以提高神经网络推理的性能和效率是目前的研究热点。为此,该报告将分析提高神经网络推理的主要瓶颈,并且介绍一系列性能保证的推理任务资源共享、服务器无感知推理的快速启动、及基于画像的推理模型动态优化等相关技术。
报告人简介:
陈全,上海交通大学计算机系教授。长期从事计算机系统、计算机体系结构的研究,目前在相关领域发表学术论文一百余篇。研究获国家优青、国家自然科学基金重点项目资助。曾获中国计算机学会优秀博士学位论文奖、ieee tcsc青年学者奖、阿里青橙奖。担任sci期刊parallel computing、jcst、fcs编委及青年编委。研究成果曾获国家技术发明二等奖、省部级科学技术一等奖多项。

东昱晓
报告题目:大模型开源探索与实践
报告摘要:
基础大模型在意图感知、指令跟随、目标规划等方面展现出强大的泛化能力,正成为当下人工智能发展的核心技术之一。报告将分享团队在glm系列模型研发过程的开源探索与实践。自22年8月开放千亿基座模型glm-130b,收到70多个国家1000余家国内外机构的研究使用需求。23年3月开源 chatglm-6b,系列对话模型在hugging face (hf) 全球累计下载超1700万,累计四周位列 hf 大模型趋势榜第一。科技部于2023年5月发布的报告显示 chatglm-6b 位列中国大模型开源影响力第一,团队共5个glm系列模型位列前十。开源模型详见 https://github.com/thudm。
报告人简介:
东昱晓,清华大学计算机系副教授,曾工作于脸书人工智能和微软总部研究院。研究方向为数据挖掘、图机器学习和基础大模型,相关成果获ecml’23, www’22/19, wsdm’15最佳论文奖或提名,应用于十亿级用户社交网络和知识图谱。获sigkdd博士论文奖提名、ijcai early career spotlight、蚂蚁intech科技奖、acm sigkdd新星奖。

李浩源
报告题目:alluxio accelerates ai
报告摘要:
alluxio ai edition是一个创新的高性能数据访问平台,它连接了各种机器学习引擎与存储系统,实现了跨区域和跨云的数据虚拟化。它简化了大规模数据应用的访问和管理,提供了按需数据访问,优化了数据架构,确保在正确的时间访问正确的数据。
alluxio支持ai训练任务的高性能数据集管理,包括数据湖操作和消除数据冗余,减少了对专用硬件的依赖。它允许灵活的数据部署,充分利用计算资源,无论数据位于何处。同时,alluxio可以提高gpu使用率,降低整体数据架构的成本。该报告将分析提高数据访问性能的主要瓶颈,并介绍alluxio的原理、技术及核心价值。目前,全球市值前十名的互联网公司中,已经有九家在生产环境中使用了alluxio。
报告人简介:
李浩源,alluxio创始人、董事长兼ceo,北京大学计算机系本科,康奈尔大学硕士,uc berkeley amplab 博士。在伯克利大学攻读博士期间,师从分布式系统和网络领域泰斗ion stoica教授和scott shenker教授。李浩源博士在读期间创立alluxio(曾用名tachyon)技术原型,并获得硅谷和中国著名vc / pe机构投资,创立alluxio公司并致力于推广技术商业化。对开源软件和分布式大数据分析等方面有丰富的经验。在sosp/nsdi等国际顶级会议发表论文10余篇,google scholar 引用量3000 ;担任alluxio开源社区主席和apache spark成立委员会委员。

李烨
报告题目:在企业级软件系统中应用llms的策略、方法和挑战
报告摘要:
本报告首先阐述llms 对 ai 产品研发的影响,包括软件研发范式的转变、研发人员结构的转变,从 ai 到 ai;第二部分介绍基于 llms 的企业定制软件研发,主要涉及ai 产品研发的挑战、llms 产品研发方法论、基于 llms 的产品研发流程;第三部分行业案例分析,包括营销行业和法律行业等。
报告人简介:
李烨,微软ai亚太区首席应用科学家,ccf高级会员,曾在sun、emc 等跨国it公司的核心研发部门工作,20 年软件研发经验,12年 ai 产品研发经验,8年 ai2b 经验。专家领域为知识图谱、智能对话、自然语言理解、人工智能企业凯发k8登录的解决方案、人工智能行业赋能。著有 《机器学习极简入门》、《人工智能入行实战:从校园到职场》、《提示工程:方法、技巧与行业应用》等。

黄康
报告题目:大规模ai算力管理调度软件构建方法与实践
报告摘要:
随着人工智能技术的快速发展,大规模ai算力管理调度软件成为了实现高效ai计算的关键。本报告旨在探讨构建大规模ai算力管理调度软件的方法与实践,包括技术架构、资源调度策略、以及实际应用案例。
报告人简介:
黄康博士,泛睿算力联合创始人,具有多年算法及架构搭建和丰富的创业及团队管理经验,曾负责超过200人全球技术团队的组建管理和产品凯发k8登录的解决方案的搭建,带领团队成为 google top developer 和 tensorflow 中国官方凯发网址的合作伙伴。
04
论坛组织委员会简介

论坛主席:李浩源
个人简介:
李浩源,博士,alluxio创始人、董事长兼ceo,北京大学计算机系本科,康奈尔大学硕士,uc berkeley amplab 博士。在伯克利大学攻读博士期间,师从分布式系统和网络领域泰斗ion stoica教授和scott shenker教授。李浩源博士在读期间创立alluxio(曾用名tachyon)技术原型,并获得硅谷和中国著名风投机构投资,创立alluxio公司并致力于推广技术商业化。对开源软件和分布式大数据分析等方面有丰富的经验。在sosp/nsdi等国际顶级会议发表论文10余篇,google scholar 引用量3000 ;担任alluxio开源社区主席和apache spark成立委员会委员。

论坛主席:马郓
个人简介:
马郓,北京大学人工智能研究院研究员、助理教授、博士生导师,大数据智能系统研究中心执行主任,数据空间技术与系统全国重点实验室主任助理,入选国家高层次青年人才计划。研究方向为智能系统软件,在www、icse、fse、mobicom、软件学报等国内外顶级会议和期刊发表高水平论文50余篇,获授权发明专利30余项,主持国家重点研发计划课题、国家自然科学基金等10余项科研项目,获2022年ieee云计算技术创新奖、ieee icsoc 2023杰出论文奖、ieee trans on mobile computing期刊亮点论文等奖励。