
基础模型是推动软件开发领域变革的核心力量,随着大模型技术的发展与普及,基础模型正在迅速融入软件工程的各个环节。基础模型与软件工程的融合,通过对需求、设计、编码、测试等流程的智能化优化,为软件开发带来了前所未有的效率提升与创新能力。基础模型正逐步成为软件开发行业的战略资源,助力各大企业在技术革新中占据市场竞争的制高点。
基础模型之下的软件工程专刊论坛,为面向软件工程的大模型关键技术研究、安全保障、生态建设及其相关领域的学术界、工业界研究人员提供一个分享和研究成果与实践的交流平台。论坛汇集基于大模型的软件缺陷修复、面向软工任务的提示工程技术、代码审查及代码搜索等方法的发展趋势和潮流。欢迎软件工程、人工智能、软件分析、信息安全等领域的专家与学者前来参加。
01
论坛组织委员会
高翠芸(哈尔滨工业大学(深圳))
胡星(浙江大学)
夏鑫(华为)
李戈(北京大学)
02
论坛议程

03
论坛报告嘉宾简介

李戈
报告题目:大模型的底层问题及对软件自动化的影响
报告摘要:
最近一段时间的研究表明,当前大模型的基础模型存在一些问题,表现在推理能力、泛化能力、学习效率等多个方面,这些问题对大模型的学习能力、推理能力都产生了一定的影响。基于此,对以代码生成为代表的软件自动化任务也产生了一些影响。基于当前的大模型技术还能否实现软件自动化的长期愿景?对大模型的底层技术应该做出哪些改进?本报告将我们近期的一些研究成果进行介绍,并对上述问题进行开放性探讨,希望引发大家的思考和关注。
报告人简介:
李戈,ccf杰出会员,北京大学计算机学院长聘教授(博雅特聘教授),教育部长江学者,博士生导师,软件与微电子学院软件工程与数据技术系主任,中国计算机学会(ccf)软件工程专委会副主任,ccf系统软件专业委员会常委,ccf大模型论坛常委。研究方向:软件工程、人工智能、智能化软件开发。国际上 “基于深度学习的程序理解与生成”的先驱性研究者,多项成果被国际学者认为是“首创性成果”并被广泛引用。所带领的研究团队在多项研究任务中一直保持着国际领先结果,是该领域国际知名的研究团队。

彭超
报告题目:marscode agent:基于大语言模型的软件缺陷自动修复
报告摘要:
近年来,大型语言模型(llms)的进展显示出在自动化各种软件开发任务方面的巨大潜力,包括代码补全、测试生成和错误修复。然而,由于现实世界软件系统的复杂性和多样性,llms在自动化错误修复方面的应用仍然面对很多挑战性。为了解决这些问题,我们提出了marscode agent,一种利用llms自动识别和修复软件代码中错误的新框架。marscode agent结合了llms的强大功能与先进的代码分析技术,能够准确定位故障并生成补丁。我们的方法遵循系统化的流程,包括计划、错误重现、故障定位、候选补丁生成和验证,以确保高质量的错误修复。在swe-bench上的评测和企业的真实代码仓中的部署显示,与大多数现有的自动化方法相比,marscode agent在错误修复方面取得了很高的修复成功率。
报告人简介:
彭超,字节跳动软件工程实验室技术专家、高级研究员。2021年博士毕业于爱丁堡大学并加入字节跳动。研究方向包括llm4code、软件测试、程序分析等。在icse、ase、fse、icsme等会议research和industry track上发表数篇论文,担任fse等会议程序委员会成员。
04
论坛组织委员会简介

论坛主席:高翠芸
个人简介:
高翠芸,哈尔滨工业大学(深圳)计算机科学与技术学院副教授,博士生导师,学校青年拔尖人才,香港中文大学(cuhk)博士,深圳市“海外高层次人才”,鹏城实验室双聘学者。主要研究方向为软件分析、软件知识库挖掘、软件安全、代码自动化生成、元宇宙软件等。已在国际顶级会议和期刊(icse,ase,fse,tse,www等)发表70 篇论文。荣获2024年ccf-a类会议icse杰出论文奖、2024年ccf-a类会议icse企业竞赛通道最佳论文奖、2023年ccf-a类会议ase杰出论文奖、2022年ccf-a类会议 icse 杰出论文奖提名和2022年 mobilesoft 杰出审稿人奖,指导学生获得2022年ieee acait最佳学生论文奖。

论坛主席:胡星
个人简介:
胡星,浙江大学软件学院副教授、博士生导师、获北京大学信息科学技术学院博士学位。主要研究方向为智能化软件工程,软件供应链安全,程序理解,软件仓库挖掘。在tosem、icse、ase、fse和emse等高水平会议和期刊上发表论文40余篇。担任tosem,jsep期刊编委。主持国家自然科学基金专项培育项目,参与国家重点研发计划等多个科研项目。获得icse2024 acm sigsoft distinguished paper award,msr acm sigsoft distinguished paper award,icpc 2018 acm sigsoft distinguished paper award。担任forge2024和internetware2023程序委员会主席,担任国际级顶级期刊(tse、tosem、emse)审稿人,受邀担任国际会议ase。icse、msr、icsme、saner的程序委员会成员。

论坛主席:夏鑫
个人简介:
夏鑫目前担任华为软件工程应用技术科学家和首席专家。他的研究方向是智能化软件工程、软件仓库挖掘和经验软件工程。夏鑫获得了2022年acm sigsoft early career researcher award(亚太地区第一位),部分论文获得国际会议最佳/杰出论文奖项,其中连续四年获得软工顶会ase 2018-2021的杰出论文奖。此外他担任msr、saner、promise等会议的steering committee,多个国际会议的pc (icse,esec/fse, ase等),多个期刊的编委(tosem、emse、asej、jsep等),以及参与组织了多个国际会议(icse 2023和2024, ase 2016、2020和2021等)。更多信息在https://xin-xia.github.io/

论坛主席:李戈
个人简介:
李戈,ccf杰出会员,北京大学计算机学院长聘教授,博士生导师,教育部长江学者,ccf软件工程专委会秘书长。长期聚焦于程序理解、程序生成、深度学习等技术的研究,是国际上最早从事“基于深度学习的程序理解与生成”研究并取得代表性成果的研究者,在多个国内外顶级会议与期刊发表相关论文50余篇,多篇论文被国际学者认是“首创成果”并被广泛引用,多次获acm杰出论文奖。在软件与人工智能领域的多个国际会议担任程序委员会共同主席与pc。曾获教育部科技进步一等奖,ccf科技发明一等奖,北京市科技发明二等奖,中创软件人才奖。教学课程被首批认定为“国家级一流线下课程”和“国家级一流线上课程”,并多次获省部级教学奖。科研转化成果aixcoder为航天领域的重大工程、金融与it领域的多家大型企业及数十万国际开发者提供服务。