随着大模型和人工智能技术的迅猛发展,利用智能化方法提升软件开发效率和质量正成为软件工程的研究热点。近年来,学术界和产业界都在积极探索和推动这一领域的发展,积累了丰富的技术成果和宝贵的经验。这些前沿的研究不仅推动了软件工程理论的发展,还在实际应用中展现出了显著的优势,为未来的软件开发带来了更高的自动化和智能化水平。
本论坛将汇聚国内智能化软件领域的学术界专家和行业从业者,分享当前智能化软件开发、测试和维护领域的最新技术和趋势,以及他们的宝贵经验。参会者将与该领域专家和行业从业者进行交流,共同探讨智能化软件开发、测试和维护中存在的问题和凯发k8登录的解决方案,推进软件工程理论和技术的发展。
01
论坛组织委员会
张洪宇(重庆大学)
梁广泰(华为)
彭鑫(复旦大学)
文俊浩(重庆大学)
王俊杰(中国科学院软件研究所)
冯洋(南京大学)
边攀(华为)
02
论坛议程

03
论坛报告嘉宾简介

王莹
报告题目:跨平台生态共建:软件供应链智能迁移技术初探
报告摘要:
“鸿蒙生态千帆起,从者众,行则远。”随着鸿蒙操作系统和国产指令集架构loongarch等国产平台的相继问世,共建国产平台的软件供应链生态是推动其应用发展“繁华遍地”的首要任务。本报告主题探讨如何利用大模型技术辅助传统软件供应链跨平台迁移到鸿蒙操作系统、loongarch和riscv指令集架构的研究方法?如何解决跨平台软件迁移适配的技术挑战?
报告人简介:
王莹博士,现为东北大学软件学院副教授, ccf开源发展委员会委员, ccf 女工委委员。荣获微软研究院铸星计划访问学者(2020)、中国计算机学会优秀博士论文提名奖(2020)、辽宁省优秀博士论文奖(2021)、 acm sigsoft 杰出论文奖(icse 2021、esec/fse 2023)。主要研究方向为智能软件开发技术、开源软件生态治理技术、软件供应链分析等。在多种程序语言软件生态(包括java/c#/python/go/javascript/android/rust等)治理方面发表系列学术成果,形成系列工具平台“英雄联盟”lol自动化监控开源软件生态的依赖缺陷。多项技术落地于华为、微软、龙芯等企业平台和openharmony开源社区。担任ieee transactions on software engineering期刊编委,chinasoft 2023-2024软件工程女性论坛主席,saner 2023 tool track联合主席,“计算之美”2021博士生论坛主席等,热衷参与学术活动以鼓励计算机领域女性“研究媛”和“程序媛”坚持科研梦想。

边攀
报告题目:代码缺陷智能检测与修复技术实践
报告摘要:
代码检查是保障软件质量和安全的重要技术手段,传统基于软件分析的代码检查技术常因缺少足够的先验知识导致严重的误报和漏报问题。而ai特别是大模型技术擅长对代码进行归纳、总结和抽象,可帮助进一步提升代码检查与修复场景能力的智能化水平。我们在实践中深度融合软件分析和ai技术来尝试解决代码检查在误报、漏报、告警修复等方面面临的挑战并已取得一定效果。本报告将围绕华为云相关技术实践成果进行技术方案及落地成果进行分享。
报告人简介:
边攀 博士,现就职于华为云paas技术创新lab 软件分析lab。20年1月获得中国人民大学信息安全博士学位,同期入职华为工作至今,主要研究领域是软件分析与信息安全,主要研究兴趣包括代码检查、代码重构、程序修复、漏洞挖掘等。发表学术论文10 篇(含icse/fse/tse/ccs等)

陈俊洁
报告题目:基于规约理解校正的大模型代码生成技术
报告摘要:
代码生成是指自动生成符合给定规约的源代码,这一技术在大型语言模型(llms)的发展过程中受到了广泛关注。但由于规约的复杂性,llms难以对规约产生正确的理解,从而导致生成不正确的代码。本工作则提出了一种针对llms的规约理解校正技术,包含代码生成前后两阶段的规约理解校正,从而提升llms的代码生成效果。
报告人简介:
陈俊洁,天津大学智能与计算学部教授,软件工程团队负责人,博士生导师,国家优青项目获得者,博士毕业于北京大学;研究方向主要为基础软件测试、可信人工智能、数据驱动的软件工程等;入选中国科协青年人才托举工程、斯坦福大学发布的全球前2%顶尖科学家年度榜单,荣获ccf优博、电子学会自然科学一等奖、六项最佳/杰出论文奖等奖项;成果在华为、百度等多家知名企业落地;担任ccf系统软件专委常委,ccf 218club副主席,ccf 118club执行委员,以及ccf-a类会议ase评审过程主席,icse、fse、ase、issta等顶会pc。

狄鹏
报告题目:蚂蚁 codefuse 的应用实践:应用环境下的代码变更理解技术
报告摘要:
2023 年 codefuse 完成了百亿级别的代码大模型从 0 到 1 的预训练,配合指令微调、量化部署等一系列配套技术,有效将这一ai大模型的威力渗透至多种研发场景之中,极大促进了生产效率的提升。代码变更理解是全研发流程中必不可少的重要环节,同时适合大型语言模型(llms)的应用。本次分享探讨如何在应用环境中部署小规模llms,并在代码变更理解方面保持与商业化大规模llms相当的性能。为此,蚂蚁开发了一个名为hqcm的小型高质量数据集,该数据集由专家审阅、修订和验证。通过对小规模(7b和220m参数)llms进行微调,我们的评估确认了hqcm带来的显著利益,并表明经过hqcm微调的小规模llms在变更总结、变更分类和代码改进等方面的变更理解性能优于最先进的基线模型和更大规模(≥70b参数)的llms。此研究支持在工业或资源受限环境中使用小规模llms,突显了该工作的实用性。
报告人简介:
狄鹏博士是蚂蚁集团的资深技术专家、正高级工程师,同时还担任新南威尔士大学兼职副教授和浙江大学博导。他在软件工程、编程语言和智能研发领域的研究成果发表于pldi、oopsla、icse、fse、micro等顶级会议。2023年,由他的团队开发的蚂蚁代码大模型codefuse开源,并在蚂蚁集团的全流程研发中广泛应用,显著提升了蚂蚁集团内部研发流程的效率与智能化水平,成为推动技术创新与实践结合的典范,并获得蚂蚁集团tstar最高技术奖。

吕晨
报告题目:复杂代码生成:模型效果提升策略探索
报告摘要:
近年来,随着大模型在代码生成领域的应用逐渐成熟,如何利用这些模型处理复杂编程问题成为研究的热点。大模型通过学习大量代码数据,能够自动生成满足特定需求的代码。然而,面对涉及复杂算法和数据结构的编程任务,现有代码生成模型仍然面临生成代码蕴含逻辑错误和功能不达标的问题。本报告将从模型微调、数据集构建、生成结果排序等多个方面,探讨提升代码生成模型在复杂编程任务中表现的通用机制,以提高生成代码的准确性和执行通过率。
报告人简介:
吕晨,山东师范大学信息科学与技术学院副教授,硕士生导师,于中科院计算所获得博士学位。主要研究方向为智能化软件工程,目前专注于大模型在代码智能化中的应用,包括代码生成、代码理解和漏洞识别。其多项研究成果发表于icse、fse、ase、emse等软件工程领域的顶级学术会议和期刊。主持国家自然科学基金项目及多项企事业合作项目,曾担任tosem、emse、jss、acl、emnlp、uai、ijcai等国际期刊和会议的pc成员/审稿人。

刘哲
报告题目:基于大模型的移动应用自动化测试技术
报告摘要:
随着软件复杂性的增加,软件测试的有效性和覆盖率受到较大的影响。前沿研究正在积极探索一些新兴技术来解决这些问题,而多模态大型语言模型(mllms)被视为最具潜力的技术之一,其具备前所未有的视觉与自然语言理解和生成能力。本报告将分享多模态大语言模型在自动化测试路径生成和非崩溃缺陷检测方向的研究成果,包括视觉驱动的自动化测试技术和多智能体协同的非崩溃缺陷检测技术,来更好的提升自动化测试的充分性和覆盖性。
报告人简介:
刘哲,中国科学院软件研究所特别研究助理(助理研究员),主要从事智能化软件工程、人机交互等方面的研究,近年来主要关注移动应用测试、人机协同测试等。在软件工程和人机交互领域国际著名学术期刊/会议icse、chi、tse、ase等发表 15篇ccf-a类学术论文。主持国家自然科学基金项目及企业合作项目。荣获中国科学院优博,acm student research competition研究生组全球总冠军和中国科学院院长奖等荣誉。

顾小东
报告题目:特定领域代码自动生成探索与实践
报告摘要:
程序自动生成是智能化软件开发的核心技术之一。大模型技术的发展使得程序自动生成不断取得新的突破,发展非常迅速。然而该技术通常面向常规领域,高度依赖多领域的开源数据集,缺乏特定领域(如web、游戏等)的知识和数据样本,从而在特定领域上表现不佳。本次报告将介绍我们在特定领域程序自动生成方面的相关工作。将程序生成分解为思维链,提高表达式自动生成的效果。为了将领域知识和大模型融合,设计思维链知识提示模型,有效提升特定领域生成的准确度。
报告人简介:
顾小东,上海交通大学软件学院副教授,博士生导师。长期从事智能软件工程领域的研究工作,包括代码大模型、程序自动生成、代码搜索等。在icse、fse、ase、tosem等顶级学术会议和期刊上发表学术论文30余篇,主持和参与多项国家自然科学基金、国家重点研发计划、国防课题等。并与华为、宁德时代、腾讯等企业开展广泛的产学研合作。

万瑶
报告题目:基于大语言模型的表格数据人机交互研究
报告摘要:
表格数据(例如excel)作为一种结构化数据,广泛应用于各个领域。然而,操作表格数据的过程往往较为复杂,对用户的友好性也有待提高。近年来,大语言模型(例如gpt-4,gpt-4o)在自然语言理解与生成方面取得了巨大成功,为表格数据的操作提供了一种可行的自然语言人机交互方式。本报告将探讨如何利用大语言模型对表格数据进行处理,并展示其在基于表格数据的公式生成和自动数据可视化等具体应用。同时,本报告还将分享和展望该领域未来面临的挑战。
报告人简介:
万瑶,博士,华中科技大学副教授,2019年获得浙江大学计算机科学与技术专业博士学位。曾于2016年和2018年分别访问悉尼科技大学与伊利诺伊大学芝加哥分校。主要研究基于自然语言处理和程序分析的代码智能技术。在icse、fse、ase、sigmod、icml、iclr、acl、emnlp、naacl等软件工程和人工智能顶级会议发表论文50余篇。google学术引用2000余次,多次担任acl、emnlp等国际会议领域主席,sigkdd、thewebconf、iclr、issta等国际会议程序委员会委员。

梁广泰
报告题目:大模型时代下代码智能分析及生成技术研究与实践
报告摘要:
生成式语言大模型在自然语言和代码语言理解与处理能力上已得到显著提升。如何利用llm技术进一步提升智能化研发场景有效性也得到了学术界和工业界的广泛关注并已初步形成了一系列的落地进展。本报告聚焦智能化研发场景,首先围绕大模型时代下的软件开发趋势及软件研发工具发展方向进行分析与展望,随后针对产业届与学术界相关最新技术工作进行介绍与背后技术剖析,之后依次分享华为云围绕该方向的最新系列技术研究与实践进展、华为云智能编程助手服务codearts snap相关特性演示、华为内部实际落地效果及案例展示。最后围绕智能编程助手的未来落地场景、技术路线演进趋势、核心技术挑战以及有效性统计等维度进行讨论交流。
报告人简介:
梁广泰,ccf软工专委常委,ccf开源发展委员会供应链安全工作组秘书,华为云软件分析lab负责人,软件分析领域高级技术专家。2014年初获得北京大学计算系博士学位,之后入职ibm中国研究院担任研究员职位。16年5月加入华为工作至今,带领团队先后围绕代码智能生成、代码缺陷/漏洞检测与修复、开源成分分析与治理、代码智能同步/重构/移植等方向成功孵化多项智能化开发服务并规模化落地。至今已发表技术专利50 及学术论文35 (含icse/fse/ase/oopsla等)
04
论坛组织委员会简介

论坛主席:张洪宇
个人简介:
重庆大学大数据和软件学院教授、院长,主要研究方向是软件数据挖掘,智能化软件开发,和软件维护。在国际著名会议和期刊上发表了250多篇论文,获得过8次acm杰出论文奖和最佳论文奖。他是2024年亚太软件工程会议(apsec 2024)的大会主席,2020年国际软件维护会议(icsme 2020)的大会主席,多个国际期刊(如acm computing surveys)的编委。他是acm杰出会员,ccf杰出会员,澳洲工程师协会会士(fieaust), 和david parnas fellow。

论坛主席:梁广泰
个人简介:
ccf软工专委常委,ccf开源发展委员会供应链安全工作组秘书,华为云软件分析lab负责人,软件分析领域高级技术专家。2014年初获得北京大学计算系博士学位,之后入职ibm中国研究院担任研究员职位。16年5月加入华为工作至今,带领团队先后围绕代码智能生成、代码缺陷/漏洞检测与修复、开源成分分析与治理、代码智能同步/重构/移植等方向成功孵化多项智能化开发服务并规模化落地。至今已发表技术专利50 及学术论文35 (含icse/fse/ase/oopsla等),曾获fse/issta最佳论文奖,先后担任一系列软工top国际会议pc member/chair等角色(含icse/oopsla/issre等)

论坛主席:彭鑫
个人简介:
复旦大学计算机科学技术学院副院长、教授。中国计算机学会(ccf)杰出会员、软件工程专委会副主任、开源发展委员会常务委员,上海市计算机学会青工委主任,《journal of software: evolution and process》联合主编(co-editor),《acm transactions on software engineering and methodology》、《empirical software engineering》、《automated software engineering》、《软件学报》等期刊编委。2016年获得nasac青年软件创新奖。主要研究方向包括软件智能化开发、云原生与智能化运维、泛在计算软件系统、智能网联汽车等。研究工作多次获得ieee transactions on software engineering年度最佳论文奖、icsm最佳论文奖、acm sigsoft杰出论文奖、ieee tcse杰出论文奖等奖项。担任2022年与2023年ccf中国软件大会(chinasoft)组织委员会主席与程序委员会共同主席,以及icse、fse、ase、issta等会议程序委员会委员。

论坛主席:文俊浩
个人简介:
重庆大学大数据与软件学院教授、党委书记,重庆市学科学术技术带头人(软件工程),重庆市名师。中国计算机学会(ccf)理事、ccf服务计算专委常委,ccf软件工程专委委员。在国际著名学术期刊/会议发表100余篇,出版专著3部;主持国家重点研发计划、国家自然科学基金等省部级以上科研项目20余项;获重庆市自然科学奖1项、重庆市科技进步二等奖1项;获国家教学成果奖3项。承办了第九届服务科学国际会议(9th icss2016)、第十届ccf服务计算学术会议(10th ccf ncsc 2019)和首届ccf中国软件大会(chinasoft 2020)等.

论坛主席:王俊杰
个人简介:
王俊杰,中国科学院软件研究所研究员,博士生导师,智能博弈重点实验室副主任。中国科学院特聘研究岗位,青年创新促进会会员,软件所杰出青年。主要从事智能化软件工程、软件质量等方面的研究,近年来主要关注智能软件测试、大模型驱动的软件测试等。在国际著名学术期刊/会议发表60余篇高水平学术论文,荣获icse、chi、icpc等会议的杰出论文奖,共同指导学生获acm学生研究竞赛全球总决赛冠军、中国科学院院长奖、中国科学院优秀博士学位论文等。主持和参与了多项国家自然科学基金项目、科技部重点研发计划、ccf-华为胡杨林基金等。担任ccf a类期刊tse的associate editor,icse、fse、issre等的pc member,tosem、emse、ause等期刊的审稿人。

论坛主席:冯洋
个人简介:
南京大学助理研究员,加州大学欧文分校软件工程专业博士。主要研究方向为软件分析与测试,具体研究课题包括复杂软件系统的质量保障与优化技术,以及基于程序设计语言特性的软件质量工程等。近年来在软件工程领域的icse、fse、ase、issta、tse、tosem、icst、中国科学,软件学报等期刊与会议发表学术论文30余篇,在ase-2022,fse-2023等知名学术会议获杰出论文奖多次;申请发明专利多项,部分专利成果已经在百度、阿里、华为等知名软件公司转化;担任多个期刊审稿人及国际会议程序委员会成员。

论坛主席:边攀
个人简介:
边攀 博士,现就职于华为云paas技术创新lab 软件分析lab。20年1月获得中国人民大学信息安全博士学位,同期入职华为工作至今,主要研究领域是软件分析与信息安全,主要研究兴趣包括代码检查、代码重构、程序修复、漏洞挖掘等。发表学术论文10 篇(含icse/fse/tse/ccs等)。