|
|
FCS 文章精要:澳门科技大学张涛副教授团队——基于代码上下文的审稿人推荐 |
|
论文标题:Code context-based reviewer recommendation
期刊:Frontiers of Computer Science
作者:Dawei YUAN, Xiao PENG, Zijie CHEN, Tao ZHANG, Ruijia LEI
发表时间:15 Jan 2025
DOI: 10.1007/s11704-023-3256-9
微信链接:点击此处阅读微信文章
引用格式:
Dawei YUAN, Xiao PENG, Zijie CHEN, Tao ZHANG, Ruijia LEI. Code context-based reviewer recommendation. Front. Comput. Sci., 2025, 19(1): 191202
阅读原文:
问题概述
当前的代码审查员推荐系统存在局限性。它们主要关注代码的基本组件和特定的拉取请求注释,而遗漏了关键的细节。这可能导致推荐不完整。此外,这些系统依赖于如文本匹配或TF-IDF之类的传统方法,这些方法缺乏灵活性。当项目或审查员数量发生变化时,它们需要进行大量的重新计算,从而导致效率低下。
技术步骤
最初,本文收集了源代码及其相应的评论数据。利用如KeyBERT这样的工具,本文从拉取请求中提取了关键细节,特别是代码描述信息。此外,本文还获取了源代码的路径数据以及代码本身的详细信息。随后,将所有这些提取的特征进行拼接,并输入到BERT模型中进行训练。通过根据特定项目工程的要求收集相关数据和审查员,该模型可以有效地进行微调。
实验结果
本文在如Android、OpenStack、Qt和LibreOffice这样的开源数据集上测试了代码审查员推荐。本文的方法与诸如RS、REV、WRC、TIE、TNE和RevRec这样的既定技术进行了比较。通过消融实验,本文评估了文件路径、源代码和代码描述等特性的重要性。此外,我们还评估了关键词提取工具(即KeyBERT、YAKE和RAKE)在我们的上下文感知网络中的影响。本文的结果强调了正确的关键词提取工具在提高推荐准确性中的重要性。
相关文章推荐:
文章精要 | 南京大学冯新宇教授团队:验证无阻碍性的程序逻辑 2024 18(5):186208
文章精要 | 南京大学李宣东教授团队:通过实证研究重新审视与加强Bug和非Bug问题的自动分类 2024 18(5):185207
文章精要 | 北京航空航天大学肖利民教授等:通过模型和量化分析最小化周期性复制系统中的同步成本 2024 18(5):185205
文章精要 | 北京航空航天大学杨海龙副教授团队:面向申威众核处理器的深度学习张量优化代码生成技术 2024 18(1):181201
Frontiers of Computer Science
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;入选“中国科技期刊卓越行动计划项目”。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、
、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
中国学术前沿期刊网
http://journal.hep.com.cn
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。