Open bifenglin opened 7 months ago
Unifying the Perspectives of NLP and Software Engineering: A Survey on Language Models for Code
https://arxiv.org/abs/2311.07989
2024
Ziyin Zhang Shanghai Jiao Tong University Ant Group
arrive
NLP, Language Models for Code, Benchmark
这篇综述论文系统性地回顾了近年来在代码处理中利用语言模型取得的进展,涵盖了超过50种模型、30多个评估任务、170多个数据集以及700多篇相关研究。作者将代码处理模型划分为两类:一类是通用语言模型,以GPT系列为代表;另一类是专门针对代码进行预训练的专业模型,这些模型往往针对编程语言特性设计特定的预训练目标。 此外,综述列举了一系列用于程序修复、文本转代码、代码转代码、单元测试生成、变异生成、模糊测试等任务的基准数据集和工具。这些有助于我们代码大模型的进程。
No response
Title
Unifying the Perspectives of NLP and Software Engineering: A Survey on Language Models for Code
Link
https://arxiv.org/abs/2311.07989
Year
2024
Author and affiliation
Ziyin Zhang Shanghai Jiao Tong University Ant Group
Conference or Journal
arrive
Rank
arrive
Keywords
NLP, Language Models for Code, Benchmark
Selecting Reason
这篇综述论文系统性地回顾了近年来在代码处理中利用语言模型取得的进展,涵盖了超过50种模型、30多个评估任务、170多个数据集以及700多篇相关研究。作者将代码处理模型划分为两类:一类是通用语言模型,以GPT系列为代表;另一类是专门针对代码进行预训练的专业模型,这些模型往往针对编程语言特性设计特定的预训练目标。 此外,综述列举了一系列用于程序修复、文本转代码、代码转代码、单元测试生成、变异生成、模糊测试等任务的基准数据集和工具。这些有助于我们代码大模型的进程。
Supplementary
No response