[Presentation] Unifying the Perspectives of NLP and Software Engineering: A Survey on Language Models for Code

Title

Unifying the Perspectives of NLP and Software Engineering: A Survey on Language Models for Code

Link

https://arxiv.org/abs/2311.07989

Year

2024

Author and affiliation

Ziyin Zhang Shanghai Jiao Tong University Ant Group

Conference or Journal

arrive

Rank

arrive

Keywords

NLP, Language Models for Code, Benchmark

Selecting Reason

这篇综述论文系统性地回顾了近年来在代码处理中利用语言模型取得的进展，涵盖了超过50种模型、30多个评估任务、170多个数据集以及700多篇相关研究。作者将代码处理模型划分为两类：一类是通用语言模型，以GPT系列为代表；另一类是专门针对代码进行预训练的专业模型，这些模型往往针对编程语言特性设计特定的预训练目标。此外，综述列举了一系列用于程序修复、文本转代码、代码转代码、单元测试生成、变异生成、模糊测试等任务的基准数据集和工具。这些有助于我们代码大模型的进程。

Supplementary

No response

X-lab2017 / open-research

[Presentation] Unifying the Perspectives of NLP and Software Engineering: A Survey on Language Models for Code #265