如何定义“大模型”

wgwang / awesome-LLMs-In-China

中国大模型

Apache License 2.0

5.09k stars 428 forks source link

如何定义“大模型” #14

Open GradientGuru opened 1 year ago

GradientGuru commented 1 year ago

我最近也在梳理，感觉有一个问题不知道如何解决。目前这份榜单是基于之前流传的一个93家大模型的名单扩充的。但是，例如SenseTime的日日新，是一套to B的产品，其中大模型部分没有专门的名字，SenseChat是其中GPT大模型包装的产品。出门问问的序列猴子也是一样。以后一个公司只要把GPT技术用到了自己的产品，并且发了新闻，然后被列出来，那这个榜单很快就会非常庞大。

wgwang commented 1 year ago

网上流传的各种版本都是引用了本仓库【https://github.com/wgwang/LLMs-In-China】或公众号【走向未来】的，本仓库是从零开始整理的，是目前搜集国内大模型最全的仓库。

xjwspeak commented 1 year ago

认同这个观点，大模型肯定要原创的，基于别人的模型做了微调的这种就不要放进来了，或者弄个微调的榜单区分开

wgwang commented 1 year ago

开放开源的比较简单，可以区分。但很多“只发布”没公开细节的，就没法区分了，所以，“国产大模型” 就不区分了。

另外有一个单独的开源开放大模型列表，只收录基础大模型，包括国内外的，可参考，也欢迎补充。

https://github.com/wgwang/awesome-LLMs-In-China/blob/main/Open-LLMs.md

NeoZhangTCL commented 7 months ago

认同这个观点，大模型肯定要原创的，基于别人的模型做了微调的这种就不要放进来了，或者弄个微调的榜单区分开

闭源很多，很难保证是不是微调还是原创

Duan-JM commented 7 months ago

闭源的情况下甚至你很难判断这个是一个算法系统，还是是一个e2e的模型。