wgwang / awesome-LLMs-In-China

中国大模型
Apache License 2.0
5.09k stars 428 forks source link

如何定义“大模型” #14

Open GradientGuru opened 1 year ago

GradientGuru commented 1 year ago

我最近也在梳理,感觉有一个问题不知道如何解决。目前这份榜单是基于之前流传的一个93家大模型的名单扩充的。但是, 例如SenseTime的日日新,是一套to B的产品,其中大模型部分没有专门的名字,SenseChat是其中GPT大模型包装的产品。出门问问的序列猴子也是一样。以后一个公司只要把GPT技术用到了自己的产品,并且发了新闻,然后被列出来,那这个榜单很快就会非常庞大。

wgwang commented 1 year ago

网上流传的各种版本都是引用了本仓库 【https://github.com/wgwang/LLMs-In-China】 或 公众号【走向未来】 的,本仓库是从零开始整理的,是目前搜集国内大模型最全的仓库。

xjwspeak commented 1 year ago

认同这个观点,大模型肯定要原创的,基于别人的模型做了微调的这种就不要放进来了,或者弄个微调的榜单区分开

wgwang commented 1 year ago

开放开源的比较简单,可以区分。但很多“只发布”没公开细节的,就没法区分了,所以,“国产大模型” 就不区分了。

另外有一个单独的开源开放大模型列表,只收录基础大模型,包括国内外的,可参考,也欢迎补充。

https://github.com/wgwang/awesome-LLMs-In-China/blob/main/Open-LLMs.md

NeoZhangTCL commented 7 months ago

认同这个观点,大模型肯定要原创的,基于别人的模型做了微调的这种就不要放进来了,或者弄个微调的榜单区分开

闭源很多,很难保证是不是微调还是原创

Duan-JM commented 7 months ago

闭源的情况下甚至你很难判断这个是一个算法系统,还是是一个e2e的模型。