OrionStarAI / Orion

Orion-14B is a family of models includes a 14B foundation LLM, and a series of models: a chat model, a long context model, a quantized model, a RAG fine-tuned model, and an Agent fine-tuned model. Orion-14B 系列模型包括一个具有140亿参数的多语言基座大模型以及一系列相关的衍生模型,包括对话模型,长文本模型,量化模型,RAG微调模型,Agent微调模型等。
Apache License 2.0
785 stars 57 forks source link

技术报告里面的几个点,希望能够解答一下 #8

Open 202030481266 opened 9 months ago

202030481266 commented 9 months ago

感谢星空官方开源诸多有用的模型,技术报告也很详细,但是我还是想问几个关于报告中的细节的问题,希望有人能够解答。

  1. 技术报告里面谈及了使用专有的数据质量模型来对内容进行质量判断,那么这里有一个问题就是这个数据质量模型是怎么训练得到的呢?或者说质量高的数据集的标准是什么呢?
  2. 综合了评测数据集的分数来看,Orion-14B应该和Qwen-14B性能不相上下,但是我想知道技术报告中的Qwen-14B-Chat有没有经过RLHF的对齐?如果是的话,那么Orion-14B的SFT的效果无疑是非常好的。
  3. Orion-14B的最大创新尝试在于数据调度训练策略这一块,但是整体来看,似乎数据调度训练的策略对于模型的性能影响并不是非常大,是不是受限于14B的大小,还无法充分体现这个策略的正确性?
  4. 对于Orion-14B-RAG模型和Orion-14B-Long模型的微调技术大家应该都会十分感兴趣,官方有意向开源这方面的内容吗?
daixiangzi commented 9 months ago

+1

Labmem009 commented 9 months ago

我非常好奇Orion-14B-RAG模型这个版本,有木有什么其他的特性以及使用方法什么的?

Unintented commented 9 months ago

Qwen-14B-Chat应该是对齐过的,阿里的技术报告中有提到

202030481266 commented 9 months ago

Qwen-14B-Chat应该是对齐过的,阿里的技术报告中有提到

我的疑问在于他们对标的模型,因为他们可能只用了SFT的QWEN,不过过了这么久也没有解答,还真的有点失望。

cat-sun commented 7 months ago

我非常好奇Orion-14B-RAG模型这个版本,有木有什么其他的特性以及使用方法什么的?

+1