xverse-ai / XVERSE-13B

XVERSE-13B: A multilingual large language model developed by XVERSE Technology Inc.
Apache License 2.0
649 stars 58 forks source link

只放Base模型难以评估模型真实效果,等chat版本 #8

Closed xufengnian closed 1 year ago

xufengnian commented 1 year ago

image image image 模型从https://huggingface.co/xverse/XVERSE-13B

下载的,Base模型这样放出来也比较难评估效果,好歹放一个sft过的chat版本吧,老哥们

nobodybut commented 1 year ago

我这里加载聊天是对的呀,虽然吃光了我的CPU和内存……如图 微信截图_20230808141943 微信截图_20230808141931 微信图片_20230808141402

xufengnian commented 1 year ago

我这里加载聊天是对的呀,虽然吃光了我的CPU和内存……如图 微信截图_20230808141943 微信截图_20230808141931 微信图片_20230808141402

你这个是直接用了text-generation-webui的chat模式,回答都是英文反而暴露了当前模型不具备问答能力,现有问答能力是原始模型提供(推测llama2-13B)

underspirit commented 1 year ago

Chat版模型已发布, 欢迎下载使用