TencentARC / SEED-Story

SEED-Story: Multimodal Long Story Generation with Large Language Model
https://arxiv.org/abs/2407.08683
Other
692 stars 54 forks source link

Llama-2-7b-hf 已停止公开 #16

Closed Chaoriticle closed 2 weeks ago

Chaoriticle commented 1 month ago

image 我想知道是否可以使用Llama3来替代Llama2的作用?非常感谢!

JohnsonXi commented 1 month ago

去modelscope下载不需要验证,cd pretrainedgit lfs clone https://www.modelscope.cn/shakechen/llama-2-7b-hf.git, 重命名mv llama-2-7b-hf Llama-2-7b-hf为了跟代码路径对应。 复现这个项目很麻烦,要下载4个大模型,和一个很大数据集,解压缩还要半小时,代码里面很多路径与模型数据的路径不对应,需要检查并手动修改,祝你成功!

AndysonYs commented 1 month ago

@Chaoriticle 你好,我们提供的pretrained models都是基于Llama-2-7b-hf的,不能直接只用llama3代替。可以参考 @JohnsonXi 的方法。

AndysonYs commented 1 month ago

去modelscope下载不需要验证,cd pretrainedgit lfs clone https://www.modelscope.cn/shakechen/llama-2-7b-hf.git, 重命名mv llama-2-7b-hf Llama-2-7b-hf为了跟代码路径对应。 复现这个项目很麻烦,要下载4个大模型,和一个很大数据集,解压缩还要半小时,代码里面很多路径与模型数据的路径不对应,需要检查并手动修改,祝你成功!

你好,感谢你的反馈,关于路径的问题,如果你愿意的话,可以提PR修改吗,或者具体说下哪里出现了不对应我来修改?感谢社区的同事一起帮忙提升代码质量!

Chaoriticle commented 3 weeks ago

去modelscope下载不需要验证,cd pretrainedgit lfs clone https://www.modelscope.cn/shakechen/llama-2-7b-hf.git, 重命名mv llama-2-7b-hf Llama-2-7b-hf为了跟代码路径对应。 复现这个项目很麻烦,要下载4个大模型,和一个很大数据集,解压缩还要半小时,代码里面很多路径与模型数据的路径不对应,需要检查并手动修改,祝你成功!

非常感谢老哥!悬着的心终于死了;(

Chaoriticle commented 3 weeks ago

@Chaoriticle 你好,我们提供的pretrained models都是基于Llama-2-7b-hf的,不能直接只用llama3代替。可以参考 @JohnsonXi 的方法。

好的,非常感谢回复!