对llm backbone的困惑

QwenLM / Qwen2-Audio

The official repo of Qwen2-Audio chat & pretrained large audio language model proposed by Alibaba Cloud.

1.23k stars 82 forks source link

对llm backbone的困惑 #50

Open heiyonghua opened 2 months ago

heiyonghua commented 2 months ago

我详细的阅读了qwen audio 2的源代码，并对模型的架构进行了进一步的探索。作者之前声明qwen aduio 2使用的是qwen-1作为llm，但是却在config中出现了qwen2作为text_config，这是令人困惑的。 llm的layer num是32，这与qwen-7b保持一致，但是attention却使用qwen2的attention，让我产生了很大的困惑？

xiaoqiang306 commented 2 months ago

看代码backbone仍是qwen-7b，只是代码实现上与qwen2做了兼容，都是transformer decoder堆叠，没有大的差别