thuiar / MMSA

MMSA is a unified framework for Multimodal Sentiment Analysis.
MIT License
634 stars 104 forks source link

关于mosi数据集中提取音视频特征维度的问题 #104

Open Chuan76 opened 4 months ago

Chuan76 commented 4 months ago

你好,我使用原始的CMU-MultimodalSDK所提取的音频和视频特征维度分别是74和47,而这里的音频和视频特征维度分别是5和20,是更改了特征提取工具吗,还是仅仅更改了提取的特征维度,并未修改特征提取工具。在实验中需要将模态信息映射至同一维度,由于维度差别挺大,所以有这样的疑惑,是为了得到更好的特征才重新提取音视频特征吗

hustcselwb commented 4 months ago

我也遇到了这个问题,特征维度和论文中的不太一样,但是我感觉应该是没有换提取工具,我也对较小的特征维度感到疑惑

Katyawa commented 1 month ago

同问