关于mosi数据集中提取音视频特征维度的问题

thuiar / MMSA

MMSA is a unified framework for Multimodal Sentiment Analysis.

MIT License

634 stars 104 forks source link

关于mosi数据集中提取音视频特征维度的问题 #104

Open Chuan76 opened 4 months ago

Chuan76 commented 4 months ago

你好，我使用原始的CMU-MultimodalSDK所提取的音频和视频特征维度分别是74和47，而这里的音频和视频特征维度分别是5和20，是更改了特征提取工具吗，还是仅仅更改了提取的特征维度，并未修改特征提取工具。在实验中需要将模态信息映射至同一维度，由于维度差别挺大，所以有这样的疑惑，是为了得到更好的特征才重新提取音视频特征吗

hustcselwb commented 4 months ago

我也遇到了这个问题，特征维度和论文中的不太一样，但是我感觉应该是没有换提取工具，我也对较小的特征维度感到疑惑

Katyawa commented 1 month ago

同问