TheTempAccount / Co-Speech-Motion-Generation

Freeform Body Motion Generation from Speech
195 stars 25 forks source link

TextGrid由来 #10

Open SugaryBitterSmile opened 2 years ago

SugaryBitterSmile commented 2 years ago

你好,请问每个音频对应的TextGrid文件是你们自己人工标注出来的吗?,能否提供一下你所测试Speech2Gesturedataset的数据集

Olivia-Ye commented 2 years ago

posedata里不是有吗? 生成TextGrid可以用mfa强制音素对齐

SugaryBitterSmile commented 2 years ago

posedata里不是有吗? 生成TextGrid可以用mfa强制音素对齐

那里面只有TED Gesture dataset的并没有Speech2Gesturedataset中Almaram,Angelica等人的

Olivia-Ye commented 2 years ago

emmm 我也不知道了 posedata里只给了四个人的keypoint和wav还有对应的textgrid  我猜想,keypoint应该是用openpose从视频中提取的,textgrid就是作者从音频和文本中用mfa生成的,只能用这几个人的数据了

------------------ 原始邮件 ------------------ 发件人: "Sugary Bitter @.>; 发送时间: 2022年5月3日(星期二) 晚上8:38 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [TheTempAccount/Co-Speech-Motion-Generation] TextGrid由来 (Issue #10)

posedata里不是有吗? 生成TextGrid可以用mfa强制音素对齐

那里面只有TED Gesture dataset的并没有Speech2Gesturedataset中Almaram,Angelica等人的

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

SugaryBitterSmile commented 2 years ago

生成TextGrid可以用mfa强制音素对齐

请问你知道每个音频的lab文件怎么生成的吗

Olivia-Ye commented 2 years ago

lab不就是拼音吗 数据量少的话就自己打呗 多就输入文本让pypinyin标注一下

------------------ 原始邮件 ------------------ 发件人: "Sugary Bitter @.>; 发送时间: 2022年5月3日(星期二) 晚上8:55 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [TheTempAccount/Co-Speech-Motion-Generation] TextGrid由来 (Issue #10)

生成TextGrid可以用mfa强制音素对齐

请问你知道每个音频的lab文件怎么生成的吗

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

SugaryBitterSmile commented 2 years ago

好的,多谢回答,不过我是英文的音频,只有wav然后其他啥都没有。