musetalk Search Results

106 results
for musetalk

Best match

Best match Most commented Newest Recently updated Least commented Oldest Least recently updated

TMElyralab/MuseTalk #22

运行案例的时候加载face-parse-bisent报错

(venv1) root@3bdaf96b00b0:/workspace/MuseTalk# python -m scripts.inference --inference_config configs/inference/test.yaml add ffmpeg to path Loads checkpoint by local backend from path: ./models/dw…

oceanusXXD updated 2 months ago
1
TMElyralab/MuseTalk #107

有关训练代码数据层样本选择问题

当前我写的训练代码，每个batch中都是随机选择一个视频中的一张图片及对应音频。这样batch中不包含单个视频的一个片段。而Wav2Lip项目中，关于这块是要选择同一个视频的连续5帧，比如单卡batchsize=20，也就是4个视频片段共计20帧。 https://github.com/Rudrabha/Wav2Lip/blob/master/hq_wav2lip_train.py 请问M…

gobigrassland updated 1 month ago
2
TMElyralab/MuseTalk #58

实时推理中两段视频过渡的连贯性实现方案

实时推理的场景中，两段视频分开两次生成，如何让最终生成的两个视频连接过渡的地方比较连贯呢。 BTW., 音频长度超过参考视频时，会将参考视频从头开始放，但是过渡那里做得很好，几乎看不出来跳帧，不知道实现原理是什么。同样的方法是否可以用在前后两个视频的生成也让他们保持连贯性。

ahkimkoo updated 1 month ago
1
TMElyralab/MuseTalk #49

为什么realtime脚本生成用时，比日志显示的fps实际要慢很多？

- 生成数据：均使用的测试样例（video: sun.mp4 | audio: yongen.wav）； - 使用脚本：realtime_inference，已提前完成avater数据的抽取，仅仅进行语音片段生成； - 问题1：202帧的片段，日志显示平均fps为77.5 - 此处为什么每四帧处理一次，且第一帧的处理速度要远远慢于后者（10 >> 100）？ - 问题2…

jercas updated 1 month ago
9
TMElyralab/MuseTalk #75

训练视频预处理，音视频帧率如何调整

（1）项目提到要求hdtf训练集都处理成25fps，可以使用ffmpeg处理 ``` ffmpeg -i input.mp4 -r 25 output.mp4 ``` （2）原始视频中音频部分，都是44.1kHZ。音频部分是不是不需要调整（3）推理代码中，音频部分是一秒50个mel特征，如果视频fps不能被50整除，是否会影响模型效果呢 ``` center_i…

gobigrassland updated 1 month ago
3
TMElyralab/MuseTalk #83

When can it work on cat or dogs? 动物能用么？

Would be greatly useful if it can work on animals.

Frank0427 updated 1 month ago
1
TMElyralab/MuseTalk #40

It's just not working on Windows 11

I am trying with the attached files and even if I wait for 2 hours no progress. Am I doing something wrong [image.zip](https://github.com/TMElyralab/MuseTalk/files/15075013/image.zip) test.yaml …

nitinmukesh updated 1 month ago
6
TMElyralab/MuseTalk #55

单步生成

```python for i, (whisper_batch, latent_batch) in enumerate( tqdm(gen, total=int(np.ceil(float(video_num) / batch_size))) ): audio_feature_batch = torch.from_numpy(whisper_batch) audi…

chunyu-li updated 2 months ago
5
TMElyralab/MuseTalk #1

KeyError: 'encoder_embeddings'

Traceback (most recent call last): File "/root/anaconda3/envs/musetalk/lib/python3.10/runpy.py", line 196, in _run_module_as_main return _run_code(code, main_globals, None, File "/root/anac…

einsqing updated 3 months ago
2
TMElyralab/MuseTalk #108

代码中视频帧与音频特征对齐索引，推理和训练看起来不一致

推理代码中调用提取音频特征，musetalk/whisper/audio2feature.py，其中定位音频特征索引是center_idx = int(vid_idx*50/fps) ``` def get_sliced_feature(self, feature_array, …

gobigrassland updated 1 month ago
4

上一页 1...5 6 7 8 9 10 11...11 下一页

106 results for musetalk

106 results
for musetalk