😭 SadTalker:
定型化されたオーディオプッシュ単一画像トーキングフェイスアニメーションの 3D デパート係数のような生活の学習
- 📋
2023.03.18 強くなれ 発現強度
- 、おそらくさらに交換する可能性が最も高いです生成されたモーションの強度:
- python inference.py –expression_scale 2(何らかの符号> 1)
.
- 2023.03.18 ヒントを再設定フォルダー、おそらくさらにチェックポイントを自動的にダウンロードして bash utils/download_models.sh .
2023.03. 18 私たちは今公式に
GFPGAN 顔の強調、の活用) python inference.py –enhancer gfpgan より良い視力のために
2023.03.14 バンドルの機種を指定してください joblib
2023.03.06 コードのバグとセットアップのエラーを解決
🚧
TODO
- 単一の画像から 2D 顔を生成します。
- 音声から 3D 顔を生成しています。
- オーディオプッシュアニメアバター。
- ダイアログ デモの ChatGPT を補間します 🤔
音声と単一の音声から 4D 自由観察の会話例を生成する画像。 Gradio/Colab Demo. すべての構成要素のコーチング コード
stable-diffusion-net- との統合うい。 (チューニングやめろ!)
推論デモ!
推論デモ!
必需品
私をクリックしてください パイソン3.8PyTorch
ffmpeg
教育アイテム
私をクリックしてください
親切なジャム内でガジェットをすべて構築するために、おそらくうまく逃げることができます.
3DMMライブラリファイル チェックポイント/ハブ 顔検出ガジェットで利用顔の位置合わせ.
python inference.py –driven_audio <
audio.wav
> – -source_image
デフォルトは None です。gfpgan または RestoreFormer を選択できます>