Vastly Multilingual Speech (MMS) ミッションは、1,100 以上の言語 (10 を超える言語) をサポートする単一の多言語音声認識モデルを構築することにより、音声技術を約 100 言語から 1,000 以上の言語に拡張します。 、4,000 を超える言語 (以前よりも 40 のケースが多い) を確立する準備ができている言語識別ユニット、1,400 を超える言語をサポートする事前トレーニング済みユニット、および1,100の言語。 私たちの目的は、人々が好みの言語で知識にアクセスしたり、デバイスを利用したりできるようにするためのシステムをより簡単に構築することです。
紙面内の分も印刷する必要があるだけです
MMS で使用される言語の概要については、こちら を参照してください。
事前トレーニングされたユニットを微調整するためのインスタンスの命令は、ここでつまずく可能性もあります。
ASR
Dictionary
列、英語のトークン辞書のダウンロード ハイパーリンクを提供します。 モデルでサポートされているさまざまな言語のトークン辞書をダウンロードするには、URL 内の言語コードを正確に変更します。 たとえば、ヒンディー語用の FL102 モデルのトークン辞書を取得するには、this ハイパーリンクを使用します。
TTS
の ISO コード 。
- )ターゲット言語の ISO コードを蓄積し、チェックポイントをダウンロードします。 各フォルダーは 3 つのファイルで構成されています:
G_100000.pth 、config.json 、vocab.txt 。 G_100000.pth
) は、100Ok 更新用にトレーニングされたジェネレーターです。 config.json は教育用の設定、vocab.txt は TTS モデルの語彙です。
# 例: wget https://dl.fbaipublicfiles.com/mms/tts/eng.tar.gz # 英語 (eng) wget https://dl.fbaipublicfiles.com/mms/tts/azj-script_latin.tar.gz #北アゼルバイジャン語 (azj-script_latin)
蓋
ASR
/course/to/asr/model "
--lang lang_code --audio "