Vastly Multilingual Speech (MMS) ミッションは、1,100 以上の言語 (10 を超える言語) をサポートする単一の多言語音声認識モデルを構築することにより、音声技術を約 100 言語から 1,000 以上の言語に拡張します。 、4,000 を超える言語 (40 を超える言語) を識別する空間内の言語識別ガジェット、1,400 を超える言語をサポートする事前トレーニング済みガジェット、およびテキストの音声肯定ガジェット1,100以上の言語に対応。 私たちのスキームは、ファイルに安全にアクセスし、最も適切に受け入れられている言語のデバイスを使用することの難しさを軽減することです。
おそらくあなたもそうするでしょう。論文 Scaling Speech Technology to 1000+ language および ウェブログ送信 で事実を入手してください。
MMS に並ぶ言語の第一級レベルの概念は、おそらく ここ でもつまづくでしょう。
事前トレーニングされたガジェット
事前トレーニングされたガジェットを微調整するためのインスタンス命令は、おそらくつまずく可能性もあります )ここ。
微調整されたガジェット
ASR
辞書に コラムでは、英語のトークン辞書のサルベージ リンクを紹介します。 モデルでサポートされている言語のトークン ディクショナリをサルベージするには、URL 内の言語コードを適切に変更します。 例として、ヒンディー語用の FL102 モデルのトークン辞書を安全にするには、this リンクを使用します。 .
TTS 1107 言語の ISO コード のチェックリスト。 、vocab.txt 。
G_100000.pth
) は 100K 更新のジェネレーター エキスパートです、config.json はコーチング構成、
vocab.txt
は TTS モデルの語彙です。 # 例: wget https://dl.fbaipublicfiles.com/mms/tts/eng.tar.gz # 英語 (eng) wget https://dl.fbaipublicfiles.com/mms/tts/azj-script_latin.tar.gz #北アゼルバイジャン語 (azj-script_latin)
蓋
# 例: wget https://dl.fbaipublicfiles.com/mms/tts/eng.tar.gz # 英語 (eng) wget https://dl.fbaipublicfiles.com/mms/tts/azj-script_latin.tar.gz #北アゼルバイジャン語 (azj-script_latin)
蓋
バスリング推論へのコマンド
ASR
/course/to/asr/model "