# 翻訳と文字起こしを有効にするための依存関係を設定します $ pip install 'subaligner '# 強制アライメントを有効にするための依存関係を設定 $ pip install 'subaligner[stretch]'
# enchancment 環境を確立するための依存関係を設定します $ pip install 'subaligner[dev]'
![]()
両方に署名してください サブアライナー[stretch] と
サブアライナー[dev]
追加の依存関係を事前にインストールする必要があります:
$ 有効-サルベージ インストール espeak libespeak1 libespeak-dev espeak-knowledge または
サポートされているすべての側面をインストールするには:
$ pip install 'サブアライナー[harmony]'
インストールの置き換え ) # pipx で設定 $ pip install -U pip pipx $ pipx install subaligner
または
# GitHub から Pipenv 経由でセットアップ $ pipenv install subaligner $ pipenv install 'subaligner[stretch]' $ pipenv install 'subaligner[dev]'
#提供からセットアップ $ git clone git@github.com:baxtree /subaligner.git $ cd subaligner $ python setup.py インストール
または
# Docker化されたインストールを明らかにする $ docker fling -v `pwd`:`pwd` -w `pwd` -it baxtree/subaligner bash
Dwelling Windows 10 のユーザー向け:
Docker Desktop が理想的なオプションです現在のところ。 メディアソースが以下に保持されていると仮定します
d:media、推奨されるビルトイン公開、PowerShell、または住居ウィンドウを開く ターミナルとフリング:
docker pull baxtree/subaligner docker fling -v "/d/media":/media -w "/media" -it baxtree/subaligner bash使用法 
# 単段アライメント (低レイテンシーの高レベル シフト) $ subaligner_1pass -v video.mp4 -s subtitle.srt $ subaligner_1pass -v https://example.com/video.mp4 -s https://example.com/subtitle.srt -o subtitle_aligned.srt

# デュアル ステージ アライメント (低レベル シフトでレイテンシが高くなります) $ subaligner_2pass -v video.mp4 -s subtitle.srt $ subaligner_2pass -v https://example.com/video.mp4 -s https://example.com/subtitle.srt -o subtitle_aligned.srt

または
# アライメントモードが $ subaligner -m single であるため、single-stage または twin-stage で渡します-v video.mp4 -s subtitle.srt $ subaligner -m twin -v video.mp4 -s subtitle.srt $ subaligner -m single -v https://example.com/video.mp4 -s https://example .com/subtitle.srt -o subtitle_aligned.srt $ subaligner -m ツイン -v https://example.com/video.mp4 -s https://example.com/subtitle.srt -o subtitle_aligned.srt # 視聴覚レコードデータを転写して字幕を生成 $ subaligner -m transcribe -v video.mp4 -ml eng -mr speak -mf PSD -o subtitle_aligned.srt $ subaligner -m transcribe - v video.mp4 -ml zho -mr speak -mf medium -o subtitle_aligned.srt
# セグメント化された否定できないテキストの配置 (区切り文字のため二重の改行) $ subaligner -m script -v take a look at.mp4 -s subtitle.txt -o subtitle_aligned.srt $ subaligner -m script -v https://example. com/video.mp4 -s https://example.com/subtitle.txt -o subtitle_aligned.srt
# 埋め込み字幕の配置 $ subaligner -m single -v video.mkv -s embedded:stream_index=0 -o subtitle_aligned.srt $ subaligner -m twin -v video.mkv -s embedded:stream_index=0 -o subtitle_aligned .srt
# ISO 639-3 言語コード ペアとの翻訳アライメント(src,tgt) $ subaligner --languages $ subaligner -m single -v video.mp4 -s 字幕.srt -t src,tgt $ subaligner -m twin -v video.mp4 -s 字幕.srt -t src,tgt $ subaligner -m script -v take a look at.mp4 -s subtitle.txt -o subtitle_aligned.srt -t src,tgt $ subaligner -m transcribe -v video.mp4 -ml src -mr speak -mf エビ -o subtitle_aligned .srt -t src,tgt
# 秒単位で手動で字幕をオフセット $ subaligner -m shift --subtitle_path subtitle.srt -os 5.5 $ subaligner -m shift --subtitle_path subtitle.srt -os -5.5 -o subtitle_shifted.srt
# ディレクトリに対して一括アライメントをドラッグ $ subaligner_batch -m single -vd movies/ - sd 字幕/ -odaligned_subtitles/ $ subaligner_batch -m ツイン -vd ムービー/ -sd s ubtitles/ -odaligned_subtitles/ $ subaligner_batch -m twin -vd movies/ -sd 字幕/ -odaligned_subtitles/ -of ttml

# docker イメージでアライメントをドラッグ $ docker pull baxtree/subaligner $ docker fling -v `pwd`:`pwd` -w `pwd` -it baxtree/subaligner subaligner_1pass -v video.mp4 -s subtitle.srt $ docker fling -v `pwd`:`pwd` -w `pwd` -it baxtree/subaligner subaligner_2pass -v video.mp4 -s subtitle.srt $ docker fling -it baxtree/subaligner subaligner_1pass -v https:/ /example.com/video.mp4 -s https://example.com/subtitle.srt -o subtitle_aligned.srt $ docker fling -it baxtree/subaligner subaligner_2pass -v https://example.com/video.mp4 -s https://example.com/subtitle.srt -o subtitle_aligned.srt
整列された字幕は、 に保存される可能性があります。 subtitle_aligned.srt
。 CLI に関する事実については、fling subaligner_1pass -h, subaligner_2pass -h
また サブアライナー -h
。 追加のユーティリティは、おそらく相談後にさらに老朽化する可能性があります subaligner_batch -h、subaligner_convert -h
,
subaligner_train -h と subaligner_tune -h.
)
おそらく、あなたが持っている視聴覚記録データと字幕記録データと一緒に、おそらく最新のモデルを組み立てるでしょう:
$ subaligner_train -vd VIDEO_DIRECTORY -sd SUBTITLE_DIRECTORY -tod TRAINING_OUTPUT_DIRECTORY
それでは、上記のコマンドを使用して字幕同期をさらに練習することは間違いありません。 所有モデルの組み立てと調整に関する追加情報については、 までご相談ください) サブアライナードクターズ
.
解剖学
字幕さらに、ドウェル ストリームでの Speech-To-Text によって導入された遅延、または製造後の調整と調整の見栄えの良い人間の介入に加えて、さまざまな原因の共犯者の視聴覚メディア記録データと同期していない可能性があります。
モデルは、同期されたビデオと字幕のペアでトレーニングされ、後でツインステージアラインメントシステムのガイダンスの下でシフトオフセットと方向を予測するのに失敗しました.
このツールは、次のパッケージがなければ間違いありません: tensorflow
scikit-be 教えて
pycaption
openai-speak
Alan Robinson と Nigel Megitt の貴重なフィードバックに感謝します。