高速音声認識で字幕制作する東北ずん子(Qwen3 ASR + ForcedAligner)

2 view
ねこさんなのです今回は win11 ComfyUI portable を用いて、音声認識 Qwen3-ASR と単語タイミング付与 Qwen3-ForcedAligner を組み合わせ字幕制作のテストを行っておきました(`ヮ´)<いちおう nVidia の VRAM 12GB 以上のグラボ推奨ですこれらは1つのワークフロー(設計...
ねこさんなのですのニュース一覧

コメント(0件)

    この記事にはまだコメントがありません。

コメントする

少しでも気になったらコメントお願いします!!

(全角32文字・半角64文字以内)

ねこさんなのですのニュース