【ComfyUI】Qwen3TTSなら声優っぽい声も、自分そっくりな声も無料&爆速で生成仕放題でヤバすぎる!

この動画から学べること

この動画では、ComfyUIのカスタムノードを使って「Qwen TTS」を導入し、高品質な音声を生成する手順を以下のポイントで解説しています。

  • 3つの主要機能と使い分け

    • ボイスクローン

      • わずか3秒程度の音声ファイルから、元の声を再現してテキストを読み上げさせます。

    • カスタムボイス

      • 9種類のプリセット音声を使用し、「明るくハキハキと」などの指示(プロンプト)で演技指導が可能です。

    • ボイスデザイン

      • テキストで声の特徴(アニメ声、アナウンサー風など)を指定して、ゼロから音声を生成します。

  • 導入と設定のコツ

    • ComfyUI Managerを使ったインストール方法から、モデルの自動ダウンロード機能について解説。また、日本語生成時に「Japanese」を選択すると生成が遅くなるバグ(?)への対処法として「Auto」設定を推奨するなど、実践的なTipsを紹介しています。

  • 動画生成AIとの連携

    • 生成した音声を、動画生成AI「LTX Video」のワークフローに組み込み、喋るアバター動画(トーキングヘッド)を効率的に作成する方法についても触れています。

前へ

【売上7億円】漫画家ルームツアー『軍神と偽りの花嫁』【作画1日密着】 #12

次へ

常識を覆した大阪駅前の大規模再開発に続け!阪急大阪梅田駅周辺も再開発へ!