ConsiStoryを使って、創造力を解き放ち、追加のトレーニングなしで統一された視覚的なストーリーを作り出す画像生成プラットフォームです。テキストプロンプトのシーケンスを入力してストーリーテリングを効率化し、物語性豊かな場面ごとのイメージを視覚的に一体化させることができます。

例えば、あなたが魔法使いの冒険を描く叙事詩を執筆しているとしましょう。ConsiStoryを使えば、以下のような場面の説明を入力するだけで、その冒険の旅を視覚化することができます。

  1. 「月明かりの森の中で、古代の城跡に立つ魔法使い」
  2. 「クロークを身にまとった魔法使いが、人ごみの市場を行き交う謎めいた人物の後を追う」
  3. 「高い崖の上で、夕日の壮大な景色の中でドラゴンと対峙する」

ConsiStoryの特徴は次の通りです:

  • テーマの統一性:全てのイメージにおいて魔法使いが一貫して描かれ、瞬時に識別できる特徴が保たれます。
  • シーンの多様性:テーマの統一性を保ちつつ、バラエティに富んだ背景と状況が描かれ、物語性を豊かにします。
  • ストーリーの統合:イメージをつなぎ合わせることでストーリーの一貫性を視覚的に確保し、各シーンを大きな物語の一部として結びつけます。

主なメリット

  • トレーニング不要:事前に訓練されたモデルにより、追加のトレーニングなしで迅速かつ一貫したイメージ生成が可能です(1枚あたり約10秒)。
  • ダイナミックなテーマとパーソナライズ:多様なテーマと個別に設定できる共通のオブジェクトをトレーニングなしで生成できます。
  • ControlNetとの統合:姿勢制御により一貫したキャラクター配置が可能で、精度が向上します。

ConsiStoryの拡張機能には、各イメージのユニークさを保つ Seed Variation と、視覚的な物語内で包括的な表現を反映する Ethnic Diversity が含まれています。

ConsiStoryの動作原理は次の通りです:

  • 対象駆動の共有注意:視覚的なテーマの統一を保証します。
  • 対応ベースの特徴注入:イメージ間のテーマの連続性を促進します。
  • 効率的なアルゴリズム最適化:複雑なトレーニングを回避し、高速なイメージ生成を確保します。
  • 戦略的なレイアウトの多様化:テーマの一貫性を保ちつつ、変異するレイアウトでイメージを生成します。

ConsiStoryは、芸術家、著者、ゲームデザイナーが一貫性のある高品質なイメージを迅速に生成し、魅力的な物語を描く力を与えます。GitHubでのリリースにご期待ください。詳細な技術についてはarXivの論文をご覧ください。

Official Website

demo video

Official Website