AIテクノロジー

VividTalk

私たちは、ビジュアルに魅力的な話し手のビデオを生成するために設計された画期的な二段階フレームワークであるVividTalkを公開することを喜んでいます。この革新的なモデルは、音声を活用してリップシンクされた表情豊かな顔の特徴、自然なヘッドポーズ生成、高精細なビデオなどの要素を生成します。これらの要素は多くの人々の関心を引き付けるものです。まず、初めの段階では、二重モーション学習システムを使用してオーディオをメッシュにマッピングします。このシステムは、非剛体的な表情と剛体的なヘッドモーションの両方をカバーします。これにより、モデルは中間マーカーとしてブレンドシェイプと頂点を使用して効果的に表情の動きを処理できます。自然なヘッドの動きには、独自の学習可能なヘッドポーズコードブックと、二段階のトレーニングメカニズムが活躍します。二段階目では、並行してブランチモーション-VAEとジェネレータを導入し、メッシュを密なモーションに変換しながら、一つ一つのフレームに優れた品質のビデオを合成します。徹底的なテストの結果、VividTalkは高精細でリップシンクの完了した話し手のビデオを実現し、現実感を高めます。客観的および主観的な比較において、これは従来のトップモデルを大幅に上回る性能を発揮します。 VividTalkがどのようにリアルでリップシンクの完了した話し手のビデオを、表情豊かな顔と自然なヘッドポーズと共にアニメーション化するかをご覧になりたいですか？ぜひウェブサイトをご覧ください：こちら。論文が公開されたら、コードも一般に公開します。 Official Website Your browser does not support the video tag. VividTalk supports animating facial images across various styles, such as human, realism, and cartoon. Your browser does not support the video tag. Using VividTalk you create talking head videos according to various audio singal. Your browser does not support the video tag. The comparison between VividTalk and state-of-the-art methods in terms of lip-sync, head pose naturalness, identity preservation, and video quality....

stockimg.ai

高価なロゴデザイナーの雇用時代はもう終わりです！デザインスキルがなくても、人工知能を使って独自のロゴを生成することができます。さあ、それを実現する方法を見てみましょう：主に2つのリソースが必要です：ChatGPTとStockimg.aiです。これらの人工知能技術により、プロセスは非常に簡単かつ使いやすくなります。デザインの学位は不要ですので、さあ、独自のロゴを作成しましょう！ Official Website Your browser does not support the video tag. How to use ChatGPT & https://Stockimg.a to make your logos Official Website

GAIA

GAIAをご紹介します：ゼロショット会話アバターの次世代を創り出すゼロショット会話アバター生成は、単一のポートレート画像と対応する音声のみを使用して、リアルな会話動画を合成する技術です。従来の技術では、ワーピングベースのモーション表現や3Dモーファブルモデルなど、特定のドメインに関連したヒューリスティックを用いることが一般的でした。しかし、これらの手法はアバターの自然さやバリエーションに制約を与えることがありました。我々は、「アバターの動きは音声によって駆動されるが、外見と背景はビデオの期間中一定である」という観察結果に基づき、ドメイン関連の先行知識を必要としない革新的なシステムであるGAIA（AvatarのためのGenerative AI）を提案します。 GAIAは、2つの主要な段階からなるプロセスを進めます：各フレームをモーションと外見の別々の表現に分離すること。音声と参照ポートレート画像に基づいてモーションシークエンスを生成すること。 GAIAを最適化するために、私たちはさまざまなスケール（最大で2Bのパラメータ）の大規模で高品質なアバターデータセットでモデルを訓練しました。その結果、GAIAは以下の点で従来のモデルを凌駕しました：自然さバリエーションリップシンク品質視覚品質さらに、GAIAはスケーラブル（より大規模なモデルほど優れた結果が得られます）であり、コントロール可能な会話アバター生成からテキスト指示に基づくアバター生成まで、幅広いアプリケーションをサポートしています。 GAIAの仕組みについて詳しく知りたいですか？以下のダイアグラムをご覧ください： Official Website Your browser does not support the video tag. Speech-driven Talking Avatar Generation-1 Your browser does not support the video tag. Speech-driven Talking Avatar Generation-2 Your browser does not support the video tag. Speech-driven Talking Avatar Generation-3 Your browser does not support the video tag. Video-driven Talking Avatar Generation-1 Your browser does not support the video tag....

Animate Anyone

＃一クリックでアニメーションを革新する「誰でもアニメート」アリババの知能コンピューティング研究所の頭脳派たちによって開発された「誰でもアニメート」は、アニメーション技術の革新です。人間、アニメキャラクター、または擬人化されたキャラクターなど、静止したキャラクター画像に命を吹き込み、完全なアニメーションビデオに変身させます。単に「あなたのお気に入りの静止画像」と「アクションやポーズのシーケンス」を提供するだけで、システムが細心の注意を払いながら選んだキャラクターの独特な特徴や特性を保持しながら、緻密にアニメーションビデオを作り上げます。この魔法を作り出すには、次のような一連の複雑な手順が必要です：ポーズのガイダンス「ReferenceNet」などの革新的なアルゴリズムによる特徴の融合「denoising UNet」などのハイテクツールを使用したビデオ合成ピクセルパーフェクトなフレームごとの正確さを確保するための「注意メカニズム」の採用魅力的なアニメーションコンテンツを作成する必要がありますか？高価なソフトウェアや時間のかかるアニメーションレッスンはやめて、「誰でもアニメート」に重労働を任せましょう。アニメーションの未来を体験してくださいー「高速、効率的、手間いらず！」 Official Website Your browser does not support the video tag. Your browser does not support the video tag. Your browser does not support the video tag. Your browser does not support the video tag. Official Website