PROPMAN DESIGN 合同会社 | PROPMAN DESIGN LLC.

生成AIラボ:Wanをいじってみた…01 | I tried playing around with Wan…01

Home  >>  生成AIラボ:Wanをいじってみた…01 | I tried playing around with Wan…01

2025.08.12

中国のアリババ社が開発した…動画生成モデル「Wan」をいじってみた…。

I played around with the video generation model “Wan” developed by Alibaba, a Chinese company.

https://wan.video/

テキストから動画…「高速で高速道路を疾走するクラシックカー」

From text to video… “A classic car speeding down the highway”

無料だと…ダメですね…

If it’s free… it’s no good…

4時間待っても生成できないので…Rplicateプラットフォームに変更…テキストから動画…「高速で高速道路を疾走するクラシックカー」

I waited 4 hours and still couldn’t generate it…so I switched to the Rplicate platform…from text to video…”A classic car speeding down the highway at high speed”

画像から動画…こちらも…Rplicateプラットフォームから…

From the Rplicate platform… From images to videos…

Original image

Wan AIの概要
Wan AIは、中国のアリババ社が開発した先進的な動画生成モデルで、特にテキストや画像を基に高品質な動画を生成する能力に優れています。最新のバージョンであるWan 2.1は、オープンソースとして公開されており、ユーザーが自由に利用できる環境を提供しています。

主な機能
Wan AIは以下のような多様な機能を持っています:
テキストから動画生成(Text-to-Video): 自然言語で入力されたテキストプロンプトに基づいて、関連する映像を生成します。例えば、「猫がピアノを弾いている」といった指示を与えることで、その内容に沿ったアニメーション動画を作成できます。
画像から動画生成(Image-to-Video): 静止画を入力することで、その画像に動きを加えた動画を生成します。風景写真を使うと、空が流れるなどの効果が得られます。
動画編集機能: 既存の動画に対して編集を加えることができ、特定の部分を変更したり、スタイルを変えたりすることが可能です。
音声生成: 動画に合わせた効果音を自動生成する機能もあり、無音の動画にリアルな音を追加することができます。

性能と評価
Wan 2.1は、複数のベンチマークテストで高い評価を受けており、特に消費者向けGPUでの動作が可能で、わずか8.19GBのVRAMで480Pの動画を生成することができます。これにより、一般的なユーザーでも手軽に高品質な動画を作成できる環境が整っています。

利用方法
Wan 2.1は、ローカル環境、クラウド、WebUIの3つの方法で利用可能です。特に、Google Colabを使用することで、簡単にGPU環境での実行が可能です。また、Hugging Face上でのデモも提供されており、環境構築なしで試すことができます。

今後の展望
Wan AIは、今後もさらなる機能追加や性能向上が期待されており、特に動画生成AIの分野での進化が注目されています。新しいバージョンであるWan 2.2も発表されており、さらなる性能向上が見込まれています。このように、Wan AIは動画生成の新たな可能性を切り開くツールとして、多くのクリエイターや企業に利用されることが期待されています。

by Felo

Overview of Wan AI
Wan AI is an advanced video generation model developed by Alibaba, a Chinese company. It excels in generating high-quality videos from text and images. The latest version, Wan 2.1, is open source and available for free use by users.

Key Features
Wan AI offers a variety of features, including:
Text-to-Video: It generates relevant video based on text prompts entered in natural language. For example, a command like “A cat is playing the piano” can create an animated video tailored to that content.
Image-to-Video: It generates a video by adding movement to a still image. Using a landscape photo can create effects such as a flowing sky.
Video Editing: It allows you to edit existing videos, changing specific parts or changing the style.
Audio Generation: It also has a function to automatically generate sound effects to match the video, allowing you to add realistic sounds to silent videos.

Performance and Evaluation
Wan 2.1 has received high praise in multiple benchmark tests, particularly for its ability to run on consumer-grade GPUs, generating 480p video with only 8.19GB of VRAM. This allows even average users to easily create high-quality videos.

Usage
Wan 2.1 is available in three ways: local, cloud, and WebUI. Google Colab allows for easy execution in a GPU environment. A demo on Hugging Face is also provided, allowing you to try it without any setup.

Future Outlook
Wan AI is expected to continue to add new features and improve performance, with its evolution in the field of video generation AI attracting particular attention. A new version, Wan 2.2, has also been announced, and further performance improvements are expected. Wan AI is expected to be used by many creators and companies as a tool that opens up new possibilities in video generation.

by Felo

つづく…

To be continued…





Generation AI Lab:生成AIラボ

2025.10.26 久しぶりに...生成AIのsvg化ツール「Recraft V3 SVG」を https://replicate.com/ でいじってみた...。 現状...実質的には...AdobeとRecraftぐらいしか...svg=ベクターデータに対応した生成AIは無い? For the first time in a while, I played around with the generative AI SVG conversion tool "Recraft V3 SVG" at https://replicate.com/. Currently, is it true that Adobe and Recraft are the only two that offer generative AI that supports SVG (vector data)? プロンプト「古いタイプライターを使うレトロでシンプルなロボットのポスター。オリーブ色の背景に「温故知新」というタイトルが付けられている。」 Prompt: "A simple retro poster of ...
2025.09.17 https://replicate.com から...Seedream 4.0をいじってみた...。 元画像をSeedream 4.0にて生成... I experimented with Seedream 4.0 from https://replicate.com… The original image was generated using Seedream 4.0… テキストで...色々と指示してみると... Giving instructions using various types of text... こんな感じ...つづく... Something like this…To be continued… Generation AI Lab:生成AIラボ ...
2025.09.09 Googleの最新画像生成+編集モデル「Gemini 2.5 Flash Image」通称?「nano banana」を...https://gemini.google.com/ からいじってみた...。 I took a look at Google's latest image generation and editing model, "Gemini 2.5 Flash Image," also known as the "nano banana"https://gemini.google.com/ 元画像をFluxで生成して...https://gemini.google.com/ にアップロード... Generate the original image using Flux…and upload it to https://gemini.google.com/… プロンプト...「立って、歌って」 Prompt… "Stand up and sing" プロンプト...「キャスケットを被せて」 Prompt… "Put on a newsboy ca ...
2025.08.12 中国のアリババ社が開発した...動画生成モデル「Wan」をいじってみた...。 I played around with the video generation model "Wan" developed by Alibaba, a Chinese company. https://wan.video/ テキストから動画...「高速で高速道路を疾走するクラシックカー」 From text to video… "A classic car speeding down the highway" 無料だと...ダメですね... If it's free… it's no good… 4時間待っても生成できないので...Rplicateプラットフォームに変更...テキストから動画...「高速で高速道路を疾走するクラシックカー」 I waited 4 hours and still couldn't generate it…so I switched to the Rplicate platform…from text to video…"A classic car sp ...
2025.08.12 現段階では...iPhoneアプリのみ?みたいですが... Grokで音付き動画の生成が可能になったので...いじってみた...。 生成した画像をアップして...GO! At the moment, it seems to be only available as an iPhone app… Grok now allows you to generate videos with sound, so I decided to give it a try. Upload the generated image…GO! Original image Original image 利用方法と料金 アプリでの使用・iOS版「Grok 生成AI」アプリから利用可能・基本的に有料プランが必要(Premium または Premium+)・無料版では生成回数に制限があり 操作手順・アプリを開いて「想像する」をタップ・画像を選択またはプロンプトを入力・生成モードを選択(Normal/Fun/Spicy/カスタム)・動画生成を実行 by Genspark Usage and Pric ...
2025.07.19 以前ブログで紹介した...「Bing Video Creator」が...デスクトップ ブラウザーで使えるようになっていたので...早速いじってみた...。 "Bing Video Creator" which I previously introduced on my blog, is now available on desktop browsers, so I immediately tried playing around with it. https://www.bing.com/images/create?FORM=IRPGEN&ctype=video# 無料の動画生成「Bing Video Creator」リリース… が...数時間???かかるの... But… it takes several hours??? 待ってはみますが...これじゃぁ...使えないですね...。結果は改めて! I'll wait, but… it's… useless… I'll let you know the results later! 4時間後 ...
2025.07.04 Blog Propman MEMO 「ものづくり」備忘録?のアイキャッチ画像+αを... Midjourney・Flux・Imagen・Adobe Firefly・Copilot Designer・Ideogram・VIVA・Vidu・Kling・Runway・Dream Machine・Haiper...等々で生成しています。 Blog Propman MEMO "Manufacturing" memo? Eye-catching images + more…Created using Midjourney, Flux, Imagen, Adobe Firefly, Copilot Designer, Ideogram, VIVA, Vidu, Kling, Runway, Dream Machine, Haiper…etc. Generation AI Lab:生成AIラボ ...
2025.06.20 Midjourney v7が標準仕様になり...V1 Video Modelもリリースされたので...早速「V1 Video Model」をいじってみた... 以前生成した画像を選んで... Midjourney v7 has become the standard specification…The V1 Video Model has also been released…I immediately tried playing around with the Video Model… I selected an image I had generated previously… 右下の...Animate Image...Auto...Low Motionを選択...プロンプト「喋り出す」... (んんん...6回もクリックしてしまいました..)あっという間に...クレジットが...涙... Select "Animate Image…Auto…Low Motion" at the bottom right…Prompt "Talking Broccoli"… ...
2025.05.24 先日...ブログで紹介した日本発 Fotographer AI の...「ZenCtrl」のデモをいじってみた...。 The other day, I tried out a demo of "ZenCtrl" by Fotographer AI, a Japanese company that I introduced on my blog. Demo:https://huggingface.co/spaces/fotographerai/ZenCtrl 高解像度で被写体を中心とした多視点画像生成ができる「ZenCtrl」 先ずは...背景白の画像を生成... First… generate an image with a white background… Generated in Midjourney プロンプト...「パブで生ビールを飲む40歳男性」で生成... Generate with prompt… "40-year-old man drinking draft beer in a pub" ... Generated in Midjourney ...
2025.05.20 最近注目の...画像生成AI「HiDream-l1」を無料でいじってみた...。 I tried out the image generation AI "HiDream-l1" which has been getting a lot of attention recently for free. https://hidream.org/ Prompto… A pod of whales swimming in the Tokyo skyline Prompto… African animals roaming Ginza Street Prompto… Many young children playing on the playground equipment in a park on a warm, sunny day in May Prompto… An elderly couple walking along the beach on a midsummer evening ... 「HiDream-l1」は、最近注目を集めている画像生成AIで、特にそ ...