2024.08.21
中国のテンセントが開発したマルチモーダルAIモデル「Hunyuan-DiT」を…Hugging FaceのSpacesからいじってみた…。
以前いじった「Flux.1 pro」の回と同じプロンプトで比較してみると…
プロンプト「フェスティバルのステージで演奏する50代3人のカントリーバンド、真夏、晴天、たくさんの観客」
I played around with the multimodal AI model “Hunyuan-DiT” developed by China’s Tencent… from Hugging Face‘s Spaces…
Compared with the previous “Flux.1 pro” I played around with using the same prompt…
Prompt: “A country band of three in their 50s performing on stage at a festival, midsummer, sunny weather, a large audience.”
プロンプト「エベレストを登る5人の日本人登山家、晴天、夏」
Prompt”Five Japanese climbers climbing Everest, sunny, summer”
プロンプト「ニューヨークの空を飛ぶ10頭の鯨達、晴天、春、見上げるたくさんの人々」
Prompt”Ten whales flying in the New York sky, sunny day, spring, many people looking up”
プロンプト「古い図書館で本を読むたくさんの精密なアンドロイドロボット達」
Prompt”Many sophisticated android robots reading books in an old library”
こんな感じですね…。個人的には…今ひとつ…。
It’s something like this… Personally, I don’t think it’s that great…
つづく…
to be continued…
Generation AI Lab:生成AIラボ



















