PROPMAN DESIGN 合同会社 | PROPMAN DESIGN LLC.

生成AIラボ:「Hi3DGen v0.1」をいじってみた…01 | I tried playing around with 「Hi3DGen v0.1」…01

Home  >>  生成AIラボ:「Hi3DGen v0.1」をいじってみた…01 | I tried playing around with 「Hi3DGen v0.1」…01

2025.04.11

画像から高精細な3Dジオメトリを生成するための新しいオープンソースプロジェクト…3Dモデル生成AI「Hi3DGen v0.1」を Hugging Face でいじってみた…。

A new open source project for generating high-resolution 3D geometry from images…I played around with the 3D model generation AI “Hi3DGen v0.1” on Hugging Face

https://stable-x.github.io/Hi3DGen

無料のHugging Faceだと…ここで終了…😭 If it’s a free Hugging Face, it ends here…😭

3Dモデル生成AI「Hi3DGen v0.1」は、画像から高精細な3Dジオメトリを生成するための新しいオープンソースプロジェクトです。このプロジェクトは、香港中文大学(深圳)とByteDanceの研究チームによって開発され、2025年4月10日にGitHubでコードが公開されました。

Hi3DGenの特徴

ノーマルマップの利用:
Hi3DGenは、ノーマルマップを中間表現として使用することで、2D画像から3Dジオメトリへの変換を行います。ノーマルマップは、表面の向きをエンコードする情報を持ち、これにより高精度なジオメトリ生成が可能になります。

フレームワークの構成:
Hi3DGenは、以下の三つの主要なコンポーネントから成り立っています。

画像からノーマルの推定:
低周波数と高周波数の画像パターンを分離し、ノイズを注入することで、安定したシャープなノーマル推定を実現します。
ノーマルからジオメトリへの学習: ノーマルを正則化した潜在拡散学習を用いて、3Dジオメトリの生成精度を向上させます。

3Dデータ合成パイプライン:
高品質なデータセットを構築し、モデルのトレーニングをサポートします。

実績と効果:
Hi3DGenは、従来の手法と比較して、豊かな幾何学的詳細を生成する能力において優れた性能を示しています。特に、入力画像に対して一貫した高精度な3Dモデルを生成することができます。

このように、Hi3DGenは、画像から3Dモデルを生成するための新しいアプローチを提供し、特に高精度なジオメトリ生成を目指しています。興味のある方は、GitHubのリポジトリでコードを確認することができます。

by Felo

3D model generation AI “Hi3DGen v0.1” is a new open source project for generating high-definition 3D geometry from images. The project was developed by a research team from the Chinese University of Hong Kong (Shenzhen) and ByteDance, and the code was released on GitHub on April 10, 2025.

Features of Hi3DGen

Using normal maps:
Hi3DGen converts 2D images to 3D geometry by using normal maps as an intermediate representation. Normal maps have information that encodes the surface orientation, which enables highly accurate geometry generation.

Framework configuration:
Hi3DGen consists of three main components:

Image-to-normal estimation:
By separating low-frequency and high-frequency image patterns and injecting noise, we achieve stable and sharp normal estimation.

Normal-to-geometry learning:
We use latent diffusion learning with normal regularization to improve the accuracy of 3D geometry generation.

3D data synthesis pipeline:
We build high-quality datasets and support model training.

Achievements and Results:
Hi3DGen has shown superior performance in its ability to generate rich geometric details compared to traditional methods. In particular, it is able to generate consistent and highly accurate 3D models for input images.

Thus, Hi3DGen offers a new approach to generating 3D models from images, with a particular focus on generating highly accurate geometry. Interested parties can check out the code in the GitHub repository.

by Felo





Generation AI Lab:生成AIラボ

2025.10.26 久しぶりに...生成AIのsvg化ツール「Recraft V3 SVG」を https://replicate.com/ でいじってみた...。 現状...実質的には...AdobeとRecraftぐらいしか...svg=ベクターデータに対応した生成AIは無い? For the first time in a while, I played around with the generative AI SVG conversion tool "Recraft V3 SVG" at https://replicate.com/. Currently, is it true that Adobe and Recraft are the only two that offer generative AI that supports SVG (vector data)? プロンプト「古いタイプライターを使うレトロでシンプルなロボットのポスター。オリーブ色の背景に「温故知新」というタイトルが付けられている。」 Prompt: "A simple retro poster of ...
2025.09.17 https://replicate.com から...Seedream 4.0をいじってみた...。 元画像をSeedream 4.0にて生成... I experimented with Seedream 4.0 from https://replicate.com… The original image was generated using Seedream 4.0… テキストで...色々と指示してみると... Giving instructions using various types of text... こんな感じ...つづく... Something like this…To be continued… Generation AI Lab:生成AIラボ ...
2025.09.09 Googleの最新画像生成+編集モデル「Gemini 2.5 Flash Image」通称?「nano banana」を...https://gemini.google.com/ からいじってみた...。 I took a look at Google's latest image generation and editing model, "Gemini 2.5 Flash Image," also known as the "nano banana"https://gemini.google.com/ 元画像をFluxで生成して...https://gemini.google.com/ にアップロード... Generate the original image using Flux…and upload it to https://gemini.google.com/… プロンプト...「立って、歌って」 Prompt… "Stand up and sing" プロンプト...「キャスケットを被せて」 Prompt… "Put on a newsboy ca ...
2025.08.12 中国のアリババ社が開発した...動画生成モデル「Wan」をいじってみた...。 I played around with the video generation model "Wan" developed by Alibaba, a Chinese company. https://wan.video/ テキストから動画...「高速で高速道路を疾走するクラシックカー」 From text to video… "A classic car speeding down the highway" 無料だと...ダメですね... If it's free… it's no good… 4時間待っても生成できないので...Rplicateプラットフォームに変更...テキストから動画...「高速で高速道路を疾走するクラシックカー」 I waited 4 hours and still couldn't generate it…so I switched to the Rplicate platform…from text to video…"A classic car sp ...
2025.08.12 現段階では...iPhoneアプリのみ?みたいですが... Grokで音付き動画の生成が可能になったので...いじってみた...。 生成した画像をアップして...GO! At the moment, it seems to be only available as an iPhone app… Grok now allows you to generate videos with sound, so I decided to give it a try. Upload the generated image…GO! Original image Original image 利用方法と料金 アプリでの使用・iOS版「Grok 生成AI」アプリから利用可能・基本的に有料プランが必要(Premium または Premium+)・無料版では生成回数に制限があり 操作手順・アプリを開いて「想像する」をタップ・画像を選択またはプロンプトを入力・生成モードを選択(Normal/Fun/Spicy/カスタム)・動画生成を実行 by Genspark Usage and Pric ...
2025.07.19 以前ブログで紹介した...「Bing Video Creator」が...デスクトップ ブラウザーで使えるようになっていたので...早速いじってみた...。 "Bing Video Creator" which I previously introduced on my blog, is now available on desktop browsers, so I immediately tried playing around with it. https://www.bing.com/images/create?FORM=IRPGEN&ctype=video# 無料の動画生成「Bing Video Creator」リリース… が...数時間???かかるの... But… it takes several hours??? 待ってはみますが...これじゃぁ...使えないですね...。結果は改めて! I'll wait, but… it's… useless… I'll let you know the results later! 4時間後 ...
2025.07.04 Blog Propman MEMO 「ものづくり」備忘録?のアイキャッチ画像+αを... Midjourney・Flux・Imagen・Adobe Firefly・Copilot Designer・Ideogram・VIVA・Vidu・Kling・Runway・Dream Machine・Haiper...等々で生成しています。 Blog Propman MEMO "Manufacturing" memo? Eye-catching images + more…Created using Midjourney, Flux, Imagen, Adobe Firefly, Copilot Designer, Ideogram, VIVA, Vidu, Kling, Runway, Dream Machine, Haiper…etc. Generation AI Lab:生成AIラボ ...
2025.06.20 Midjourney v7が標準仕様になり...V1 Video Modelもリリースされたので...早速「V1 Video Model」をいじってみた... 以前生成した画像を選んで... Midjourney v7 has become the standard specification…The V1 Video Model has also been released…I immediately tried playing around with the Video Model… I selected an image I had generated previously… 右下の...Animate Image...Auto...Low Motionを選択...プロンプト「喋り出す」... (んんん...6回もクリックしてしまいました..)あっという間に...クレジットが...涙... Select "Animate Image…Auto…Low Motion" at the bottom right…Prompt "Talking Broccoli"… ...
2025.05.24 先日...ブログで紹介した日本発 Fotographer AI の...「ZenCtrl」のデモをいじってみた...。 The other day, I tried out a demo of "ZenCtrl" by Fotographer AI, a Japanese company that I introduced on my blog. Demo:https://huggingface.co/spaces/fotographerai/ZenCtrl 高解像度で被写体を中心とした多視点画像生成ができる「ZenCtrl」 先ずは...背景白の画像を生成... First… generate an image with a white background… Generated in Midjourney プロンプト...「パブで生ビールを飲む40歳男性」で生成... Generate with prompt… "40-year-old man drinking draft beer in a pub" ... Generated in Midjourney ...
2025.05.20 最近注目の...画像生成AI「HiDream-l1」を無料でいじってみた...。 I tried out the image generation AI "HiDream-l1" which has been getting a lot of attention recently for free. https://hidream.org/ Prompto… A pod of whales swimming in the Tokyo skyline Prompto… African animals roaming Ginza Street Prompto… Many young children playing on the playground equipment in a park on a warm, sunny day in May Prompto… An elderly couple walking along the beach on a midsummer evening ... 「HiDream-l1」は、最近注目を集めている画像生成AIで、特にそ ...