打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
代码链接-https://github.com/stepfun-ai/Step1X-3D
试用链接-https://huggingface.co/spaces/stepfun-ai/Step1X-3D
模型链接-https://huggingface.co/stepfun-ai/Step1X-3D
论文链接-https://arxiv.org/pdf/2505.07747
01-Step1X-3D核心优势
Step1X-3D是阶跃星辰刚开源的一个3D生成框架,从左到右依次展示了:基础几何(无纹理),以及卡通风格、素描风格和照片级真实感的3D资产生成结果。它具有以下优势:
它可以生成具有高保真几何和多样纹理映射的3D资产的能力,同时保持了表面几何和纹理映射之间的出色对齐。
利用一个严格的数据管理管道处理>500万个资产,用来创建具有标准化几何和纹理属性的200万个高质量数据集;
将混合VAE-DiT几何生成器与基于扩散的纹理合成模块相结合的两阶段3D原生架构;
对于几何生成,混合VAE-DiT组件通过采用基于感知器的潜在编码和锐边采样来生成TSDF表示,从而保持细节。然后,基于扩散的纹理合成模块通过几何条件和潜在空间同步来确保交叉视图的一致性。
02-Step1X-3D落地场景
03-Step1X-3D上手指南
方案1-Demo链接上手
该方案可以快速验证,适合前期快速验证可行性!
步骤1-访问https://huggingface.co/spaces/stepfun-ai/Step1X-3D链接
步骤2-在红框中“上传/选择图片”,在绿框中“选择相应参数”
步骤3-点击灰色的“Start”按钮,等待片刻即可
方案2-源码本地上手
该方案需要有一定的IT基础,适合在本地部署该模型。
#步骤1-克隆代码到本地
git clone https://github.com/stepfun-ai/Step1X-3D.git
cd Step1X-3D
#步骤2-创建&激活虚拟环境
conda create -n step1x-3d python=3.10
conda activate step1x-3d
#步骤3-安装三方依赖包
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt
pip install torch-cluster -f https://data.pyg.org/whl/torch-2.5.1+cu124.html
cd step1x3d_texture/custom_rasterizer
python setup.py install
cd ../differentiable_renderer
python setup.py install
cd ../../
#步骤4-本地运行推理
python inference.py
04-Step1X-3D整体流程
上图展示了该算法的整体流程,详细的步骤如下所述:
首先,输入的各种信息-“图片、文本、Box、文本标注”等被送入一个Step1X-3D几何生成模型中;
然后,针对生成的没有纹理的网格进行网格渲染操作;
最后,将渲染的结果输入到一个Step1X-3D纹理生成模型中生成最终有纹理的3D资产。
05-Step1X-3D性能评估
关注我,AI热点早知道,AI算法早精通,AI产品早上线!
禁止私自转载,需要转载请先征求我的同意!
欢迎你的加入,让我们一起交流、讨论与成长!