3D Gaussian Splatting

实时渲染
三维世界

将现实场景转化为数百万个三维高斯椭球体,
在任意视角下以每秒百帧的速度实时渲染真实世界。

了解原理 查看流程
向下滚动
0
实时帧率 FPS+
0
百万高斯椭球体
0
训练时间(分钟)
0
图像即可重建
// 核心原理

用高斯分布
表达三维空间

3D Gaussian Splatting 将场景表示为大量三维高斯椭球体的集合。每个椭球体拥有位置、形状、颜色和透明度属性,通过可微渲染进行端到端优化,最终实现无与伦比的真实感。

🔵
显式场景表示
用可见的三维高斯椭球体直接表达场景几何,而非黑盒神经网络,每个椭球体参数物理意义明确。
实时光栅化
将高斯椭球体投影到二维像素平面上"溅射"渲染,充分利用 GPU 并行能力,实现百帧以上流畅渲染。
🎯
可微分优化
通过最小化渲染图像与真实照片的差异,自动学习场景中每个高斯椭球体的最优形状、颜色与位置。
🌈
球谐函数着色
使用球谐函数对每个椭球体的颜色进行视角相关建模,精确还原金属、玻璃等材质的高光与反射。
📸
从照片重建
输入普通手机拍摄的多角度照片,经过 COLMAP 相机标定,自动生成完整的三维高斯场景表示。
🌐
WebGL 实时预览
训练好的场景可直接在浏览器中流畅浏览,无需安装任何软件,手机打开即可体验沉浸式三维空间。

从视频到
三维场景

📱
手机录像
绕目标物
环绕拍摄
🎞
视频抽帧
ffmpeg 提取
连续帧图像
📐
COLMAP
特征匹配
相机标定
🧬
3DGS 训练
优化百万
高斯椭球体
实时查看
浏览器渲染
任意视角漫游
// 技术细节

高斯椭球体
如何工作

位置与形状(μ, Σ)
每个高斯体用三维坐标和协方差矩阵描述其在空间中的中心点及形状,支持任意旋转与拉伸的椭球体。
球谐系数(SH)
用 0~3 阶球谐函数编码颜色随视角的变化,低阶捕捉漫反射,高阶还原镜面高光,共 48 个系数。
不透明度(α)
每个椭球体有独立的不透明度值,训练中会自动修剪掉贡献极小的椭球体,实现自适应场景稀疏化。
自适应密度控制
训练过程中自动对重建欠缺区域进行椭球体增殖(split/clone),并剪除无效椭球体,动态调节场景细节。

优势一览

能力维度
3DGS
NeRF
传统 MVS
实时渲染(>30fps)
照片级真实感
训练速度快
细节与高光还原
场景可编辑性
浏览器实时查看