查看
PyTorch3D的灵感是来自于MeshR-CNN和研究院最近的3D研究
(Facebook人工智能研究院(FacebookAIResearch;FAIR)日前发布了一个允许研究人员和开发者结合深度学习和3D对象的库:PyTorch3D。
其中,Facebook同时开源了MeshR-CNN。这个于2019年发布的模型能够根据室内空间图像的2D形状渲染3D对象。FAIR工程师妮基拉·拉维(NikhilaRavi)指出,PyTorch3D的灵感是来自于MeshR-CNN和研究院最近的3D研究。
对于渲染出现在混合现实或虚拟现实中的3D对象或场景而言,3D方面的研究非常重要。这同时可以用于应对一系列的AI挑战,比如说帮助自动驾驶汽车理解附近对象的位置。
PyTorch3D带有常用的3D运算符和用于3D数据的损失函数,以及用于创建3D对象的微分网格渲染器。拉维在接受采访时表示,PyTorch3D同时包含微分渲染API,一定的CUDA支持,以及任何现有3D库中都无法提供的异构批处理功能。
她说到:“借助PyTorch3D,研究人员可以输入所有这些函数,并结合PyTorch中现有的深度学习系统,这可以大大减少进行3D规划研究的时间。因为3D规划研究需要大量的专业知识,我们希望能够减少前期的时间。”
PyTorch3D采用网格(一种用于构成3D对象的顶点和面的互操作数据格式),并可以使用补丁张量将网格中的所有顶点打包成与批处理有关的单个张量。
值得一提的是,Facebook人工智能研究院于2019年推出了PyRobot框架,以及从真实世界视频中提取角色的FAIR3D研究。