可互动的多模态世界模型。
暂无相关文章
期待你给「Marble」写一篇深度文章
继具身智能后的炒股新概念继具身智能后的炒股新概念
语义网络本身也是一种高维空间信息,目前的模型面数和粗糙大贴图看不出来对于所描述的智能驾驶、距离感知、空间感知的助益
一两个月前接触到的这个产品,说是世界模型的初步应用,当时点进去看了下,体验下来不能说惊艳,也不能说糟糕,只能说 普通或者将就,或者说新鲜。
它实际上是传入一张图或者一段视频,然后猜测深度,生成点云。
巧妙之处在于
点云是可以被导出直接做建模的,也就是说,这是可编辑的3d模型。
而更巧妙的是,你可以ai对话修改某个部分,或者上传其他的图并且让它修改、缝合进当前的点云。
这使得某些临时需要建模工作而完全不懂建模的人可以迅速地把这部分外包出去,这也是它的价值所在,像普通人用canvas功能生成一个有点小功能的网页。
糟糕之处在于,它能做的仅仅如此,你只能在原点看到精美的图本身(它甚至可能会理解错,比如它把黑神话钟馗里的钟馗理解成了小山丘,然后就抽象起来了),一旦移动,就会看到整个世界被模糊地拼凑起来。
并且,现在的世界生成速度还很慢,还不足以高强度地构建真实世界。
全是个可以期待未来的玩具吧