登录
注册
据 Woofun AI 消息,影眸科技本月正式完成新一轮数亿元融资,由凯辉基金与上海国投先导联合领投,字节跳动、美团龙珠、红杉中国及蓝驰创投等老股东继续跟投。与此同时,该公司同步发布了新一代模型 Hyper3D Rodin Gen-2.5,标志着其从单纯的技术探索转向生产级落地的关键转折。
这一轮融资不仅验证了资本市场对3D生成赛道的信心,更凸显了这家由00后主导的团队在AI产业中的独特定位。与行业普遍追逐宏大的'世界模型'概念不同,影眸科技选择了一条更为务实的路径,专注于解决3D资产在生产流程中的实际可用性问题,试图在生成式AI的喧嚣中构建真正的工业价值。当前AI行业正频繁讨论'世界模型',李飞飞、LeCun等顶尖学者纷纷下场阐释其定义与分类,试图让模型理解并推演可交互的物理空间。
然而,影眸科技CEO吴迪对此表现出明显的克制,他认为真正的世界模型必须与具身智能、控制及交互深度绑定,而不仅仅是生成一个可浏览的环境。在真正的数字世界被构建之前,更基础的问题在于:世界里的物体从何而来?一张桌子、一只手套或一个游戏怪兽,若仅停留在屏幕展示层面,便无法进入生产流程。真正的3D资产必须具备可拆分、可编辑、可换材质、可进引擎及可外包加工的能力。影眸科技正是瞄准了这一痛点,试图将3D生成从'看起来像'提升至'用起来对'的工业化标准。Rodin Gen-2.5作为全球首个具备千万面级生成能力的3D大模型,其核心突破在于引入了类大语言模型的'先思考、再生成'逻辑。不同于以往依赖2D升3D的传统路径,该模型通过原生大模型框架CLAY实现了技术底层的变革。数据显示,Rodin Gen-2.5上线首月,订阅用户与ARR的环比增速扩大400%,这一数据在缺乏标准化Benchmark的AI 3D领域显得尤为珍贵。过去,大多数AI 3D工具受限于算法噪声和视角不连续,生成的资产往往存在'多头怪'等崩坏结果,仅能用于随机抽卡而无法直接交付。影眸科技通过2024年8月提名SIGGRAPH最佳论文的CLAY框架,彻底改变了这一局面,将3D生成推向了Production-Ready的最终落地方向。
Woofun AI 整理数据显示,该模型底层采用了自适应计算预算机制,根据对象复杂度动态调整生成策略。简单物体仅需4秒即可出草稿,适合批量测试;中等复杂度资产耗时20秒,兼顾结构与细节;而高精度模型则需80秒,能够将皮肤微结构、毛孔、纹理甚至龙鳞等细节直接生成。
这种设计思路借鉴了大语言模型的推理过程,将计算资源精准分配给需要高保真的几何结构与材质细节。影眸科技CTO张启煊指出,此前AI 3D结果多停留在白盒或预览阶段,而Rodin Gen-2.5的Extreme-High模式已被游戏工作室直接用于高模制作,生成的龙鳞等细节可直接与低多边形模型结合,无缝接入后续工序。除了几何生成的突破,Rodin Gen-2.5还同步推出了12K原生3D外观生成模型,彻底解决了3D资产的'皮囊'问题。不同于行业普遍采用的多视图投影技术,Hyper3D通过冻结物体表面光场,将2D图像与3D外观统一到同一潜在空间,实现了无死角覆盖。该技术不仅消除了投影拉伸和死角破损,还完美支持基于物理的PBR材质,包括金属度、粗糙度、高光及法线等参数。在12K超高分辨率加持下,生成的几何精度与材质保真度已超越动辄数万元成本的实景扫描,为后期制作留出了巨大的修改空间。配合几何模型同款的Thinking Effort设计,最快只需5秒,一套包含高精度几何与12K贴图的完整资产即可直接出炉,极大提升了生产效率。在当前的AI调整期,资本市场衡量企业的核心指标已从用户规模转向持续付费能力。影眸科技选择了一条类似Anthropic的硬核B端路线,其商业化结构呈现出显著的全球化特征。约80%的收入来自海外市场,核心主战场位于北美,这与其技术导向的产品策略高度契合。营收结构中,B端与C端(Pro C专业用户)基本呈现4:6的比例,其积累的B端客户营收超过同赛道其他所有友商的总和,且续费率几近100%。
这一数据表明,影眸科技的产品已深度嵌入客户的生产管线,形成了极高的转换成本。顶流大厂排队接入Hyper3D的能力,进一步印证了其技术壁垒。在英伟达创始人黄仁勋的CES主题演讲中,3D资产生成工作流便采用了Hyper3D Rodin。
目前,Unity AI Beta、OctaneRender、Canva、Figma等专业设计与引擎平台均已先后接入Hyper3D的能力,构建了广泛的生态合作网络。影眸科技的成功也与其独特的团队结构密切相关。公司创始人曾提到,影眸现在加上实习生约60人,技术团队约占三分之二,核心算法团队很多人从本科阶段一起成长,流动很少。CTO张启煊表示,公司成立到现在,流出的核心算法人才只有3个,分别去了英伟达、迪士尼研发部门和腾讯。小团队的好处是方向更集中,年轻化的好处则是点子更加天马行空。影眸的核心团队来自上海科技大学的MARS实验室,吴迪2015年入学,第二年就搭起了这个实验室。核心研发平均为00后,约60人的团队很难让人将其与'生成世界'这样宏大的命题联系起来,但回顾其过去几年的路线,会发现他们几乎一直在做同一件事。从扫描真实世界到生成数字人,从生成单个物体到生成完整资产,接下来再从资产走向场景,尺度一直在变大,但方向始终没变。当AI行业开始重新讨论世界模型时,有人在生成环境,有人在生成游戏,有人在探索具身智能。对于世界模型究竟是什么,至今没人能给出标准答案。但有一点或许越来越清晰:在那个能够被进入、被交互、被操纵的数字世界真正出现之前,总得有人先把里面真实可控的东西造出来。影眸科技通过解决3D资产生成的'最后一公里'问题,不仅获得了资本市场的认可,更为未来数字世界的构建奠定了坚实的工业基础。
这种从微观物体到宏观场景的渐进式演进,或许正是通往真正世界模型的必经之路。