文字广告火爆招租永久每月免费送30G流量/不限境内境外 CDN加速免费送30G/月/不限全境各类精品菠菜大全各类精品qp资源文字广告火爆招租

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

好易之 • 2024-12-26 13:44 • IT资讯

广告2021-06-03到期2021-07-03

广告2021-06-03到期2021-07-03

广告2021-06-03到期2021-07-03

广告2021-06-03到期2021-07-03

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3d的场景理解

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿g W W 4 o L A O 9或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jt ; $ I Piqizhixin.com

从文字生成三r ] S s W维世界的场景有多难？

试想一下，如果我们要 “生成复活节岛的摩艾石像”，AI 怎么才能理解我们的需求，然后生成一个精美的三维场景？

斯坦福的研究团队提出了一个创新性解决方案：就像人类使用自然语言（natura! \ { } Wl language）进行交流，三维场景的构建需要场景语言（Scene Language）。

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

项目主页：https://ai.stanford.edu/~yzzha] 0 C Q U zng/projects/scene-language/
文章地址：https://arxivW { r 1.org/abs/2410.16770

这个新语言不仅能让 AI 理解我们的需求，更让它能够细致地将人类的描述转化为三维世界的场景。同时，它还具备编辑功能，一句简单指令就能改变场景中的元素！物体的位置、风格，现在都可以随意调整。

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

智能的场景理解

再W w } y比如，输入 “初始状态的国际象棋盘”，模型可以自动识别并生成如下特征：

64 个黑白相间的格子
按规则排列的 32 个棋子
每个棋子的独特造型

最终生成的 3D 场景完美还原了H L E I .这些细节。一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

这个方法支持多种渲染方式，能适应不同的应C q n b E用场景：一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

更具吸引力的是其编辑能力：只需一句指令，就能调整场景中的M P w [元素：一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

支持图片输入

动态生成

不仅限于静态，Scene Language 还能生成动态场景，让 3D 世界生动起来。一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

技d + ? r ) ^ k A a术亮点

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

Scene Language 的核心在于三大组件的= H ) E z = + b U融合：

1.程序语言（program)：用于精确描述场景结构，包括物体间的重复、层次关系；

2.自然语言（word）：定义场景中的物体类别，提供语义层面的信息；

3.神经网络表u = R H $ G $征（embedding）：捕捉物体的内在视觉细节。

这种组合就像给 AI 配备4 E \ { J ) +了一套完整的 “建筑工具”，既能整体规划，又能雕琢细节。

对比传统方法的优势

与现有技术相* ) z比，Scene Language 展现出显著优势：

用户偏好测试中获得 85.65% 的偏好，相比现有方法提高了近 7 倍；
在物体数量控制方面，测试集中的准确率达到 100%，而现有方法只有 11%。

这一研究展示了 AI 理解和创造 3D 世界的全新可能性F ? j G，期待它在游戏开发、建筑设计等领域引领新一轮的创新！

作者简介

该篇论文主要作者来自斯坦福大学吴佳俊团队。

论文一作张蕴之，斯坦福大学y ? n – 6 M ) t S博士生。主要研究为视觉表征及g J K { D生成。

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

吴佳俊，现任斯坦福大学助理教授。在麻省理工学院完成博士学位，本科毕业于清华大学姚班。

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

以上就是一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3Dl C s j n 0的场景理解的详细内容！

百度未收录

本文由【好易之】整理自网络！
原创文章，作者:【好易之】如转载请注明出处：https://www.zhengjiaxi.com/zxwd/itzx/118528.html
如有侵权，请邮件联系 aoduoye@qq.com 删除。
本站发布的文章及附件仅限用于学习和研究目的;不得将上述内容用于商业或非法用途，否则后果请用户自负。
本站信息来自网络，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。
如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。如有侵权请邮件与我们联系处理。

ai embedding https IT资讯 Word 排列邮箱

赞 (0)

打赏

微信扫一扫

支付宝扫一扫

好易之站长

0 0

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

上一篇 2024-12-26 13:43

共探通信网络运维新模式，湖北电信携手中兴通讯率先应用大模型智能体

共探通信网络运维新模式，湖北电信携手中兴通讯率先应用大模型智能体

下一篇 2024-12-26 13:44

IT资讯

瑞玛精密子公司空气悬架系统总成再获项目定点，销售额约10.8亿元

000

好易之
2024-12-25
IT资讯

国仪量子发布全新AI电子顺磁共振波谱仪信噪比创世界纪录

000

好易之
2024-12-26
IT资讯

瑞典电池制造商Northvolt开始规模裁员400人

000

好易之
2024-12-25
IT资讯

量子应用示范变电站建成投用

000

好易之
2025-01-01
IT资讯

《防范外卖餐饮浪费规范营销行为指引》发布，明确不得发布暴饮暴食等音视频

000

好易之
2025-01-04
IT资讯

比亚迪宣布 30 亿元慈善基金计划，将投入教育事业

000

好易之
2024-12-29
IT资讯

可以实现零代码开发的OPPO智能体平台，到底强在哪？

000

好易之
2024-12-29
IT资讯

一汽解放：拟49.24亿元出售一汽财务21.8393%股权

000

好易之
2024-12-29
IT资讯

多家快递公司深圳网点否认运费涨价：暂未接到网点或总部通知

000

好易之
2024-12-25
IT资讯

豆包是否会促进艺术的普及

000

好易之
2025-01-03
IT资讯

消息称光伏行业启动控产保价：头部企业签订自律公约，未规定具体配额

000

好易之
2025-01-04
IT资讯

人工ai全能工具有哪些

000

好易之
2025-01-03

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询：

工作时间：周一至周五，9:30-18:30，节假日休息

关注公众号