transformer
-
23亿参数,Transformer架构,NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC
编辑 | KX 9 月 23 日,IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC,该模型可以在台式计算机上运行,且开源。 Prit…
-
字节跳动豆包视频生成大模型发布:首次突破多主体互动难关,支持多风格多比例的一致性多镜头生成
本站 9 月 24 日消息,火山引擎正式发布了豆包视频生成-pixeldance、豆包视频生成-seaweed 两款大模型,面向企业市场开启邀测,这也意味着字b c ` w ;节跳…
-
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。 规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(llm)的出l Z S现,人们对 llm 是…
-
开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!
本文的主要作者来自上海交通大学智能机器人与机器视觉(irmv)实验室。本文第一作者是实验室硕士生刘久铭,主要研究方向为点云配准,雷达里程计,多模态融合,nerf/3dgs 渲染,3…
-
李飞飞创业之后首个专访:视觉空间智能与语言一样根本
不久之前,李飞飞教授的空间智能创业公司 World Labs 以及全明星的创业阵容正式亮相。 随后,李飞飞与另一位联合创始人 Justin Johnson 接受了 a16z 的专访…
-
首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理
本文作者来自于香港中文大学深圳和深圳大数据研究院。其中第一作者为香港中文大学深圳博士生王熙栋和研究助理宋定杰,主要研究方向分别为医疗agi和多模态学习;博士生陈舒年研究方向为多模态…
-
CoT能让模型推理能力无上限?田渊栋、LeCun下场反对:两层MLP还能模拟全世界呢
「这相当于在理论上,两层神经网络在理论上可以拟合任何数据,我们就盲目相信并应用在所有场景中。」 大模型新范式 OpenAI o1 一经发布,如何「复刻」出 o1 便成为了 AI 圈…
-
还在死磕AI咒语?北大-百川搞了个自动提示工程系统PAS
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
任意论文一键变播客,谷歌正式发布Illuminate,它能重构研究者的学习方式吗?
像听书一样「读」论文。 先来听一段英文播客,内容是不是很熟悉? 是的,这俩人就是在聊那篇《Attention is All You Need》。在 4 分半的对话里,他们介绍了论…
-
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
训练代码、中间 checkpoint、训练日志和训练数据都已经开源。 尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡G P $…
-
大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
中国科学院大连化物所等开发出用于电池寿命预测的深度学习模型
本站 9 月 3 日消息,锂电池寿命的准确预测对于电气设备的正常运行至关重要。然而,由于电池容量退化过程的非线性和运行条件的不确定性,电池寿命的准确预测面临着挑战。中国科学院表示,…
-
整合 200 多项相关研究,大模型「终生学习」最新综述来了
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…