https
-
ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard
最近的文本到图像生成器由文本编码器和扩散模型组成。如果在没有适当安全措施的情况下部署,它们会产生滥用风险(左图)。我们提出了潜在保护方法(右图),这是一种旨在阻止恶意输入提示的安全…
-
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
让 LLM 在自我进化时也能保持对齐。 我们这个世界是不断变化的开放世界。人工智能要在这个世界长久立足,就需要突破许多限制,包括可用数据和规模和质量以及有用新信息的增长率。 对基于…
-
NeurIPS 2024 | 真实世界复杂任务,全新基准GTA助力大模型工具调用能力评测
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
高效评估多模态预训练对齐质量,中科大提出模态融合率MIR
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
创新能力超越AI Scientist,上海AI Lab「AI 科研团队」VirSci来了
编辑|ScienceAI 由上海人工智能实验室提出的 VirSci(Virtual Scientists)系统是一个基于大语言模型(LLM)的多智能体协作平台,专注于模拟科学家团队…
-
LLM 比之前预想的更像人类,竟也能「三省吾身」
子曾经曰过:「见贤思齐焉,见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界,对 ai 来说也同样如此吗? 近日,一个多机构联合团队证实了这一点。他们的研究表明,语言模型…
-
MetaGPT开源SELA,用AI设计AI,效果超越OpenAI使用的AIDE
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果w a 9 …
-
NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
理所当然也能错,数学界震动:「上下铺猜想」被证伪
现代数学,开始对你的直觉开刀了。 数学的很大一部分是由直觉驱动的,但有时想当然会让人误入歧途。早期的证据可能并不代表大局,一个陈述可能看起来很明显,但一些隐– o q …
-
强化学习之父Richard Sutton给出一个简单思路,大幅增强所有RL算法
在奖励中减去平均奖励 在当今的大模型时代,以 RLHF 为代表的强化学习方法具有无可替代的重要性,甚至成为了 OpenAI 1 等模型实现强大推理能力的关键。 但这些强化学习方法仍…
-
NeurIPS 2024 | 机器人操纵世界模型来了,成功率超过谷歌RT-1 26.6%
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
大模型已过时,小模型SLM才是未来?苹果正在研究这个
手机还是更适合小模型 大模型虽然好,但我的笔记本和手机都跑不动呀。就算勉强能跑起来,也是奇慢无比。而与此同时,对适合移动和边缘设备的小模型的需求却在不断增长,因为这些模型似乎才能真…
-
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交\ P = V 5 2 *…
-
登上生图排行榜第一的red_panda,是家创业公司,不是国产模型
大家别猜了,「red_panda」(小熊猫)模型有主了。 谜底解开了。 前几天在 Hugging Face 文本转图像排行榜上排名第一的 red_panda,是一个名为 Recra…
-
导航、采矿、建造,北大这个新智能体把《我的世界》玩透了
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
准确、高效、物理有效,中科大、北大提出「两段式」分子对接统一框架DeltaDock
编辑 | kx 分子对接是一种预测配体结合姿势的技术,在基于结构的药物设计中对于理解蛋白质-配体相互作用至关重要。最近,几何深度学习 (GDL) 对接方法,比传统采样方法具有更高的…
-
o1之后,GitHub又接入Claude、Gemini,网友:也杀不死Cursor
那些转到 cursor 的用户,会不会又被吸引过来呢? 从今天起,GitHub Copilot 用户可以有更多模型选择了。 包括 Anthropic 的 Claude 3.5 So…
-
世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果
近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场W f X u p [景重建…
-
TMI2024 | 阿大、同济等提出TraCoCo,用于3D医学图像半监督分割
编辑 | ScienceAI 3D 医学图像分割方法已经取得了成功,但它们对大量体素级标注数据的依赖是一个需要解决的缺点,因为获取这些标注的成本很高。 半监_ v V n督学习(S…
-
谷歌这款新概念键盘,治好了我多年的老病
谷歌终于把人机交互给玩明白了? 很多整天对着电脑的同学们难免腰酸背疼,有时会发出这样的感叹:我对这键盘受够了! 那么问题来了:应该换个机械键盘还Q B \是分体式键盘呢?让我们看看…
-
斯坦福开源学术研究神器STORM再进化,AI智能体像人一样进行圆桌讨论
不仅有主持人,还能得到不同AI专家的解答。 今年 4 月,斯坦福大学推出了一款利用大语言模型(llm)辅助编写类维基百科文章的神器。它就是开源的 storm,可以在三分钟左右将你输…