agi
-
用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
遗憾不?原来百度2017年就研究过Scaling Law,连Anthropic CEO灵感都来自百度
原来早在 2017 年,百度就进行过 Scaling Law 的相关研究,并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可G k g 0 S 1…
-
实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍
算起来,距离 5 月 14 日 OpenAI 发布 GPT-4o 高级语音模式已经过去了半年时间。在这期间,AI 实时语音对话已经成为了有能力大厂秀肌肉、拼实力的新战场。 不过,由…
-
在「最难LLM评测榜单」上,阶跃万亿参数模型拿下中国第一
重写文本: 大模型格局再变:阶跃星辰跻身前五 国内人工智能领域传来重磅消息: 头部大模型创业公司阶跃星辰凭借其万亿参数大语言模型 Step-2 在权威大模型基准 LiveBench…
-
连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路
昨天,The Information 的一篇文章让 AI 社区炸了锅。 这篇文章透露,OpenAI 下一代旗舰模型的质量提升幅度不及前两款旗舰模型之间的质量提升,因为高质量文本和其…
-
NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
给小学数学题加句「废话」,OpenAI o1就翻车了,苹果新论文质疑AI推理能力
苹果新论文:ai 大模型可能不会推理。 AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关…
-
从数字世界到物理世界,36氪2024具身智能大会盛启上海
让AI通向物理世界。 2024年,具身智能的“骤然兴起”并非偶然! 行业关注度的提升、资本市场的热情高涨、市场规模的持续扩大、技术与应用的加速落地,诸多方面的因素共同作用,才出现了…
-
用大模型优化大模型预训练数据,节省20倍计算量,实现显著性能提升!
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
解码瓴羊:一群最懂数据的人如何让AI真正无处不在?
三年走来,每一步都「作数」。懂场景者得 ai 卷数据:从治理到流通除了利用 AI 大模型重构分析、营销、客服三大企业级智能应用,负责数据治理的中台 Dataphin 也迎来最大变化…
-
李飞飞创业之后首个专访:视觉空间智能与语言一样根本
不久之前,李飞飞教授的空间智能创业公司 World Labs 以及全明星的创业阵容正式亮相。 随后,李飞飞与另一位联合创始人 Justin Johnson 接受了 a16z 的专访…
-
首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理
本文作者来自于香港中文大学深圳和深圳大数据研究院。其中第一作者为香港中文大学深圳博士生王熙栋和研究助理宋定杰,主要研究方向分别为医疗agi和多模态学习;博士生陈舒年研究方向为多模态…
-
CoT能让模型推理能力无上限?田渊栋、LeCun下场反对:两层MLP还能模拟全世界呢
「这相当于在理论上,两层神经网络在理论上可以拟合任何数据,我们就盲目相信并应用在所有场景中。」 大模型新范式 OpenAI o1 一经发布,如何「复刻」出 o1 便成为了 AI 圈…
-
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT? openai 1 的诞生极大地提升了人们对 llm 推理能力和思维链(cot)的兴趣。一时之间,似乎思维链很快就会成为所有 llm 的标…
-
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
近日,在 2024 Inclusion・外滩大会 “超越平面思维,图计算让 AI 洞悉复杂世界” 见解论坛上,蚂蚁集团知识图谱负责人梁磊分享了 “构建知识增强的专业智能体” 相r …