架构
-
大模型已过时,小模型SLM才是未来?苹果正在研究这个
手机还是更适合小模型 大模型虽然好,但我的笔记本和手机都跑不动呀。就算勉强能跑起来,也是奇慢无比。而与此同时,对适合移动和边缘设备的小模型的需求却在不断增长,因为这些模型似乎才能真…
-
导航、采矿、建造,北大这个新智能体把《我的世界》玩透了
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
TMI2024 | 阿大、同济等提出TraCoCo,用于3D医学图像半监督分割
编辑 | ScienceAI 3D 医学图像分割方法已经取得了成功,但它们对大量体素级标注数据的依赖是一个需要解决的缺点,因为获取这些标注的成本很高。 半监_ v V n督学习(S…
-
整合长期记忆,AI实现自我进化,探索大模型这一可能性
地球上最早的生命证据至少可以追溯到 35 亿年前,而直到大约 25 万到 40 万年前,智人才出现地球上。在这漫长的岁月中,生物不断地兴盛又覆灭,但整体趋势M + * O r u总…
-
哪个模型擅长调用工具?这个7B模型跻身工具调用综合榜单第一
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
2025 年 IT 岗位增长:推进技术职业生涯的 5 种方法
在科技界保持领先地位越来越重要临近 2025 年,困难重重。人工智能 (AI) 的崛起,不断变化的网络安全挑战以及云的快速扩展计算创造了一个动态的景观,即使是经验丰富的人专业; G…
-
MIT韩松团队长上下文LLM推理高效框架DuoAttention:单GPU实现330万Token上下文推理
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进1 L = 9 9 H Q 2了学…
-
NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
还是原装Transformer好!北大清华团队同时揭示Mamba等推理短板
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术7 I + R } R…
-
软硬兼施 刺激AI PC换机潮
重写后内容: 随着 AI PC 算力的提升,相关应用服务也日益丰富。供应链消息指出,原本可能被认为价格较高的 AI PC,现在已出现售价低于 3 万元的机种。: 2 @ ~ * =…
-
视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化
现在正是「文本生视频」赛道百花齐放的时代,而且其应用场景非常多,比如生成创意视频内容、创建游戏场景、制作动画和电影。甚至有研究表明还能将视频生成用作真实世界的模拟器,m 0 s f…
-
特斯拉Dojo计算机TTPoE传输协议负责人Eric Quinnell离职
当地时间10月18日,特斯拉dojo超级计算机的ttpoe传输协议负责人eric quinnell宣布离职。他在离职邮件里披露,截至目前,dojo集群的算力是15 exaflops…
-
前高盛亚洲董事总经理潘登加入哪吒汽车,担任副总裁一职
it之家 10 月 19 日消息,据界面新闻 18 日报道,前高盛(亚洲)董事总经理潘登现已履新,加入哪吒汽车担任副总裁,并代表公司出席分析师大会。 1. 潘登曾在高盛任职 9 年…
-
OLED供应商卢米蓝完成新一轮融资
近日,有机光电材料供应商宁波卢米蓝新材料有限公司(以下简称卢米蓝)宣布完成新一轮融资,标志着卢米蓝在OLED关键核心材料自主创新研发及产业化道路上又迈出了坚实一步。本轮融资由浙江文…
-
华勤技术创新:自研车规级77GHz毫米波雷达,实现硬件领域五大创新
重写后的文字内容: 智能驾驶时代的汽车电子创新 在智能驾驶浪潮的推动下,汽车电子行业正飞速向集成化、智能化和高度自动化演进。随着人工智能、大数据和物联网技术的融合,汽车正逐渐` l…
-
国家超算互联网平台架设数字中国建设“高速路”
在人工智能技术迅猛崛起与应用日益广泛的当下,算力需求该如何满足?前段时间于河南郑州举办的2024中国算力大会上,与会院士、专家表示,国家超算互联网平台正在逐步形成技术先进、模式创新…
-
智能网联汽车产业十大发展突破首次发布
10月17日,由工业和信息化部、交通运输部、北京市人民政府联合主办的“2024世界智能网联汽车大会”在北京开幕,“智能网联汽车产业十大发展突破”在大会开幕式上正式发布。十大发展突破…
-
自研车规级77GHz毫米波雷达,华勤技术实现硬件领域五大创新
智能驾驶浪潮下的汽车电子革新 在智能驾驶的浪潮中,汽车电子产业正朝着集成化、智能化和高度自动化迈进。人工智能、大数据和物联网技术的融合促使汽车逐渐演变为移动智能终端。在此背景下,7…
-
实测13个类Sora视频生成模型,8000多个案例,一次看个够
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
补齐Transformer规划短板又不放弃快速思考,田渊栋团队的Dualformer融合System 1和2双重优势
一个 token 就能控制模型快些解答或慢点思考。 OpenAI 1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推…
-
NeurIPS2024 | OCR-Omni来了,字节&华师提出统一的多模态文字理解与生成大模型
研究背景与挑战 在人工智能领域,赋予机器类人的图像文字感知、理解、编辑和生成能力一直是研究热点。目前,视觉文字领域的大模型研究主要聚焦于单模态生成任务。尽管这些模型在某些任务上实现…