架构
-
大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」
去掉一个「超权重」的影响,比去掉其他 7000 个离群值权重加起来还要严重。 大模型的参数量越来越大,越来越聪明,但它们也越来越奇怪了。 两年前,有研究者发现了一些古怪之处:在大模…
-
福建移动携手中兴通讯试点HI-RAN智能低碳网络,引领智能低碳网络新篇章
福建移动携手中兴通讯在现网验证了HI-RAN(Hybrid Intelligent-RAN)智能节能解决方案,有效解决了无线网络节能精细化、数智化升级难题。 HI-RAN智能节能方…
-
生成超10万bp的DNA序列,北理工邵斌团队生成式DNA大语言模型,登Nature子刊
作者 | 邵斌团队编辑|ScienceAI2024 年 10 月 30 日,北京理工大学邵斌教授团队在《Nature Communications》杂志上发表了题为:《A long…
-
率先解决多类数据同时受损,中科大MIRA团队TRACER入选NeurIPS 2024:强鲁棒性的离线变分贝叶斯强化学习
本论文作者杨睿是中国科学技术大学 2019 级硕博连读生,师从王杰教授、李斌教授,主要研究方向为强化学习、自动驾驶等。他曾以第一作者在 neurips、kdd 等顶级期刊与会议上发…
-
首个自主机器学习AI工程师,刚问世就秒了OpenAI o1,Kaggle大师拿到饱
1. openai 的推理模型 o1 已经黯然失色? 2. 本周五,人工智能界又迎来了一个突破:一个完全自动化的机器学习流程的人工智能工程师,轻松达到了 Kaggle 大师水平,在…
-
LeCun 的世界模型初步实现!基于预训练视觉特征,看一眼任务就能零样本规划
在 llm 应用不断迭代升级更新的当下,图灵奖得主 yann lecun 却代表了一股不同的声音。他在许多不同场合都反复重申了自己的一个观点:当前的 llm 根本无法理解世界。他曾…
-
Make U-Nets Great Again!北大&华为提出扩散架构U-DiT,六分之一算力即可超越DiT
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
极氪携全系车型亮相广州车展,首发浩瀚智驾2.0端到端Plus架构
2024广州国际车展于今日盛大启幕,极氪智能科技(以下简称“极氪”)举办主题为“浩瀚智驾,先觉未来”智驾技术发布会,首发全栈自研浩瀚智驾2.0面向X | [ x高阶智驾的端到端pl…
-
“辽”望绿色未来,辽宁移动携手中兴通讯引领AI网络节能新趋势
随着全球气候变化和环境压力的加剧,数智化与绿色化融合成为推动社会高质量发展的关键动力。 近日,在IMT-2020(5G)推进组的指导下,辽宁移动与中兴通讯在现网成功测试基于AI的H…
-
杭州电子科技大学团队在车联网跨信任域安全认证领域取得新进展
日前,杭州电子科技大学微电子研究院夏莹杰教授团队联合浙江大学、杭州师范大学等科研团队,在智能交通领域TOP期刊《IEEE Transactions on Intelligent T…
-
人工智能的研究课题
人工智能(AI)研究课题 1. 生成式人工智能基础研究 智能涌现机理:探索生成式模型如何从海量数据中展现智能特性。 神经网络架构:设计高效的神经网络结构,如D # H R =改进的…
-
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer,Transformer从来没有这么灵活过!
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
首个多模态连续学习综述,港中文、清华、UIC联合发布
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
研究表明,你训练的 token 越多,你需要的精度就越高。 最近几天,AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明了大模型量化的方向。 CMU 教授 …
-
【算力】长安:未来高阶智驾汽车将全系标配500TOPS以上算力;中国新势力周销量榜:理想汽车再次第一,零跑第二;英搏尔获亿航智能项目定点
1.零跑汽车朱江明:明年有望月均销售4万辆 2.上周中国新势力销量榜公布:理想汽车再次位列第一,零跑第二 3.特锐德获宝马/奔驰合资公司5.28亿元大单,将承建并运营充电站 4.英…
-
【IPO价值观】业绩滑坡风险加剧,特斯联客户流失率超80%
ai+物联网开启了以海量数据为特征的互联世界的新篇章,根据灼识咨询报告,中国aiot市场的收入预计将从2023年的8210亿元增长至2028年的1.39万亿元,复合年s } N增长…
-
揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如z V % e…
-
从进博会看外资车企,依然重视中国市场
在电动化、智能化转型方面,中国市场是全球汽车市场中最激进的,而且对于全球各大车企来说,中国市场也是全球最大市场,其重要性不言而喻。 从本届进博会的参展情况,也可以证明这一点,第七届…
-
LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律! 自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Y…
-
调研180多篇论文,这篇综述终于把大模型做算法设计理清了
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果d Y A …
-
腾讯混元又来开源,一出手就是最大MoE大模型
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交d O E ^ w h 7…
-
ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard
最近的文本到图像生成器由文本编码器和扩散模型组成。如果在没有适当安全措施的情况下部署,它们会产生滥用风险(左图)。我们提出了潜在保护方法(右图),这是一种旨在阻止恶意输入提示的安全…
-
高效评估多模态预训练对齐质量,中科大提出模态融合率MIR
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
NeurIPS 2024 | 机器人操纵世界模型来了,成功率超过谷歌RT-1 26.6%
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…