https
-
Scaling Law 撞墙?复旦团队大模型推理新思路:Two-Player架构打破自我反思瓶颈
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
HuggingFace工程师亲授:如何在Transformer中实现最好的位置编码
一个有效的复杂系统总是从一个有效的简单系统演化而来的。——John Gall 在 Transformer 模型中,位置编码(Positional Encoding) 被用来表示输入…
-
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,clip 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。clip 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中, A 6 O…
-
遗憾不?原来百度2017年就研究过Scaling Law,连Anthropic CEO灵感都来自百度
原来早在 2017 年,百度就进行过 Scaling Law 的相关研究,并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可G k g 0 S 1…
-
Sora就这么泄露了三小时,网友调侃Altman急拔网线,艺术家们也在抗议被「白嫖」
一觉醒来,挺突然的,sora api 就这么泄露了。 坏消息:三个小时后,OpenAI 就关闭了访问权限。好消息:大家伙把该测的都测完了。 9 个小时前,X 用户 @legit_r…
-
6.85亿次AI加速模拟,分析2万种材料,Meta发布催化剂数据集OCx24
编辑 | X_X 近日,Meta FAIR 与多伦多大学和 VSParticle(荷兰纳米技术工程公司 )合作,发布了开放催化剂实验 2024(OCx24)数据集,该数据集包含 5…
-
吴恩达出手,开源最新Python包,一个接口调用OpenAI等模型
在构建应用程序时,与多个提供商集成很麻烦,现在 aisuite 给解决了。 用相同的代码方式调用 OpenAI、Anthropic、Google 等发布的大模型,还能实现便捷的模型…
-
「毕昇一号」DNA活字存储喷墨打印机来了,低成本、高效率、全自动的DNA存储
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
豆包app下载官方旗舰店免费领优惠券
通过访问豆包app官方旗舰店,即可免费领取优惠券。具体步骤如下:访问官方旗舰店:https://官方旗舰店地址寻找优惠券活动点击领取优惠券查收优惠券,查看方式见详细说明 豆包APP…
-
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
智能体竟能自行组建通信网络,还能自创协议提升通信效率
Hugging Face 上的模型数量已经超过了 100 万。但是几乎每个模型都是孤立的,难以与其它模型沟通。尽管有些研究者甚至娱乐播主试过让 LLM 互相交? & K …
-
更新了!带Agent的Cursor太疯狂了
AI 辅助编程工具这条赛道越来越卷了。 新晋 AI 编程神器 Cursor,终于迎来了一次备受关注的版本更新,Cursor 0.43 来了。 新版本最大亮点之一是推出了 Compo…
-
西电大:一种具有带宽扩展和失配抑制性能的紧凑Vivaldi天线
雷达%ignore_a_1%对距离和角度分辨率的要求越来越高,为了实现这个目标,雷达需要在整个探测阶段具有大的目标信息容量和广角域探测能力。由于单位时间内的信息总量与信号的带宽正相…
-
智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间
当物理推理能力进化后,通用强化学习智能体能在2D物理环境中执行多样化任务了。 在机器学习领域,开发一个在未见过领域表现出色的通用智能体一直是长期目标之一。一种观点认为,在大量离线v…
-
RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽
开源 ai 视频社区又一个重量级选手下场。 这个周末,押注开源人工智能视频的初创公司 Lightricks,有了重大动作。 该公司推出了最快的视频生成模型 LTX-Video,它是…
-
这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct
开源模型阵营又迎来一员猛将:Tlu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1…
-
NeurIPS 2024 Oral | 还原所见!揭秘从脑信号重建高保真流畅视频
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果% k Z您…
-
英伟达开源福利:视频生成、机器人都能用的SOTA tokenizer
tokenizer对于图像、视频生成的重要性值得重视。 在讨论图像、视频生成模型时,人们的焦点更多地集中在模型所采用的架构,比如大名鼎鼎的 DiT。但其实,tokenizer 也是…
-
济南大学APL: p-Si/CsPbBr3 异质结构光电探测器
一、研究背景 光电探测器 (PD) 在生物医学、成像、通信和监测中至关重要。 传统光电探测器面临探测能力、速度和成本方面的限制。 金属卤化物钙钛矿半导体因其可调带隙、高吸收率、高迁…
-
浙江大学刘芳君、沈继忠等:三种CMOS反相器抗电磁干扰性能研究
中文摘要 电磁干扰会影响 CMOS 电路的性能,研究电路的抗干扰能力有助于设计性能更高的电路。电流型 CMOS 电路在深亚微米工艺下具有速度快、功耗低等优点,近年来得到~ [ 7 …
-
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
在智慧城市和大数据时代背景下,人类轨迹数据的分析对于交通优化、城市管理、物流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困…
-
上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
DeepSeek 又出手了,这次又是重磅炸弹。 昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ,直接冲击 OpenAI o1 保持…