github
-
视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化
现在正是「文本生视频」赛道百花齐放的时代,而且其应用场景非常多,比如生成创意视频内容、创建游戏场景、制作动画和电影。甚至有研究表明还能将视频生成用作真实世界的模拟器,m 0 s f…
-
又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果+ o .您…
-
实测13个类Sora视频生成模型,8000多个案例,一次看个够
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
NeurIPS2024 | OCR-Omni来了,字节&华师提出统一的多模态文字理解与生成大模型
研究背景与挑战 在人工智能领域,赋予机器类人的图像文字感知、理解、编辑和生成能力一直是研究热点。目前,视觉文字领域的大模型研究主要聚焦于单模态生成任务。尽管这些模型在某些任务上实现…
-
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
化学空间导航仪:流生成式AI引导分子属性控制
作者 | 康奈尔大学魏光浩 编辑 |ScienceAI 分子设计是药物发现和材料科学中的一个核心挑战。目前,潜在可行的药物类小分子化合物的数量估计在10^23到10^60之间l ]…
-
陶哲轩众包数学项目完成度99.99%:仍未看到AI工具的重大贡献
陶哲轩发起的「众包」数学研究项目终于快要迎来胜利时刻! 大约在三周前,陶哲轩提出了一个众包项目,结合专业和业余数学家、自动定理证明器、AI 工具和证明辅助语言 Lean, 来e ~…
-
开源软件Gradio上新5大功能,几行Python代码,构建Web应用程序
用最简单的方法来构建一个ai web应用程序。 Gradio 5 来了! 刚刚,Gradio 官方表示经过几个月的努力,他们宣布 Gradio 5 稳定版本正式发布! 快速入门:h…
-
李飞飞:不要数字孪生,要数字表兄弟,一张照片生成机器人训练场景
不百分百还原出虚拟场景,效果反而更好。 我们很多人都听说过数字孪生(digital twin),在英伟达等公司的大力推动下,这种高效运营工作流程的方法已经在很多工业场景中得到应用。…
-
OpenAI今天Open了一下:开源多智能体框架Swarm
毫无疑问,多智能体肯定是 openai 未来重要的研究方向之一,前些天 openai 著名研究科学家 noam brown 还在 x 上为 openai 正在组建的一个新的多智能体…
-
六年、六届学生接力,共铸上交大图像合成工具箱libcom
arXiv:2106.14490v5 如果你对 arXiv 的版本号有所了解,你就知道这篇论文已经更新了 4 次,现在已经来到了第 5 个版本。实际上,这个 arXiv 编号属于上…
-
NeurIPS 2024 | Transformer长度外推,全新位置编码DAPE大幅提升模型性能
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有; 3 …
-
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B,效果媲美H100
随着 AI 模型的参数量越来越大,对算力的需求也水涨船高。 比如最近,Llama-3.1 登上了最强开源大模型的宝座,但超大杯 405B 版本的内存就高达 900 多 GB,这对算…
-
JetBrains 宣布为 GitHub Stars 人才提供全系桌面产品免费使用权
本站 10 月 8 日消息,jetbrains 于当地时间10 月 8 日发布公告,宣布与 github 达成合作,所有 github stars(被认可的技术专家,截至本站发稿仅…
-
NeurIPS 2024 | 大模型的词表大小,同样适用于Scaling Law
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有w ( …
-
上交大发布首个OpenAI o1复现项目进展报告,满满的经验洞察
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进* t M k了学术交流与传H L…
-
ECCV 2024 | 新梦幻场景生成方法,高质量、视角一致、可编辑3D场景
数据空间研究中心是中国科学技术大学网络空间安全学院布局建设的创新型科研平台。中心于 2021 年 9 月 20 日正式揭牌成立,由吴曼青院士领衔、中青年教师t X – …
-
单目三维检测实时泛化,纯视觉自动驾驶鲁棒感知方法入选ECCV 2024
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交W * t p流与传播。如…
-
更简单、更清晰,解析核酸、蛋白、细胞等结构,AI实现快速分子模式挖掘
1. 编辑 | 白菜叶 低温电子断层扫描技术可以以纳米级分辨率对细胞三维结构进行常规可视化。当与单粒子断层扫描技术相结合时,可以获得原生环境中常见大分子的1 Z 0 f : 5 9…
-
中国科大、科大讯飞团队开发ChemEval:化学大模型多层次多维度能力评估的新基准
编辑 | ScienceAI 近日,认知智能全国重点实验室、中国科学技术大学陈恩红教授团队,科大讯飞研究院 AI for Science 团队发布了论文《Ch5 S f l u Q…
-
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…