github
-
5秒内快速生成、直出工业级PBR资产,三维扩散模型3DTopia-XL开源
AIxiv 专栏是本站发布学术、技术内容的栏目。过去数年,本站 AIxiv 专栏接收报道了 2000 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您…
-
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
近日,中国电信人工智能研究院(teleai)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国% l u \ ` Q产化万卡集群和国产…
-
从数据增强的隐藏作用出发,揭示视觉强化学习可塑性损失的独特机制
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交* o ] g * L x…
-
用大模型优化大模型预训练数据,节省20倍计算量,实现显著性能提升!
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
上交大、复旦中山团队开发糖尿病专用大语言模型,助力个性化糖尿病管理
编辑 |ScienceAI 随着全球糖尿病患病率的逐年攀升,糖尿病已成为全球范围内极具挑战的公共健康问题。据统计,全球约有 10% 的人口受到糖尿病的影响。到 2045 年,全球糖…
-
开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!
本文的主要作者来自上海交通大学智能机器人与机器视觉(irmv)实验室。本文第一作者是实验室硕士生刘久铭,主要研究方向为点云配准,雷达里程计,多模态融合,nerf/3dgs 渲染,3…
-
首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理
本文作者来自于香港中文大学深圳和深圳大数据研究院。其中第一作者为香港中文大学深圳博士生王熙栋和研究助理宋定杰,主要研究方向分别为医疗agi和多模态学习;博士生陈舒年研究方向为多模态…
-
OpenAI前研究者发布提示词工程框架ell,升级版LangChain,支持版本控制和多模态
llm 喜欢赞美,如果你在提示词中夸奖它是个「才华横溢的专家(genius expert)」,它就更可能为你生成更好的答案。 当然,OpenAI 的这位前研究科学家 William…
-
别Cursor了,集成o1的GitHub Copilot让网友直呼要回归
waitlist 挤爆了。 草莓大模型又来了。 昨天,GitHub CEO Thomas Dohmke 预告了一则关于草莓模型的推文,一时间勾起了很多人的好奇心。 很多人猜测 Gi…
-
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT? openai 1 的诞生极大地提升了人们对 llm 推理能力和思维链(cot)的兴趣。一时之间,似乎思维链很快就会成为所有 llm 的标…
-
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
近日,在 2024 Inclusion・外滩大会 “超越平面思维,图计算让 AI 洞悉复杂世界” 见解论坛上,蚂蚁集团知识图谱负责人梁磊分享了 “构建知识增强的专业智能体” 相r …
-
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能…
-
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
这是 AI 智能体在大部分科学研究中超越人类的第一个案例,或许会彻底改变人类与科学文献互动的方式。 最近一段时间,有关 AI 科学家的研究越来越多。大语言模型(LLM)有望帮助科学…
-
超越AlphaFold3,OpenAI投资的AI生物初创发布Chai-1,分子结构预测新SOTA
编辑 | ScienceAI 近日,成立仅 6 个月的 AI 生物技术初创公司 Chai Discovery,发布用于分子结构预测的新型多模态基础模型 Chai-V ( v y E…
-
召唤100多位学者打分,斯坦福新研究:「AI科学家」创新确实强
近日,一篇关于自动化 ai 研究的论文引爆了社交网络,原因是该论文得出了一个让很多人都倍感惊讶的结论:llm 生成的想法比专家级人类研究者给出的想法更加新颖! 我们都知道通过调节 …
-
ACL杰出论文奖|GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集,全面提升大模型心智能力
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
还在死磕AI咒语?北大-百川搞了个自动提示工程系统PAS
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
还在人工炼丹?自动提示工程指南来了,还带从头实现
人工设计提示词太麻烦了!想过让 LLM 帮你设计用于 LLM 的提示词吗? 近日,自称生成式 ai 黑带选手的谷歌研究者 heiko hotz 发布了一篇长文,详细介绍g _ B了…
-
名场面来了,李云龙、徐江、王多鱼同台飙戏,背后是小红书的AI
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
AMD 发布 Anti-Lag 2 SDK,可进一步降低游戏延迟
本站 9 月 7 日消息,amd 前天在 gpuopen 和 github上发布了其反延迟技术 radeon anti-lag 2 的 sdk。 开发者通过集成这一 SDK,可优化…
-
让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…