https
-
号称击败Claude 3.5 Sonnet,媲美GPT-4o,开源多模态模型Molmo挑战Scaling law
Molmo,开源多模态模型正在发力! 它也可以从虚拟世界帮你解决现实世界的问题,说一句:「molmo,帮我买杯星巴克的南瓜拿铁。」剩下的就不用动手了,打开外卖网页、点餐、付款,mo…
-
单目三维检测实时泛化,纯视觉自动驾驶鲁棒感知方法入选ECCV 2024
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交W * t p流与传播。如…
-
更简单、更清晰,解析核酸、蛋白、细胞等结构,AI实现快速分子模式挖掘
1. 编辑 | 白菜叶 低温电子断层扫描技术可以以纳米级分辨率对细胞三维结构进行常规可视化。当与单粒子断层扫描技术相结合时,可以获得原生环境中常见大分子的1 Z 0 f : 5 9…
-
中国科大、科大讯飞团队开发ChemEval:化学大模型多层次多维度能力评估的新基准
编辑 | ScienceAI 近日,认知智能全国重点实验室、中国科学技术大学陈恩红教授团队,科大讯飞研究院 AI for Science 团队发布了论文《Ch5 S f l u Q…
-
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
5秒内快速生成、直出工业级PBR资产,三维扩散模型3DTopia-XL开源
AIxiv 专栏是本站发布学术、技术内容的栏目。过去数年,本站 AIxiv 专栏接收报道了 2000 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您…
-
我国工业互联网标识解析体系开放开源
本站 10 月 2 日消息,随着数字化转型的深入发展,企业对于标识应用的需求日益迫切,工业互联网标识解析体系由“建设”转向“应用”速度加快,2024 年 1 月,工业和信息化部等十…
-
2024 新版心脏起搏器国家标准发布
本站 9 月 30 日消息,据国家市场监督管理总局官网今日消息,为助力提升我国心脏起搏器产品在全球市场中的竞争力,最大程度地保障患者用械安全,近期市场监管总局(国家标准委)批准发布…
-
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
近日,中国电信人工智能研究院(teleai)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国% l u \ ` Q产化万卡集群和国产…
-
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
「火山爆发,震撼天地。」这八个字会在你的头脑中触发怎样的影像?是否与下面的视频类似? 提示词:火山喷发,升起巨大蘑菇云,岩浆顺着山体往下流,镜头拉近,岩浆正在火山口跳动冒出。 这段…
-
从数据增强的隐藏作用出发,揭示视觉强化学习可塑性损失的独特机制
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交* o ] g * L x…
-
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
今天凌晨,大新闻不断。一边是 OpenAI 的高层又又又动荡了,另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一…
-
机器学习辅助催化剂设计,天大团队开发通用且可解释的描述符
编辑 |kx 低成本、高效的催化剂高通量筛选对于未来的可再生能源技术至关重要。可解释的机器学习通过提取物理意义来加速催化剂设计,但面临着巨大的挑~ C 5战。 近日,天津大学巩金龙…
-
用大模型优化大模型预训练数据,节省20倍计算量,实现显著性能提升!
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
23亿参数,Transformer架构,NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC
编辑 | KX 9 月 23 日,IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC,该模型可以在台式计算机上运行,且开源。 Prit…
-
上交大、复旦中山团队开发糖尿病专用大语言模型,助力个性化糖尿病管理
编辑 |ScienceAI 随着全球糖尿病患病率的逐年攀升,糖尿病已成为全球范围内极具挑战的公共健康问题。据统计,全球约有 10% 的人口受到糖尿病的影响。到 2045 年,全球糖…
-
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。 规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(llm)的出l Z S现,人们对 llm 是…
-
我国首个永久基本农田查询平台上线
本站 9 月 24 日消息,据自然资源部官网消息,为严格落实永久基本农田特殊保护制度,充分发挥社会监督作用,保障群众知情权、监督权,自然资源部决定向社会提供永久基本农田查询服务。 …
-
AI会「说谎」,RLHF竟是帮凶
虽然 RLHF 的初衷是用来控制人工智能(AI),但实际上它可能会帮助 AI 欺骗人类。 语言模型 (lm) 可能会产生人类难以察觉的错误,尤其是在任务复杂的情况下。作为最近流行的…
-
开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!
本文的主要作者来自上海交通大学智能机器人与机器视觉(irmv)实验室。本文第一作者是实验室硕士生刘久铭,主要研究方向为点云配准,雷达里程计,多模态融合,nerf/3dgs 渲染,3…