gpt
-
上交大发布首个OpenAI o1复现项目进展报告,满满的经验洞察
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进* t M k了学术交流与传H L…
-
号称击败Claude 3.5 Sonnet,媲美GPT-4o,开源多模态模型Molmo挑战Scaling law
Molmo,开源多模态模型正在发力! 它也可以从虚拟世界帮你解决现实世界的问题,说一句:「molmo,帮我买杯星巴克的南瓜拿铁。」剩下的就不用动手了,打开外卖网页、点餐、付款,mo…
-
中国科大、科大讯飞团队开发ChemEval:化学大模型多层次多维度能力评估的新基准
编辑 | ScienceAI 近日,认知智能全国重点实验室、中国科学技术大学陈恩红教授团队,科大讯飞研究院 AI for Science 团队发布了论文《Ch5 S f l u Q…
-
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
上交大、复旦中山团队开发糖尿病专用大语言模型,助力个性化糖尿病管理
编辑 |ScienceAI 随着全球糖尿病患病率的逐年攀升,糖尿病已成为全球范围内极具挑战的公共健康问题。据统计,全球约有 10% 的人口受到糖尿病的影响。到 2045 年,全球糖…
-
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。 规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(llm)的出l Z S现,人们对 llm 是…
-
李飞飞创业之后首个专访:视觉空间智能与语言一样根本
不久之前,李飞飞教授的空间智能创业公司 World Labs 以及全明星的创业阵容正式亮相。 随后,李飞飞与另一位联合创始人 Justin Johnson 接受了 a16z 的专访…
-
首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理
本文作者来自于香港中文大学深圳和深圳大数据研究院。其中第一作者为香港中文大学深圳博士生王熙栋和研究助理宋定杰,主要研究方向分别为医疗agi和多模态学习;博士生陈舒年研究方向为多模态…
-
OpenAI前研究者发布提示词工程框架ell,升级版LangChain,支持版本控制和多模态
llm 喜欢赞美,如果你在提示词中夸奖它是个「才华横溢的专家(genius expert)」,它就更可能为你生成更好的答案。 当然,OpenAI 的这位前研究科学家 William…
-
别Cursor了,集成o1的GitHub Copilot让网友直呼要回归
waitlist 挤爆了。 草莓大模型又来了。 昨天,GitHub CEO Thomas Dohmke 预告了一则关于草莓模型的推文,一时间勾起了很多人的好奇心。 很多人猜测 Gi…
-
CoT能让模型推理能力无上限?田渊栋、LeCun下场反对:两层MLP还能模拟全世界呢
「这相当于在理论上,两层神经网络在理论上可以拟合任何数据,我们就盲目相信并应用在所有场景中。」 大模型新范式 OpenAI o1 一经发布,如何「复刻」出 o1 便成为了 AI 圈…
-
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT? openai 1 的诞生极大地提升了人们对 llm 推理能力和思维链(cot)的兴趣。一时之间,似乎思维链很快就会成为所有 llm 的标…
-
Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接
训练完就直接上模型。 我们都知道,Mistral 团队向来「人狠话不多」。昨天下午,他们又又又丢出了一个不带任何注解的磁力链接。 解析一下这个链接,可以看到大k X + y s D…
-
ACL杰出论文奖|GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集,全面提升大模型心智能力
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
Scaling Law瓶颈,Cursor编程为什么这么强?团队参与新研究掏出秘密武器
近段时间,ai 编程工具 cursor 的风头可说是一时无两,其表现卓越、性能强大。近日,cursor 一位重要研究者参与的一篇相关论文发布了,其中提出T k u j了一种方法,可…
-
还在死磕AI咒语?北大-百川搞了个自动提示工程系统PAS
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工…
-
刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错
快速更迭的开源大模型领域,又出现了新王:Reflection 70B。 横扫 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405…
-
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
训练代码、中间 checkpoint、训练日志和训练数据都已经开源。 尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡G P $…