gpt

IT资讯

面向代码语言模型的安全性研究全新进展，南大&NTU联合发布全面综述

好易之

2024-12-29

000

IT资讯

生成超10万bp的DNA序列，北理工邵斌团队生成式DNA大语言模型，登Nature子刊

作者 | 邵斌团队编辑|ScienceAI2024 年 10 月 30 日，北京理工大学邵斌教授团队在《Nature Communications》杂志上发表了题为：《A long…

好易之

2024-12-29

000

IT资讯

当视觉大模型陷入认知失调，马里兰大学构建了一个幻觉自动生成框架

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之

2024-12-26

000

IT资讯

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界？

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之

2024-12-26

000

IT资讯

MetaGPT开源自动生成智能体工作流，4.55%成本超GPT-4o

好易之

2024-12-26

000

IT资讯

杨笛一团队：一个弹窗，就能把AI智能体操控电脑整懵了

弹窗攻击很有效，控制计算机的智能体根本顶不住。前些天，Anthropic 为 Claude 带来一个极具变革意义的功能：Computer Use，也就是控制用户的计算机。当时，A…

好易之

2024-12-26

000

IT资讯

不靠更复杂的策略，仅凭和大模型训练对齐，零样本零经验单LLM调用，成为网络任务智能体新SOTA

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之

2024-12-26

000

IT资讯

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果d Y A …

好易之

2024-12-26

000

IT资讯

NeurIPS 2024 | 真实世界复杂任务，全新基准GTA助力大模型工具调用能力评测

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之

2024-12-26

000

IT资讯

LLM 比之前预想的更像人类，竟也能「三省吾身」

子曾经曰过：「见贤思齐焉，见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界，对 ai 来说也同样如此吗？近日，一个多机构联合团队证实了这一点。他们的研究表明，语言模型…

好易之

2024-12-26

000

IT资讯

MetaGPT开源SELA，用AI设计AI，效果超越OpenAI使用的AIDE

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果w a 9 …

好易之

2024-12-26

000

IT资讯

导航、采矿、建造，北大这个新智能体把《我的世界》玩透了

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之

2024-12-26

000

IT资讯

o1之后，GitHub又接入Claude、Gemini，网友：也杀不死Cursor

那些转到 cursor 的用户，会不会又被吸引过来呢？从今天起，GitHub Copilot 用户可以有更多模型选择了。包括 Anthropic 的 Claude 3.5 So…

好易之

2024-12-26

000

IT资讯

整合长期记忆，AI实现自我进化，探索大模型这一可能性

地球上最早的生命证据至少可以追溯到 35 亿年前，而直到大约 25 万到 40 万年前，智人才出现地球上。在这漫长的岁月中，生物不断地兴盛又覆灭，但整体趋势M + * O r u总…

好易之

2024-12-26

000

IT资讯

哪个模型擅长调用工具？这个7B模型跻身工具调用综合榜单第一

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之

2024-12-26

000

IT资讯

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进1 L = 9 9 H Q 2了学…

好易之

2024-12-26

000

IT资讯

朱玉可团队新作：看一眼就能模仿，大模型让机器人轻松学会撒盐

在人形机器人领域，有一个非常值钱的问题：既然人形机器人的样子与人类类似，那么它们能使用网络视频等数据进行学习和训练吗？如果可以，那考虑到网络视频的庞大规模，机器人就再也不用担心没…

好易之

2024-12-26

000

IT资讯

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径，浙大用「WISE」对抗幻觉

aixiv专栏是本站发布学术、技术内容的栏目。过去数年，本站aixiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之

2024-12-26

000

IT资讯

一夜之间，大模型像人一样操控电脑了！Claude 3.5重磅升级，抢先OpenAI

几个小时前，Claude 3.5 模型迎来了一波大更新。Anthropic 推出了升级版的 Claude 3.5 Sonnet 以及一款新模型 Claude 3.5 Haiku。 …

好易之

2024-12-26

000

IT资讯

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术z o 4 T F F h交…

好易之

2024-12-26

000

IT资讯

大模型合成数据机理分析，人大刘勇团队：信息增益影响泛化能力

好易之

2024-12-25

000

IT资讯

小滑块上个斜面，难倒多少高中生？现在，AI让它动起来了

原来物理还能这么学。学习物理，不同的人自然有不同的经历。一些人觉得物理课简单直观，但另一些人却认为它抽象又反直觉，根本就无法理解。为此，许多教师和教学研n } . \究者探索了各…

好易之

2024-12-25

000

IT资讯

图灵奖得主Yoshua Bengio新作：Were RNNs All We Needed?

自从 transformer 模型问世以来，试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手，不仅要挑战 Transformer 的地位，还致敬了经典论文的名字。再…

好易之

2024-12-25

000

IT资讯

给小学数学题加句「废话」，OpenAI o1就翻车了，苹果新论文质疑AI推理能力

苹果新论文：ai 大模型可能不会推理。 AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关…

好易之

2024-12-25

000

面向代码语言模型的安全性研究全新进展，南大&NTU联合发布全面综述

生成超10万bp的DNA序列，北理工邵斌团队生成式DNA大语言模型，登Nature子刊

当视觉大模型陷入认知失调，马里兰大学构建了一个幻觉自动生成框架

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界？

MetaGPT开源自动生成智能体工作流，4.55%成本超GPT-4o

杨笛一团队：一个弹窗，就能把AI智能体操控电脑整懵了

不靠更复杂的策略，仅凭和大模型训练对齐，零样本零经验单LLM调用，成为网络任务智能体新SOTA

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

NeurIPS 2024 | 真实世界复杂任务，全新基准GTA助力大模型工具调用能力评测

LLM 比之前预想的更像人类，竟也能「三省吾身」

MetaGPT开源SELA，用AI设计AI，效果超越OpenAI使用的AIDE

导航、采矿、建造，北大这个新智能体把《我的世界》玩透了

o1之后，GitHub又接入Claude、Gemini，网友：也杀不死Cursor

整合长期记忆，AI实现自我进化，探索大模型这一可能性

哪个模型擅长调用工具？这个7B模型跻身工具调用综合榜单第一

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

朱玉可团队新作：看一眼就能模仿，大模型让机器人轻松学会撒盐

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径，浙大用「WISE」对抗幻觉

一夜之间，大模型像人一样操控电脑了！Claude 3.5重磅升级，抢先OpenAI

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

大模型合成数据机理分析，人大刘勇团队：信息增益影响泛化能力

小滑块上个斜面，难倒多少高中生？现在，AI让它动起来了

图灵奖得主Yoshua Bengio新作：Were RNNs All We Needed?

给小学数学题加句「废话」，OpenAI o1就翻车了，苹果新论文质疑AI推理能力

联系我们

400-800-8888