llama

IT资讯

这篇论文非常火！差分Transformer竟能消除注意力噪声，犹如降噪耳机

好易之
2024-12-25
000
IT资讯

与其造神，不如依靠群体的力量：这家公司走出了一条不同于OpenAI的AGI路线

好易之
2024-12-25
000
IT资讯

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上运行的版本

今天凌晨，大新闻不断。一边是 OpenAI 的高层又又又动荡了，另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一…

好易之
2024-12-25
000
IT资讯

用大模型优化大模型预训练数据，节省20倍计算量，实现显著性能提升！

aixiv专栏是本站发布学术、技术内容的栏目。过去数年，本站aixiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之
2024-12-25
000
IT资讯

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

实验证明，大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型（llm）的出l Z S现，人们对 llm 是…

好易之
2024-12-25
000
IT资讯

o1带火的CoT到底行不行？新论文引发了论战

To CoT or not to CoT？ openai 1 的诞生极大地提升了人们对 llm 推理能力和思维链（cot）的兴趣。一时之间，似乎思维链很快就会成为所有 llm 的标…

好易之
2024-12-25
000
IT资讯

阿里云Qwen2.5发布！再登开源大模型王座，Qwen-Max性能逼近GPT-4o

好易之
2024-12-25
000
IT资讯

Mistral首个多模态模型Pixtral 12B来了！还是直接放出24GB磁力链接

训练完就直接上模型。我们都知道，Mistral 团队向来「人狠话不多」。昨天下午，他们又又又丢出了一个不带任何注解的磁力链接。解析一下这个链接，可以看到大k X + y s D…

好易之
2024-12-25
000
IT资讯

还在人工炼丹？自动提示工程指南来了，还带从头实现

人工设计提示词太麻烦了！想过让 LLM 帮你设计用于 LLM 的提示词吗？近日，自称生成式 ai 黑带选手的谷歌研究者 heiko hotz 发布了一篇长文，详细介绍g _ B了…

好易之
2024-12-25
000
IT资讯

这就翻车了？Reflection 70B遭质疑基模为Llama 3，作者：重新训练

好易之
2024-12-25
000
IT资讯

刚刚，开源大模型的新王诞生了：超越GPT-4o，模型还能自动纠错

快速更迭的开源大模型领域，又出现了新王：Reflection 70B。横扫 MMLU、MATH、IFEval、GSM8K，在每项基准测试上都超过了 GPT-4o，还击败了 405…

好易之
2024-12-25
000
IT资讯

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

训练代码、中间 checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡G P $…

好易之
2024-12-25
000
IT资讯

整合 200 多项相关研究，大模型「终生学习」最新综述来了

aixiv专栏是本站发布学术、技术内容的栏目。过去数年，本站aixiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工…

好易之
2024-12-25
000

2 / 2
1
2

联系我们

400-800-8888

在线咨询：

工作时间：周一至周五，9:30-18:30，节假日休息

关注公众号