首页 > TAG信息列表 > LLM

2024年哪个月发布,爆料人掐指一算,可能在11月
原创 新智元 新智元 新智元报道 编辑:桃子 好困 【新智元导读】全世界的目标再次聚焦在巴黎科技活动上的OpenAI。这次,开发者体验负责人带来了更多GPT-4

西交微软北大提出信息密集型训练大法
中文科技资讯精选摘要:近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。

欧洲科学院院士联合上海人工智能实验室提出多智能体规范性框架CRSEC
导语 如何才能让智能体具备遵守社会规范的能力,并让AI社会中自发涌现出社会规范?近日,欧洲科学院院士、西北工业大学王震教授团队联合上海人工智能实验室胡舒悦研究员
大模型回答如何更可靠?MIT设计出「共识博弈」
大模型回答如何更可靠?MIT研究团队设计出「共识博弈」,将数学家常用的博弈论引入LLM改进中。没想到,LLaMA-7B的表现,击败了LLaMA-65B,甚至与PaLM-

日本开发大规模语言模型“-LLM”正式发布
科技日报讯东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。“Fugaku-

日本发布超级计算机“-LLM”加速密集矩阵乘法库
日本研究人员利用超级计算机Fugaku发布了Fugaku-LLM,这是一个具有130亿个参数的大型语言模型。通过优化性能和加速通信,Fugaku-LLM在日本MT-

利兹大学法学院为跨专业申请者推荐的专业之一
利兹大学,位于英国的历史文化名城利兹,是罗素大学集团的成员之一,以其卓越的学术成就和高质量的教学水平而闻名于世。在法律领域,利兹大学法学院拥有优秀的师资力量和丰富的教学资源

Django 框架创始人观点:LLM 看似有记忆,实则为无状态函数
Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。

大语言模型的母语究竟是什么?探究其运行机制
大语言模型的「母语」是什么?我们的第一反应很可能是:英语。但事实果真如此吗?尤其是对于能够听说读写多种语言的 LLM 来说。对此

微软计划开发全新 AI 语言大模型 SpreadsheetLLM,变革电子表格处理方式
根据微软公布的研究论文,微软计划为Excel、谷歌Sheets等表格应用程序,开发全新的AI语言大模型——SpreadsheetLLM。图源:网络Microsoft在论文指出

达索系统与 Mistral AI 达成合作,利用先进 AI 技术赋能各行业
●本次合作开创性地将达索系统的虚拟孪生体验及主权云基础设施与Mistral AI的大型语言模型(LLM)进行了结合●达索系统的行业解决方案在保护知识产权的同时

如何在家用普通桌面系统运行大型语言模型
动手实践:随着所有关于大规模机器学习训练集群和人工智能 PC 的讨论,你会认为你需要某种特殊的硬件来在家里玩文本和代码生成的大型语言模型(LLM

阿里通义实验室开源音频生成大模型 FunAudioLLM,提升自然语音交互体验
阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目,旨在提升人类与大型语言模型(LLMs)间的自然语音交互体验。

上海 AI 实验室开源多模态大型语言模型 IXC-2.5,填补国内空白
昨天,上海AI实验室给我们带来了一个巨大的惊喜——开源了一款名为InternLM-XComposer-2.5(简称IXC-2.5)的多模态大型语言模型。这不是一个普通的模型

大模型不仅会欺骗人类,还会自己把自己「黑了」
编辑:桃子【新智元导读】一直以来大模型欺骗人类,早已不是什么新鲜事了。可是,最新研究竟发现,未经明确训练的LLM不仅会阿谀奉承,甚至入侵自己系统

ChatGPT 对学术写作影响超疫情?研究团队发布惊人结论
整理 | 王轶群责编 | 唐小引出品丨AI 科技大本营(ID:rgznai100)近日,来自德国图宾根大学Hertie脑健康人工智能研究所、图宾

基于 Transformer 的自回归语言模型中生成令牌成本高的解决方案
Block Transformer:通过全局到局部的语言建模加速LLM推理,令牌,解码器,上下文,语言建模,block,transformer

LoRA:大型语言模型的低阶适配,微调模型的热门方法
大多数人都知道,训练这些模型是非常昂贵的,需要大量的资本投资;所以,看到我们可以通过采用现有的模型并用自己的数据对模型进行微调,从而创建一个具有自己特色的模型

Django 框架创始人:LLM 本质上是无状态函数,并非真正有记忆
ChatGPT和Gemini等语言模型在对话过程中似乎能够记住之前的对话内容,但实际上它们是无状态函数。通过提供上下文作为提示,模型才能“记忆”之前的对话。然而

IBM 推出突破性 LLM 基准测试方法,成本降低 99%,加速算法迭代与创新
巨头动态1.【IBM推出突破性LLM基准测试方法,成本降低99%】IBM研究实验室发布了一项颠覆性的LLM基准测试方法,该方法能显著降低评估LLM性能的计算成本,最高可达99%。

IBM 研究发布突破性 LLM 基准测试方法,计算成本降低 99%
中文科技资讯精选摘要:IBM 研究发布了一项突破性的 LLM(大型语言模型)基准测试方法,承诺将计算成本降低高达99%。

IBM 研究推出创新 LLM 基准测试方法,计算成本降低 99%
IBM研究发布了一项突破性的LLM基准测试方法,承诺将计算成本降低高达99%。传统的基准测试,如斯坦福的HELM,需要耗费超过一天的时间,并且成本高达1万美元,这对开发人员和
热门文章