首页 > TAG信息列表 > LLM

如何在家用普通桌面系统运行大型语言模型
动手实践:随着所有关于大规模机器学习训练集群和人工智能 PC 的讨论,你会认为你需要某种特殊的硬件来在家里玩文本和代码生成的大型语言模型(LLM

全球首个糖尿病诊疗多模态人工智能系统 DeepDR-LLM 问世
近日,一个由中国和新加坡科研人员组成的国际团队成功开发出全球首个面向糖尿病诊疗的多模态人工智能系统DeepDR-LLM。

AIGC 和大语言模型 LLM 推动人工智能领域进步,RTC 成重要一环
AIGC 和 大语言模型 LLM 的快速发展正推动人工智能领域的进步和创新,LLM 作为 AIGC 的核心模块,其发展尤为引人注目。随着技术的不断进步,大语言模型的能力也不断进化

阿里通义实验室开源音频生成大模型 FunAudioLLM,提升自然语音交互体验
阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目,旨在提升人类与大型语言模型(LLMs)间的自然语音交互体验。

基于 Transformer 的自回归语言模型中生成令牌成本高的解决方案
Block Transformer:通过全局到局部的语言建模加速LLM推理,令牌,解码器,上下文,语言建模,block,transformer

LoRA:大型语言模型的低阶适配,微调模型的热门方法
大多数人都知道,训练这些模型是非常昂贵的,需要大量的资本投资;所以,看到我们可以通过采用现有的模型并用自己的数据对模型进行微调,从而创建一个具有自己特色的模型

西交微软北大提出信息密集型训练大法
中文科技资讯精选摘要:近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。

欧洲科学院院士联合上海人工智能实验室提出多智能体规范性框架CRSEC
导语 如何才能让智能体具备遵守社会规范的能力,并让AI社会中自发涌现出社会规范?近日,欧洲科学院院士、西北工业大学王震教授团队联合上海人工智能实验室胡舒悦研究员
大模型回答如何更可靠?MIT设计出「共识博弈」
大模型回答如何更可靠?MIT研究团队设计出「共识博弈」,将数学家常用的博弈论引入LLM改进中。没想到,LLaMA-7B的表现,击败了LLaMA-65B,甚至与PaLM-

日本开发大规模语言模型“-LLM”正式发布
科技日报讯东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。“Fugaku-

日本发布超级计算机“-LLM”加速密集矩阵乘法库
日本研究人员利用超级计算机Fugaku发布了Fugaku-LLM,这是一个具有130亿个参数的大型语言模型。通过优化性能和加速通信,Fugaku-LLM在日本MT-

利兹大学法学院为跨专业申请者推荐的专业之一
利兹大学,位于英国的历史文化名城利兹,是罗素大学集团的成员之一,以其卓越的学术成就和高质量的教学水平而闻名于世。在法律领域,利兹大学法学院拥有优秀的师资力量和丰富的教学资源


2024年哪个月发布,爆料人掐指一算,可能在11月
原创 新智元 新智元 新智元报道 编辑:桃子 好困 【新智元导读】全世界的目标再次聚焦在巴黎科技活动上的OpenAI。这次,开发者体验负责人带来了更多GPT-4

世界女排联赛澳门站:中国女排 3-1 逆转荷兰,朱婷回归引热议
允中 发自 凹非寺量子位 | 公众号 QbitAIChatGPT爆火,为何大模型却依然没有得到广泛的应用?原因无它,受制于性能和成本。最近


Django 框架创始人:LLM 本质上是无状态函数,并非真正有记忆
ChatGPT和Gemini等语言模型在对话过程中似乎能够记住之前的对话内容,但实际上它们是无状态函数。通过提供上下文作为提示,模型才能“记忆”之前的对话。然而

IBM 推出突破性 LLM 基准测试方法,成本降低 99%,加速算法迭代与创新
巨头动态1.【IBM推出突破性LLM基准测试方法,成本降低99%】IBM研究实验室发布了一项颠覆性的LLM基准测试方法,该方法能显著降低评估LLM性能的计算成本,最高可达99%。

IBM 研究发布突破性 LLM 基准测试方法,计算成本降低 99%
中文科技资讯精选摘要:IBM 研究发布了一项突破性的 LLM(大型语言模型)基准测试方法,承诺将计算成本降低高达99%。

IBM 研究推出创新 LLM 基准测试方法,计算成本降低 99%
IBM研究发布了一项突破性的LLM基准测试方法,承诺将计算成本降低高达99%。传统的基准测试,如斯坦福的HELM,需要耗费超过一天的时间,并且成本高达1万美元,这对开发人员和

大语言模型的母语究竟是什么?探究其运行机制
大语言模型的「母语」是什么?我们的第一反应很可能是:英语。但事实果真如此吗?尤其是对于能够听说读写多种语言的 LLM 来说。对此
Django 框架创始人观点:LLM 看似有记忆,实则为无状态函数
Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。
热门文章