首页 > TAG信息列表 > LLM

日本发布Arm架构超算“富岳”上训练计划
IT之家5月11日消息,由多方企业和机构组成的日本联合研究团队昨日发布了Fugaku-LLM大模型。该模型的最大特色就是其是在Arm架构超算“富岳”上训练的。Fugaku-

利兹大学法学院为跨专业申请者推荐的专业之一
利兹大学,位于英国的历史文化名城利兹,是罗素大学集团的成员之一,以其卓越的学术成就和高质量的教学水平而闻名于世。在法律领域,利兹大学法学院拥有优秀的师资力量和丰富的教学资源

李开复创办零一万物,逐浪大型语言模型,他究竟看见了什么?
李开复解读大型语言模型:两年内LLM至少还有两波迭代,微软,谷歌,远见,李开复,创业者,投资者,语言模型,人工智能技术

全球电信 AI 联盟开发大语言模型,SK 电讯贡献合作协议分析
C114讯 8月26日消息(艾斯)市场研究公司Omdia的最新报告对全球电信AI联盟(Global Telco AI Alliance

学术出版商将研究论文打包出售给科技公司训练 AI,引发科研界波澜
学术界近期面临了一场关于数据使用权的争议,随着许多学术出版商开始将研究论文数据打包出售给科技公司用于训练AI模型,这一行动引发了广泛讨论。泰勒与弗朗西斯出版商与微

2024年哪个月发布,爆料人掐指一算,可能在11月
原创 新智元 新智元 新智元报道 编辑:桃子 好困 【新智元导读】全世界的目标再次聚焦在巴黎科技活动上的OpenAI。这次,开发者体验负责人带来了更多GPT-4

IBM 研究推出创新 LLM 基准测试方法,计算成本降低 99%
IBM研究发布了一项突破性的LLM基准测试方法,承诺将计算成本降低高达99%。传统的基准测试,如斯坦福的HELM,需要耗费超过一天的时间,并且成本高达1万美元,这对开发人员和
Django 框架创始人观点:LLM 看似有记忆,实则为无状态函数
Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。

大语言模型的母语究竟是什么?探究其运行机制
大语言模型的「母语」是什么?我们的第一反应很可能是:英语。但事实果真如此吗?尤其是对于能够听说读写多种语言的 LLM 来说。对此

基于 Transformer 的自回归语言模型中生成令牌成本高的解决方案
Block Transformer:通过全局到局部的语言建模加速LLM推理,令牌,解码器,上下文,语言建模,block,transformer

Django 框架创始人:LLM 本质上是无状态函数,并非真正有记忆
ChatGPT和Gemini等语言模型在对话过程中似乎能够记住之前的对话内容,但实际上它们是无状态函数。通过提供上下文作为提示,模型才能“记忆”之前的对话。然而

IBM 推出突破性 LLM 基准测试方法,成本降低 99%,加速算法迭代与创新
巨头动态1.【IBM推出突破性LLM基准测试方法,成本降低99%】IBM研究实验室发布了一项颠覆性的LLM基准测试方法,该方法能显著降低评估LLM性能的计算成本,最高可达99%。

西交微软北大提出信息密集型训练大法
中文科技资讯精选摘要:近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。

欧洲科学院院士联合上海人工智能实验室提出多智能体规范性框架CRSEC
导语 如何才能让智能体具备遵守社会规范的能力,并让AI社会中自发涌现出社会规范?近日,欧洲科学院院士、西北工业大学王震教授团队联合上海人工智能实验室胡舒悦研究员

LLM 驱动的多模态人机交互方式引领生产力革命,重塑商业模式
每经AI快讯,国泰君安研报表示,LLM驱动的多模态人机交互方式引领新一轮生产力革命。Agent或改变端侧操作系统的生态,重塑商业模式。

吴恩达教授新课 AI Python for Beginners:从入门到精通的 Python 编程指南
吴恩达亲自授课,LLM当助教,适合初学者的Python编程课程上线,百度,吴恩达,初学者,人工智能,应用程序,编程课程,python
太空杀全新玩法 AI 残局挑战,巨人网络 AI 实验室与项目组联合研发
《太空杀》发布全新玩法“AI残局挑战”。8月2日,巨人网络(002558SZ)在旗下推理派对手游《太空杀》发布全新玩法“AI残局挑战”。据介绍

AIGC 和大语言模型 LLM 推动人工智能领域进步,RTC 成重要一环
AIGC 和 大语言模型 LLM 的快速发展正推动人工智能领域的进步和创新,LLM 作为 AIGC 的核心模块,其发展尤为引人注目。随着技术的不断进步,大语言模型的能力也不断进化

全球首个糖尿病诊疗多模态人工智能系统 DeepDR-LLM 问世
近日,一个由中国和新加坡科研人员组成的国际团队成功开发出全球首个面向糖尿病诊疗的多模态人工智能系统DeepDR-LLM。

原创 GlobalMD 全球医生组织:大语言模型 LLM 辅助疾病诊断是否可靠?
原创 GlobalMD 全球医生组织自从ChatGPT问世两年来,很多医疗机构和AI初创企业希望借助大语言模型LLM开发辅助医生和患者自我诊断病症的聊天机器人C

Neo4j LLM 知识图谱构建器:将非结构化数据转化为结构化知识图谱的神器
Neo4j LLM知识图谱构建器的推出旨在解决复杂数据处理难题,通过利用强大机器学习模型如OpenAI、Gemini等,迅速将非结构化数据转化为结构化知识图谱,实现高效数据分析。

DeepL 推出新一代语言模型,提升企业翻译水平,树立行业新标杆
全球领先的语言人工智能公司 DeepL 今日宣布推出其新一代语言模型。该模型由专为翻译和编辑打造的高度专业化的 LLM 技术提供支持。

微软计划开发全新 AI 语言大模型 SpreadsheetLLM,变革电子表格处理方式
根据微软公布的研究论文,微软计划为Excel、谷歌Sheets等表格应用程序,开发全新的AI语言大模型——SpreadsheetLLM。图源:网络Microsoft在论文指出
热门文章