首页 > TAG信息列表 > LLM

首个商业级扩散大型语言模型Mercury发布,性能卓越,每秒处理超1000 token
当前的 AI 领域,可以说 Transformer 与扩散模型是最热门的模型架构。也因此,有不少研究团队都在尝试将这两种架构融合到一起,以两者之长探索新一代的模型范式

Omdia预测:2024年生成式AI市场规模将翻倍,达到146亿美元
Omdia:生成式AI市场预计在2024年增长一倍以上 达到146亿美元规模,用例,工作流,omdia

腾讯高管解读Q4财报:DeepSeek技术突破,终结LLM更新对GPU数量级增长需求
3月19日晚间消息,腾讯控股(HKEX:00700)今日发布了截至12月31日的2024年第四季度及全年财报。第四季度,营收为1724亿元,同比增长11%。

AMD发布GAIA开源项目:在Ryzen AI NPU上运行本地LLM的突破性技术
AMD推出GAIA:一个在Ryzen AI NPU上运行的本地LLM开源项目,amd,处理器,npu,gaia,开源项目,ryzen,命令提示符,windows

KG与LLM完美结合:知识图谱助力大语言模型降低幻觉现象
KG与LLM完美结合:知识图谱助力大语言模型降低幻觉现象如何使用LLM建立行业KG(知识图)电子产品世界04

麦吉尔大学团队新方法LLMSynthor,让大模型成数据模拟器
麦吉尔大学团队新方法LLMSynthor,让大模型成数据模拟器麦吉尔大学团队 投稿量子位 | 公众号 QbitAI现有的数据合成方法在合理性和分布一致性方面存在不足,且缺乏自动适配不同数据的能力,扩展性较差。

World Labs:李飞飞创办的AI独角兽公司的发展与对话
World Labs:李飞飞创办的AI独角兽公司的发展与对话World Labs 是由著名 AI 专家、斯坦福大学教授李飞飞于 2024 年创办的初创公司,致力于开发具备“空间智能”的下一代 AI 系统。自成立以来

来自马里兰大学CASE Lab的研究:Invisible Tokens, Visible Bills
来自马里兰大学CASE Lab的研究:Invisible Tokens, Visible Bills本文作者来自马里兰大学的 CASE (Collaborative, Automated, Scalable, and Efficient Intelligence) Lab

大语言模型与人类价值观对齐挑战:RLHF 与 RLAIF 的探索
大语言模型与人类价值观对齐挑战:RLHF 与 RLAIF 的探索将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习(RLHF)。
多模态对齐模型新趋势:冻结大语言模型降成本,LIFT剖析优势
多模态对齐模型新趋势:冻结大语言模型降成本,LIFT剖析优势【导读】多模态对齐模型借助对比学习在检索与生成任务中大放异彩。最新趋势是用冻结的大语言模型替换自训文本编码器,从而在长文本与大数据场景中降低算力成本。

语义压缩大揭秘:人类与大型语言模型的根本差异在哪?
语义压缩大揭秘:人类与大型语言模型的根本差异在哪?当我们读到“苹果”“香蕉”“西瓜”这些词,虽然颜色不同、形状不同、味道也不同,但仍会下意识地归为“水果”。哪怕是第一次见到“火龙果”这个词

思维链真能暴露LLM内心世界?谎言被揭穿,真相令人
思维链真能暴露LLM内心世界?谎言被揭穿,真相令人这么说来,能够暴露LLM内心世界的「思维链」,如今也不可靠了?论文中,研究人员撕开了CoT的面纱,揭露了一个令人震惊的真相:思维链的透明度,可能只是一种精心编织的假象!

概率统计机制下,LLM推理真理解世界了?这些问题待解
概率统计机制下,LLM推理真理解世界了?这些问题待解概率统计机制下,LLM 推理真的「理解世界了」吗?机器之心Pro优质科技领域创作者06.2209:30机器之心PRO · 会员通讯 Week 25---

深圳市九天睿芯科技申请基于存算一体的大语言模型推理装置专利,推动AI技术革新
深圳市九天睿芯申请基于存算一体的大语言模型推理装置专利,解决现存的 LLM 推理装置的散热问题,专利,深圳市,九天睿芯,推理装置,大语言模型,科技有限公司
6月20日昆仑万维发布Skywork-SWE,开源模型成绩亮眼
6月20日昆仑万维发布Skywork-SWE,开源模型成绩亮眼6月20日,昆仑万维发布软件工程(Software Engineering, SWE)自主代码智能体基座模型Skywork-SWE



群核科技SpatialLM技术解析:开启基于LLM的3D结构化建模新范式?
群核科技SpatialLM技术解析:开启基于LLM的3D结构化建模新范式?群核科技SpatialLM技术解析:基于LLM的3D结构化建模新范式近日,空间理解模型SpatialLM发布首份技术报告,该模型来自于空间智能公司群核科技。 据悉

联想创投宋春雨:AI开源圆桌论坛热议大模型变革与投资重点
联想创投宋春雨:AI开源圆桌论坛热议大模型变革与投资重点近日,由联想创投被投企业OpenCSG与数码港联合主办的首届“Open Cyberport Community Meetup”在香港圆满落幕。联想集团副总裁

AMD Instinct MI300X GPU集成DeepSeek-V3模型,性能超越GPT-4,实现极致性能突破
AMD集成DeepSeek模型至GPU,DeepSeek V3或已超GPT-4成最强开源LLM?

Django创始人Simon Willison揭秘:如何利用LLM提升编程效率
Django创造者Simon Willison分享:我如何使用LLM帮我写代码,编程,上下文,写代码,javascript


Claude团队开源电路追踪工具,读懂大模型思维过程
Claude团队开源电路追踪工具,读懂大模型思维过程Claude团队来搞开源了——推出“电路追踪(circuit tracing)工具,可以帮大伙儿读懂大模型的“脑回路”,追踪其思维过程。

2024年哪个月发布,爆料人掐指一算,可能在11月
原创 新智元 新智元 新智元报道 编辑:桃子 好困 【新智元导读】全世界的目标再次聚焦在巴黎科技活动上的OpenAI。这次,开发者体验负责人带来了更多GPT-4
热门文章