LLM_AI世纪网

LLMOps即服务：降低运维门槛、提高效率、确保模型稳定性的全面解决方案

LLM即服务介绍,运维,自动化,智能化,大模型,llm即服务介绍

2025-01-02

LLM

2025-01-02

大语言模型助力银行数字化转型，可解释性难题待解？

大语言模型助力银行数字化转型，可解释性难题待解？大语言模型为银行业数字化转型注入了强大动力，但其固有的不透明性使可解释性成为一道必须跨越的门槛。商业银行唯有正视并积极克服可解释性难题

2025-09-08

LLM

2025-09-08

首个商业级扩散大型语言模型Mercury发布，性能卓越，每秒处理超1000 token

当前的 AI 领域，可以说 Transformer 与扩散模型是最热门的模型架构。也因此，有不少研究团队都在尝试将这两种架构融合到一起，以两者之长探索新一代的模型范式

2025-02-28

LLM

2025-02-28

Omdia预测：2024年生成式AI市场规模将翻倍，达到146亿美元

Omdia：生成式AI市场预计在2024年增长一倍以上达到146亿美元规模,用例,工作流,omdia

2025-03-18

LLM

2025-03-18

腾讯高管解读Q4财报：DeepSeek技术突破，终结LLM更新对GPU数量级增长需求

3月19日晚间消息，腾讯控股（HKEX：00700）今日发布了截至12月31日的2024年第四季度及全年财报。第四季度，营收为1724亿元，同比增长11%。

2025-03-20

LLM

2025-03-20

AMD发布GAIA开源项目：在Ryzen AI NPU上运行本地LLM的突破性技术

AMD推出GAIA：一个在Ryzen AI NPU上运行的本地LLM开源项目,amd,处理器,npu,gaia,开源项目,ryzen,命令提示符,windows

2025-03-25

LLM

2025-03-25

KG与LLM完美结合：知识图谱助力大语言模型降低幻觉现象

KG与LLM完美结合：知识图谱助力大语言模型降低幻觉现象如何使用LLM建立行业KG（知识图）电子产品世界04

2025-04-24

LLM

2025-04-24

麦吉尔大学团队新方法LLMSynthor，让大模型成数据模拟器

麦吉尔大学团队新方法LLMSynthor，让大模型成数据模拟器麦吉尔大学团队投稿量子位 | 公众号 QbitAI现有的数据合成方法在合理性和分布一致性方面存在不足，且缺乏自动适配不同数据的能力，扩展性较差。

2025-05-26

LLM

2025-05-26

World Labs：李飞飞创办的AI独角兽公司的发展与对话

World Labs：李飞飞创办的AI独角兽公司的发展与对话World Labs 是由著名 AI 专家、斯坦福大学教授李飞飞于 2024 年创办的初创公司，致力于开发具备“空间智能”的下一代 AI 系统。自成立以来

2025-06-05

LLM

2025-06-05

来自马里兰大学CASE Lab的研究：Invisible Tokens, Visible Bills

来自马里兰大学CASE Lab的研究：Invisible Tokens, Visible Bills本文作者来自马里兰大学的 CASE (Collaborative, Automated, Scalable, and Efficient Intelligence) Lab

2025-06-19

LLM

2025-06-19

大语言模型与人类价值观对齐挑战：RLHF 与 RLAIF 的探索

大语言模型与人类价值观对齐挑战：RLHF 与 RLAIF 的探索将大语言模型（LLMs）与复杂的人类价值观对齐，仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习（RLHF）。

2025-07-03

LLM

2025-07-03

多模态对齐模型新趋势：冻结大语言模型降成本，LIFT剖析优势

多模态对齐模型新趋势：冻结大语言模型降成本，LIFT剖析优势【导读】多模态对齐模型借助对比学习在检索与生成任务中大放异彩。最新趋势是用冻结的大语言模型替换自训文本编码器，从而在长文本与大数据场景中降低算力成本。

2025-07-03

LLM

2025-07-03

论文首次验证LLM有经验时性能不降，还能减少资源，咋做到的？

论文首次验证LLM有经验时性能不降，还能减少资源，咋做到的？论文首次系统性地验证了LLM在「有经验」的条件下，不仅性能不降，反而能大幅减少推理时间和计算资源，揭示了「AI也能熟能生巧」的全新范式。如何让LLM变熟练？

2025-07-11

LLM

2025-07-11

思维链真能暴露LLM内心世界？谎言被揭穿，真相令人

思维链真能暴露LLM内心世界？谎言被揭穿，真相令人这么说来，能够暴露LLM内心世界的「思维链」，如今也不可靠了？论文中，研究人员撕开了CoT的面纱，揭露了一个令人震惊的真相：思维链的透明度，可能只是一种精心编织的假象！

2025-07-03

LLM

2025-07-03

深圳市九天睿芯科技申请基于存算一体的大语言模型推理装置专利，推动AI技术革新

深圳市九天睿芯申请基于存算一体的大语言模型推理装置专利，解决现存的 LLM 推理装置的散热问题,专利,深圳市,九天睿芯,推理装置,大语言模型,科技有限公司

2025-01-25

LLM

2025-01-25

6月20日昆仑万维发布Skywork-SWE，开源模型成绩亮眼

6月20日昆仑万维发布Skywork-SWE，开源模型成绩亮眼6月20日，昆仑万维发布软件工程（Software Engineering, SWE）自主代码智能体基座模型Skywork-SWE

2025-06-21

LLM

2025-06-21

多LLM摘要框架：生成与评估步骤详解，集中式与分散式策略对比

面向长文本的多模型协作摘要架构：多LLM文本摘要方法,算法,summary

2025-01-26

LLM

2025-01-26

攀升AIPC-开发者主机评测：开启AI开发全能时代，让创新触手可及

科技进步迅猛，人工智能领域备受关注

2025-04-01

LLM

2025-04-01

群核科技SpatialLM技术解析：开启基于LLM的3D结构化建模新范式？

群核科技SpatialLM技术解析：开启基于LLM的3D结构化建模新范式？群核科技SpatialLM技术解析：基于LLM的3D结构化建模新范式近日,空间理解模型SpatialLM发布首份技术报告,该模型来自于空间智能公司群核科技。据悉

2025-06-24

LLM

2025-06-24

联想创投宋春雨：AI开源圆桌论坛热议大模型变革与投资重点

联想创投宋春雨：AI开源圆桌论坛热议大模型变革与投资重点近日，由联想创投被投企业OpenCSG与数码港联合主办的首届“Open Cyberport Community Meetup”在香港圆满落幕。联想集团副总裁

2025-07-08

LLM

2025-07-08

AMD Instinct MI300X GPU集成DeepSeek-V3模型，性能超越GPT-4，实现极致性能突破

AMD集成DeepSeek模型至GPU，DeepSeek V3或已超GPT-4成最强开源LLM？

2025-02-05

LLM

2025-02-05

Django创始人Simon Willison揭秘：如何利用LLM提升编程效率

Django创造者Simon Willison分享：我如何使用LLM帮我写代码,编程,上下文,写代码,javascript

2025-03-19

LLM

2025-03-19

对话智元首席科学家：具身智能不应过度类比大模型，以免造成最大误读

具身智能非短期可突破具身智能是一个结构复杂且技术要求高

2025-04-06

LLM

2025-04-06

Claude团队开源电路追踪工具，读懂大模型思维过程

Claude团队开源电路追踪工具，读懂大模型思维过程Claude团队来搞开源了——推出“电路追踪（circuit tracing）工具，可以帮大伙儿读懂大模型的“脑回路”，追踪其思维过程。

2025-06-03

LLM

2025-06-03

概率统计机制下，LLM推理真理解世界了？这些问题待解

概率统计机制下，LLM推理真理解世界了？这些问题待解概率统计机制下，LLM 推理真的「理解世界了」吗？机器之心Pro优质科技领域创作者06.2209:30机器之心PRO · 会员通讯 Week 25---

2025-06-25

LLM

2025-06-25

1 2 3 4 5 6 下一页尾页

LLMOps即服务：降低运维门槛、提高效率、确保模型稳定性的全面解决方案

大语言模型助力银行数字化转型，可解释性难题待解？

首个商业级扩散大型语言模型Mercury发布，性能卓越，每秒处理超1000 token

Omdia预测：2024年生成式AI市场规模将翻倍，达到146亿美元

腾讯高管解读Q4财报：DeepSeek技术突破，终结LLM更新对GPU数量级增长需求

AMD发布GAIA开源项目：在Ryzen AI NPU上运行本地LLM的突破性技术

KG与LLM完美结合：知识图谱助力大语言模型降低幻觉现象

麦吉尔大学团队新方法LLMSynthor，让大模型成数据模拟器

World Labs：李飞飞创办的AI独角兽公司的发展与对话

来自马里兰大学CASE Lab的研究：Invisible Tokens, Visible Bills

大语言模型与人类价值观对齐挑战：RLHF 与 RLAIF 的探索

多模态对齐模型新趋势：冻结大语言模型降成本，LIFT剖析优势

论文首次验证LLM有经验时性能不降，还能减少资源，咋做到的？

思维链真能暴露LLM内心世界？谎言被揭穿，真相令人

深圳市九天睿芯科技申请基于存算一体的大语言模型推理装置专利，推动AI技术革新

6月20日昆仑万维发布Skywork-SWE，开源模型成绩亮眼

多LLM摘要框架：生成与评估步骤详解，集中式与分散式策略对比

攀升AIPC-开发者主机评测：开启AI开发全能时代，让创新触手可及

群核科技SpatialLM技术解析：开启基于LLM的3D结构化建模新范式？

联想创投宋春雨：AI开源圆桌论坛热议大模型变革与投资重点

AMD Instinct MI300X GPU集成DeepSeek-V3模型，性能超越GPT-4，实现极致性能突破

Django创始人Simon Willison揭秘：如何利用LLM提升编程效率

对话智元首席科学家：具身智能不应过度类比大模型，以免造成最大误读

Claude团队开源电路追踪工具，读懂大模型思维过程

概率统计机制下，LLM推理真理解世界了？这些问题待解

周鸿祎要去重庆荣昌吃卤鹅了，周鸿祎被投喂卤鹅

江苏台报道野猪冲进江苏电视台，被活捉

重磅公布 | 2025年iDigital年度数字营销大赏及iDigital人工智能创新大赏获奖名单

George Clinical更名为Emerald Clinical Trials

新加坡旅游局创新旅游玩法引领五大核心玩家解锁"反正好玩"之旅

大行PC24双项金奖加冕，引领绿色出行新风尚

世界上最大的完美无瑕的Paraiba碧玺在香港邦瀚斯拍卖

MetaOptics推出自动超透镜测试仪，以提升量产分选能力

苏州尼依格罗酒店成功举办尼依格罗艺术与演说：用艺术感知情绪

养乐多分享益生菌与健康长年科研探索之路