DeepSeek暂停API服务充值,服务器资源紧张影响开发者体验
今日,暂停了API服务充值。官方对此声明称,“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停API服务充值。存量充值金额可继续调用,敬请谅解!”
官方价目表显示,-chat型优惠期至北京时间2025年2月8日24:00,优惠结束后将按每百万输入 2元,每百万输出 8元计费-模型上线即按每百万输入 4元,每百万输出 16元计费。
多名开发者表示,今日平台一直提示服务器繁忙,通过硅基流动、国家超算互联网平台等使用模型服务,也较为卡顿。
“早上新开到窗口,V3还没聊8句,又白屏没记录了”“希望官方尽快扩充服务器吧”……开发者纷纷表示。
原生鸿蒙版小艺App在昨日接入-R1 Beta版,上线后访问量也非常大。华为终端BG CTO李小龙称,“没想到一上线就迎来非常大的访问量,我们正在扩容。”
此前,曾因访问量剧增而多次出现了宕机现象。有业内分析指出,既要应对近期涌入的大批用户,又要继续提升模型性能,亟需扩充算力基础设施,以满足更多用户的访问需求。
目前,华为云、腾讯云、阿里云、百度云等厂商均陆续在其云服务平台上线了的大模型,昇腾、沐曦、海光信息、摩尔线程、天数智芯等AI芯片厂商也均适配,对于国内算力产业链的拉动效应已经显现。
今日,又有多家算力产业链企业宣布与模型完成适配。
其中,中国电信天翼云其自主研发的“息壤”一体化智算平台完成国产算力与-R1/V3系列大模型的深度适配优化,成为国内首家实现模型全栈国产化推理服务落地的运营商级云平台。据悉,天翼云“息壤”一体化智算平台还同步推出-R1/V3系列模型的限时免费推理API服务,开发者无需关注底层架构即可调用。
国产GPU厂商燧原科技在多地智算中心完成全量推理服务部署,包括在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。
科创板上市公司优刻得基于壁仞科技芯片开展了包括R1在内的全系列模型适配工作,支持全球开发者云端体验全系列模型服务。除了基础算力资源支持,优刻得还提供模型的私有化部署服务,用户可将模型部署在本地服务器上。
国盛证券指出,的阶段性胜利,将继续推动算力市场的整体需求。对GPU的影响是积极的,算力长期来看依旧将继续指数级增长。而强化学习对推理的积极影响,可能会加速大模型团队及云厂商对于推理以及自研算力的需求和进展,最终市场取决于单位算力成本的比较。另一方面,对边缘侧的拉动也显而易见。云端先进模型的价格降低,使得AI应用、AI硬件的使用和开发运营成本降低,这将促进AI硬件的放量。