刚刚,DeepSeek发布新模型,API价格下调 50%以上
刚刚,刚刚DeepSeek正式发布实验性模型 DeepSeek-V3.2-Exp。发布DeepSeek称其为“迈向新一代架构的新模型A下调太原市某某软件科技维修网点中间步骤”。 据介绍,价格该模型在V3.1-Terminus的刚刚基础上首次引入 DeepSeek Sparse Attention(一种稀疏注意力机制),探索长文本场景下训练与推理效率的发布优化。 官方表示,新模型A下调V3.2-Exp在公开评测集上的价格表现与V3.1-Terminus基本持平,但在成本和效率上实现突破。刚刚 受益于新机制,发布太原市某某软件科技维修网点DeepSeek将API调用价格下调50%以上,新模型A下调新价格已即时生效。价格 V3.2-Exp已同步更新至DeepSeek官方App、刚刚网页端与小程序,发布并在HuggingFace和魔搭平台开源,新模型A下调相关论文也已公开。与此同时,DeepSeek开放了包括 TileLang与CUDA版本的GPU算子,以支持社区研究和快速迭代。 作为实验性版本,DeepSeek仍邀请用户在实际场景中进行更大规模的测试。为便于对比,公司临时保留了V3.1-Terminus的API接口,该通道将开放至2025年10月15日。(袁宁) 本文来自网易科技报道,更多资讯和深度内容,关注我们。延伸阅读
- 最近发表
- 随机阅读
-
- 特朗普:美国或更换世界杯举办地
- 新能源车表现分化:小米港股跌超8%,小鹏涨超5%
- 国防部回应中国是否在建第四艘航母
- 泽连斯基:乌克兰决定开放武器出口
- 弹!弹!弹!福建舰三型舰载机更多弹射画面公开!
- 今晚7点,不见不散!
- 外卖“新国标”来了!从“快”字当头变安全优先
- 江苏省2026年硕士研究生报考点设置
- 国家海洋预报台9月23日08时发布海浪红色警报
- 特朗普为埃尔多安拉椅子还夸他
- 一入秋就拉肚子?当心是“秋季腹泻”在捣蛋
- 不运动不挨饿也能瘦?万益蓝“餐前控控片”遭多人投诉“虚假宣传”
- 郑钦文回应中网退赛:决定参赛可能有些操之过急
- 南京新初一开学,最大的感触是:累!?
- “极不寻常”!美防长下令:要数百名将领紧急集结
- 泽连斯基:乌克兰决定开放武器出口
- 市学生艺术团!晋元高级中学舞蹈团2025年招新,面向4
- 育英中学体罚事件:家长要求开除老师,来看教师法是怎么规定的
- 弹!弹!弹!福建舰三型舰载机更多弹射画面公开!
- 高通第五代骁龙8至尊版:3nm制程全面升级,终端侧AI是亮点
- 搜索
-