河北股票配资 北京计划三年内推动万台具身机器人量产落地|科技周报

河北股票配资 北京计划三年内推动万台具身机器人量产落地|科技周报

2025年2月23日 ~ 2025年3月1日  河北股票配资

# DeepSeek自爆惊人的成本利润率

DeepSeek推理模型的理论成本利润率:545%

3月1日,DeepSeek在社交平台上披露,按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元,成本利润率545%。

在官方的帖文中,DeepSeek还解释了DeepSeek-V3/R1模型是如何实现更大的吞吐量和更低的延迟。

具体来说,DeepSeek-V3/R1模型采用MoE(混合专家)架构,每层有256个专家,但每个token仅激活其中8个。MoE架构是将一个复杂的学习任务分解为多个相对简单的子任务,每个子任务由一个专门的“专家”模型来处理。

DeepSeek-V3/R1模型具有这种高稀疏性结构,使得大规模跨节点专家并行(Expert Parallelism,EP)至为重要。首先EP大大增加了batch size(一次模型训练中使用的样本数量),从而提高GPU矩阵乘法的效率,提高吞吐。其次EP使得专家分散在不同的GPU上,每个GPU只需要计算很少的专家(因此更少的访存需求),从而降低延迟。

 

DeepSeek“开源周”收官

以下是DeepSeek本周发布的5款开源代码库:

2月24日:开源FlashMLA,针对英伟达Hopper架构GPU优化的高效MLA(多头潜在注意力)解码内核,针对可变长度序列作了优化,能提升大模型推理效率。

2月25日:开源DeepEP,这是第一个用于MoE模型训练和推理的开源EP通信库。DeepEP能提供高吞吐量,实现低延迟,还支持低精度计算以节省算力。

2月26日:开源DeepGEMM,这是一个支持密集(Dense)和混合专家(MoE)架构通用矩阵乘法(GEMM,General Matrix Multiplication)的 FP8 GEMM 库,为DeepSeek  V3/R1 的训练和推理提供支持,在英伟达Hopper架构GPU上最高可达1350+FP8 TFLOPS。

2月27日:开源DualPipe(双向管道并行算法,优化V3/R1训练中的计算-通信重叠)、EPLB(专家并行负载平衡器,提高计算资源分配效率)及计算-通信重叠分析工具,帮助优化训练性能。

2月28日:开源3FS(Fire - Flyer File System)系统,这是一款高性能的分布式文件系统,可利用SSD和RDMA(远程直接内存访问)网络的全部带宽,加速数据访问操作,解决AI训练和推理工作负载带来的挑战。

# OpenAI和Anthropic竞技

Anthropic发布首个混合推理模型

2月25日,OpenAI“劲敌”Anthropic最新发布一款名为Claude 3.7 Sonnet的新模型。Anthropic表示,Claude 3.7 Sonnet是其最智能的AI模型,也是首个混合推理模型,同时具备深度推理(扩展思维模式,一步一步思考复杂答案)与快速回复(标准模式,实时生成答案)的能力。

 

OpenAI发布GPT-4.5:“情商”更高、价格更贵

2月27日, OpenAI发布最新大模型GPT-4.5。GPT-4.5模型并非推理模型,而是基于“无监督学习”的技术开发,通过海量数据训练,快速回答问题。OpenAI表示,GPT-4.5具备更强的识别能力、更高的“情商”以及更低的幻觉率。但是,GPT-4.5的API定价也更高,输入token的价格是GPT-4o的30倍,输出token的价格则是15倍。

# 地方政府逐鹿具身智能

深圳:将发布人形机器人专项政策

2月23日,深圳市人工智能产业办主任林毅表示,近期将发布人形机器人专项政策,通过“揭榜挂帅”等方式,对开放应用场景、突破关键技术、构建专用数据集提升规模化制造和应用能力等予以精准支持。同时,还将在全市科技重大专项中安排人工智能和机器人专项,鼓励产、学、研、用组成创新联合体进行协同攻关。

 

北京:三年内推动万台具身机器人量产落地

2月28日,《北京具身智能科技创新与产业培育行动计划(2025-2027年)》正式发布。《行动计划》指出,到2027年,在产业规模方面,北京将培育产业链上下游核心企业不少于50家,形成量产产品不少于50款,在科研教育、工业商业、个性化服务三大场景实现不少于100项规模化应用,量产总规模率先突破万台,培育千亿级产业集群,并将建设不少于两个具身智能特色产业集聚区,打造具身智能领域产教融合基地,营造具有国际影响力的具身智能产业生态。

# AI训练与无声抗议

千位音乐家发“无声专辑”抗议英国AI版权制度修改

路透社报道,2月25日,1000多名音乐家发布了一张无声专辑,以抗议英国版权法的拟议修改,该修改可能允许科技公司使用他们的作品来训练AI大模型。

整理:南都记者 杨柳河北股票配资