PandaPRO主题 PandaPRO主题
  • 首页
  • 行情
    • 币种
    • 平台
  • 文章
    • 区块链
    • web3
    • NFT
    • 元宇宙
  • 快讯
  • 专题
  • 问答
  • 百科
首页 › 快讯 › DeepSeek发布DeepGEMM:高效FP8 GEMM库,优化V3/R1训练与推理性能

DeepSeek发布DeepGEMM:高效FP8 GEMM库,优化V3/R1训练与推理性能

2025-02-26 09:39:22

本站 2月26日消息,DeepSeek在其开源周(OpenSourceWeek)第三天推出 DeepGEMM,一个支持 FP8 GEMM 的CUDA库,可用于稠密矩阵计算和混合专家(MoE)架构,优化V3/R1模型的训练和推理。

DeepGEMM 关键特性:

• 超高性能:在Hopper GPU上实现 1350+ FP8 TFLOPS

• 极简依赖:无繁重依赖,代码简洁如教程

• JIT即时编译:无需预编译,运行时自动优化

• 核心代码仅约300行,但在大多数矩阵尺寸下性能超越专家级优化内核

• 支持稠密布局和两种MoE布局

Robinhood宣布进军房地产交易市场,拓展金融服务版图
上一篇
BTC暴跌至86K美元,某地址118.18 WBTC遭清算
下一篇

推荐标签

Facebook
  • Copyright © 2023 币视界. 京ICP备11000001号
免责声明:本网站提供的所有内容均来自第三方平台和用户,对于网站内容不进行任何保证。所提供的区块链数据和其他资料仅供用户学习和研究使用,不构成投资或法律建议。用户和其他平台发布的内容由个人负责,与本网站无关。使用本网站信息需谨慎,自行承担风险。建议您对内容进行研究、审查和验证。
小伙伴们: 币视界 血液透析管理系统 bitget
  • 首页
  • 行情
    • 币种
    • 平台
  • 文章
    • 区块链
    • web3
    • NFT
    • 元宇宙
  • 快讯
  • 专题
  • 问答
  • 百科