• 首页
  • 时政
  • 财经
  • 社会
  • 股票
  • 信用
  • 视频
  • 图片
  • 品牌
  • 发改动态
  • 中宏研究
  • 营商环境
  • 新质生产力
logo 公司
  • 中宏网首页 >
  • 商业管理 >
  • 公司 >
  • 正文

国产AI生态里程碑:云天励飞DeepEdge10率先完成DeepSeek开源周首个项目FlashMLA适配

2025-02-27 15:07:22 来源:河北网络广播电视台
分享到:
用微信扫描二维码

       2月24日,DeepSeek"开源周"正式启动,并发布首个代码库FlashMLA,引发全球关注。

  FlashMLA是针对英伟达Hopper GPU优化的高效MLA解码内核,专为可变长度序列优化设计,是DeepSeek高效使用算力的核心程序模块。FlashMLA通过MLA解码优化与分页KV缓存技术,显著提升硬件利用率,加速大语言模型解码过程,有效提高响应速度与吞吐量,适用于各种实时对话生成场景。

  云天励飞芯片团队在FlashMLA开源后,迅速完成了DeepEdge10平台与FlashMLA的适配工作。在适配过程中,云天励飞采用了Op fusion tiling、Online softmax、Double buffer、细粒度存算并行等先进技术,并基于自研的Triton-like编程语言快速开发验证了高效的FlashMLA算子。通过一系列优化,不仅显著提升了计算效率,还大幅降低了显存占用,充分展现了DeepEdge10平台“算力积木”芯片架构的卓越优势,以及其与DeepSeek生态的高度契合性。

  今日,云天励飞已将相关代码提交至开源平台Gitee,为开源AI贡献了重要的技术力量。

  DeepEdge10系列芯片是专门针对大模型时代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各类不同架构的主流模型;基于自主可控的先进国产工艺打造,采用独特的“算力积木”架构,可灵活满足智慧城市、智慧交通、智能制造、智慧仓储、机器人、边缘智算中心等不同场景对算力的需求,为大模型推理提供强大动力。

  目前,DeepEdge10芯片平台已成功适配DeepSeek R1系列模型及国产鸿蒙操作系统。未来,云天励飞将持续加大研发力度,推动芯片在国产化领域取得更大突破,为国产AI生态建设贡献更多力量。


编辑:徐霞
审核:张强

免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。

  • 微信
  • 微博
  • 手机中宏网

互联网新闻信息服务许可证10120230012 信息网络传播视听节目许可证0121673 增值电信业务经营许可证京B2-20171219 广播电视节目制作经营许可证(京)字第10250号

关于我们 中宏网动态 广告服务 中宏网版权所有 京ICP备2023030128号-1 举报电话:010-63359623

Copyright © 2016-2025 by www.zhonghongwang.com. all rights reserved 运营管理:国家发展和改革委员会宏观经济杂志社