- [20260224] 资料结构整改,更新Roadmap(2026Q1)
- 支持保存加载。
- 支持基础属性查询设置功能。
- 支持KV查询功能。
- 支持KV插值功能。
- 支持建表功能。
- 功能适配封装。
- 例行镜像、配套表更新。
- 例行镜像、配套表更新。
- 支持在算力切分设备上推理。
- 查表反向算子重构。
- HSTU:
- 算子重构。
- 反向性能优化。
- 支持int32。
- 保存和加载功能增强:
- 支持n卡保存,m卡加载。
- 支持增量保存、加载。
- norm_mul融合算子。
- ln_linear_silu融合算子。
- concat_2d_jagged算子。
- Row-wise稀疏表:
- 支持建表。
- 支持查表。
- 支持特征淘汰。
- 支持更新。
- 反向更新融合优化器。
- 支持全量保存和加载
- 支持梯度规约。
- 适配TorchRec EmbeddingShardingPlanner。
- 适配TorchRec EmbeddingCollectionSharder。
Rec SDK作为面向互联网市场搜索推荐广告的应用使能SDK产品,对于搜索推荐广告模型训练的应用场景需求,提供基于昇腾平台的搜索推荐广告框架,支撑大规模搜推广场景,助力完成搜推广模型的高效训练。Rec SDK的功能涉及:
- 模型训练基础功能。支持单机单卡训练、多机多卡分布式训练。
- 推荐场景特有功能。基于Rec SDK的稀疏表方案,Rec SDK提供必备功能,如特征保存和加载、特征准入、特征淘汰等。
- 大规模稀疏表特有功能。支持加速卡内存、主机内存、主机磁盘多级存储、支持多机存储、支持动态扩容。规模可超10TB。
mxrec/ # 项目根目录
|-- build/ # 构建脚本、生成的wheel包等
|
|-- cust_op/
| |-- ascendc_op # Ascend C编写,编译后在AI Core执行的算子和其编译脚本
| |-- framework # 算子适配层
| |-- hkv # hkv子模块代码,项目代码来自https://gitcode.com/Ascend/HierarchicalKV-ascend.git
| |-- test # 算子测试用例
| |-- tf_cpu_op # CPU算子
|
|-- docs/ # 项目镜像构建脚本、公网和邮箱地址及通信矩阵文档
|
|-- training
|-- common # 公共组件
|-- tf_rec_v1 # 基于TensorFlow,适配NPU设备的非全下沉稀疏推荐框架
|-- tf_rec_v2 # 基于TensorFlow,适配NPU设备的全下沉稀疏推荐框架(POC状态)
|-- torch_rec_v1 # 基于PyTorch、torchrec开源软件,适配NPU设备的非全下沉稀疏推荐框架
|-- hybrid_torchrec # 适配NPU纯显存模式(Device Memory)的推荐训练框架
|-- torchrec_embcache # 适配NPU多级缓存模式(Device Memory + Host DDR)的推荐训练框架
|-- torchrec_npu # 基于torchrec开源组件的NPU适配pacth
|-- torch_rec_v2 # 基于PyTorch、torchrec开源软件,适配NPU设备的全下沉稀疏推荐框架(POC状态)
通常,RecSDK一年会有4个正式release版本。
具体版本更新内容,参见:
支持的产品型号如下:
- Atlas 200T A2 Box16
- Atlas 800T A2 训练服务器
- Atlas 900 A3 SuperPoD 超节点
具体组件部署方式,参见:
参见具体组件:
参见具体组件:
参见具体组件:
参见具体组件:
贡献代码前,请先签署开放项目贡献者许可协议(CLA)。
- 如果您遇到bug,请提交issue。
- 如果您计划贡献bug-fixes,请提交Pull Requests,参见具体要求。
- 如果您计划贡献新特性、功能,请先创建issue与我们讨论。写明需求背景/目的,如何设计,对现有API等的影响。未经讨论提交PR可能会导致请求被拒绝,因为项目演进方向可能与您的想法存在偏差。
更详细的交流、贡献方式,请参考贡献指南。
用户应根据自身业务,重新审视整个系统的网络安全加固措施,必要时可参考业界优秀加固方案和安全专家的建议。
具体安全加固措施,参见具体组件:
本代码仓库中包含多个开发分支,这些分支可能包含未完成、实验性或未测试的功能。在正式发布之前,这些分支不应被用于任何生产环境或依赖关键业务的项目中。请务必仅使用我们的正式发行版本,以确保代码的稳定性和安全性。 使用开发分支所导致的任何问题、损失或数据损坏,本项目及其贡献者概不负责。 正式版本请参考Rec SDK正式release版本。
Apache License Version 2.0,详见LICENSE文件。 Rec SDK docs目录下的文档适用CC-BY 4.0许可证,具体请参见LICENSE文件。
Rec SDK由华为公司的下列部门联合贡献:
- 昇腾计算应用使能开发部
- 计算软件平台部
- 灵衢算力集群开发部
- 计算技术开发部
- 泊松实验室
感谢来自社区的每一个PR,欢迎贡献Rec SDK!