Closed MarioLulab closed 11 months ago
黄子豪
将相关 API 迁移升级至 pir,并更新单测, 共24个
bmm / broadcast_tensors / histogram
lstsq / lu / lu_unpack
matrix_rank / mv / matrix_power / qr / multi_dot
is_empty / isfinite / isinf
PairwiseDistance / take_along_axis
unique_consecutive / moveaxis
roi_align / roi_pool
pinv / svd
diff / conj
pr链接
田川
相关pr:
卢畅
当下没有工具能够直接给出自动并行模式下各个GPU设备上不同Job的运行区间,因此我们需要设计一个可视化工具来实现这个功能。
本周的主要工作依然和可视化工具有关,主要工作内容如下:
1. 将可视化工具起始条件和nvprof解耦 2. 更改 CalculateStreamTimer 中获取计算流的逻辑 3. 支持多机训练下的可视化 4. 支持新IR下的可视化工具的使用 5. 适配Llama2
相关PR:
1. 算子注册到phi: c_gen_nccl_id、c_comm_init、c_comm_init_all、c_comm_init_multitrainer 2. 论文学习: 1)Efficient large-scale language model training on gpu clusters using megatron-lm 2)Megatron-LM- Training Multi-Billion Parameter Language Models Using Model Parallelism 3)Zero: memory optimizations toward training trillion parameter models 4)Reducing Activation Recomputation in Large Transformer Models 3. 可视化工具的使用文档完善
王龙志
相关 PR:
陆琦
维护第三期的 PIR 迁移的任务,为开发者提供答疑和 pr review,review 19 个 PR
完成 3 个 PIR 迁移的 PR,推进 1 个 PIR 迁移的 PR 相关 PR :
完善 PIR API 相关机制
支持动静半架构升级工作
詹荣瑞
相关PR:
吴晨灿
相关PR:
程延福
相关PR:
何咏哲
在单卡建模的基础上,进一步对Llama显存模型考虑以下并行模式
将上述并行模式参数化,最终得到一个完整的显存计算公式
朱新明
张钰钦
徐苏勇
张玉涛
assgin_value
、fill_any_like
和fill_constant
这三个基础算子的复数支持工作kernel_type:phi
中算子的复数支持工作冉崇治
杨国浩
修复动转静测试
撰写算子修复任务的社区发布的相关内容并进行讨论
宋铠玉
修复三个工作动转静问题,完成三个大模型backbone基于paddle vit架构前向对齐
待与导师对齐后
SecretXV
杨新宇
学习使用模型推理实测自动混精pass,初版自动混精pass在resnet网络上调试成功
在更为复杂的模型上进行测试 目前在比较复杂的模型上混精pass会运行失败,主要是由于built-in op的处理方式考虑不周到,正在进行调试
侯悦欣
孙逸伦
刘宇博
api_mapping.json
。
[WeeklyReports] 2023.11.08~2023.11.21 周报汇总
请各位学员在本 issue 下以 comment 的形式填写周报摘要,ddl 本周四晚,格式示例如下:
完成情况:
项目一:算子规范和 ProgramTranslator 功能优化
项目二:新 IR Pass 建设和依赖的核心组件完善
项目三:新 IR API + 自动微分推全和核心组件完善
项目四:组合机制前反向架构统一
项目五:算子支持复数计算专项
项目六:量化算子集成
项目七:开源模型加速复现
项目八:CPU 融合算子 / GPU 算子融合 pass
项目九:动态图半自动并行架构研发
项目十:静态图半自动并行执行架构升级
项目十一:分布式能力矩阵建设
项目十二:全自动并行架构升级
项目十三:科学计算领域拓展专项
项目十四:Clas 套件全流程建设
项目十六:Nougat 复现及优化
项目十七:NLP 大模型复现
[ ] @rampage0303(@w5688414)项目十八:套件压缩能力建设
项目十九:PIR 适配 AI 编译器 CINN
项目二十:PIR 子图验证+核心机制完善
项目二十一:PIR 核心组件建设与机制完善
项目二十二:PIR 动转静组件建设与单测验证推全
项目二十三:模型迁移工具建设