Closed AndSonder closed 3 months ago
Github ID: DUCH714
阅读 DrivAerNet
阅读 Transolver
探索讨论将DrivAerNet和Transolver应用到GINO上的可能性
尝试GINO降维以及提高GINO精度
梁书豪
None
时的错误 PR:https://github.com/PaddlePaddle/Paddle/pull/62612TileFirstGeneralTactic
在处理reduce算子时访存不连续的问题TileFirstGeneralTactic
中实现global memory coalescing策略Github ID: NKNaN
赵加孟
田川
卢林军
reduce_as
op并修复其BUGtest_sub_graph_78
中,开启with_prim=True
会导致单测报错的BUGreduce_as
完成complex64/128
和int8
的支持reduce_as
的中文文档卢畅
静态图半自动并行训练性能优化
本周工作主要是编写 ZBV 编排所需要用到的显存估计功能
在 Llama2 模型上与实际跑模型时候的显存进行对比,目前发现和实际显存还有一定的差距,需要进一步定位问题。
相关 PR:
目前 1F1B 场景下显存估计和实际显存基本一致,但是 Backward 阶段的峰值显存估计和实际峰值显存还是有一定的差距。这个问题还在排查中。估计 backward program 的峰值显存与实际运行时候的峰值显存差了 10% 左右。
进一步排查 Backward 阶段峰值显存估计差距的原因,尽快解决这个问题。在显存估计功能完成后,开始着手编写 ZBV 的编排功能。
马欣楷
黄济懿
本周请假
待安排
凌少鹏
Github ID: yulangz
CINN子图鲁棒性和性能优化
CINN 故障修复
杨昌辉
xingmingyyj
PIR 算子补全与兼容机制建设
蔡越
优化AnimateAnyone训练权重保存逻辑以及混合精度控制机制;
同步更新AI studio项目,并解决paddle升级带来的算子行为改变问题
徐苏勇
YibinLiu666
高阶微分的性能分析和优化
李帅
Github ID: lishuai-97
(上次周报跟这次周报在同一个PR)
周波涛
算子支持复数计算专项
马贺达
叶柯
PaddleMIX 套件能力建设(图文方向)
本周主要工作如下:
将 internlm-xcomposer2 集成到 PaddleMIX 中,解耦原组网中的 tokenize 部分和 embed 部分,将 tokenize 部分封装成 collator 和 processor,支持 auto 导入。
上报一个Paddle的Dataloader相关的BUG(待确认)
详细周报链接:
何咏哲
张千芊
陈景琦
安装和配置Paddle CINN的开发环境,build代码
熟悉Paddle CINN部分的codebase,了解CINN整个项目结构和各部分代码
跑test_cinn_reduce_symbolic_demo单测,熟悉后续开发流程
尹帆
刘卓鑫
配置PaddlePaddle和PaddleSpeech开发环境
跑PaddleSpeech/Demos
王晋恒
张玉涛
算子支持复数计算专项
詹荣瑞
PIR Python API 升级及机制建设
相关 PR:
相关 ISSUE:
继续推进 PIR test_errors 相关单测适配和 PIR Python API适配升级(第三期)。
相关 PR:
完成 PaddleSOT 的动态 shape 支持
相关 PR:
姓名
xxx
本周工作
下周工作
详细周报链接:
项目一:PIR 算子补全与兼容机制建设
项目二:PIR 控制流专项
项目三:PIR Python API 升级及机制建设
项目四:动转静 SOT 模块 Python 3.12 支持
项目五:算子支持复数计算专项
项目六:模型迁移工具建设
项目七:框架 API 易用性提升
项目八:组合机制算子专项和机制建设
项目九:高阶微分的性能分析和优化
项目十:静态图半自动并行训练性能优化
项目十一:全自动并行架构升级
项目十二:科学计算领域拓展专项(DeePMD-kit、光学案例)
项目十三:科学计算领域拓展专项(超分重构方向)
项目十四:科学计算领域拓展专项(领域流体方向)
项目十五:科学计算领域拓展专项(领域气象方向)
项目十六:CINN 支持动态 Shape 专项(前端方向)
项目十八:CINN 静态 shape 下鲁棒性和性能优化
项目十九:CINN 支持动态 Shape 专项(后端规则升级)
项目二十:CINN 支持动态 Shape 专项 (后端模型扩量)
项目二十一:Paddle CMake 治理和编译优化
项目二十二:PaddleMIX 套件能力建设(文图方向)
项目二十三:PaddleMIX 套件能力建设(图文方向)
项目二十四:大模型训练稳定性和高效低价小模型快速收敛
项目二十六:推理 Pass & 融合算子优化
项目二十七:PaddleSpeech 套件能力建设