Cambricon / mlu-ops

Efficient operation implementation based on the Cambricon Machine Learning Unit (MLU) .
MIT License
103 stars 102 forks source link

【新算子】- fft2d 算子开发 #1003

Open PetrelYy opened 6 months ago

PetrelYy commented 6 months ago

开发计划可参考以下节点:

  1. 方案撰写,xx.xx~xx.xx
  2. 开发自测,xx.xx~xx.xx
  3. 提出 PR/MR,xx.xx~xx.xx
  4. review( 3个赞),xx.xx~xx.xx
  5. maintainer 合入
squidruge commented 5 months ago

方案pr链接:https://github.com/Cambricon/mlu-ops/pull/1025

squidruge commented 5 months ago

FFT2D当前性能如图 image

squidruge commented 5 months ago

fft2d c2c 当前预定开发计划:

  1. 方案撰写,5.27~5.31
  2. 开发自测,6.1~6.28
  3. 提出 PR/MR,6.28~6.30
  4. review( 3个赞),7.1~7.10
  5. maintainer 合入
squidruge commented 5 months ago

ff2d.md 当前fft2d c2c方案如附件所示

squidruge commented 4 months ago

当前性能:

image
PetrelYy commented 4 months ago

@squidruge 还请更新进展(文档,代码完成度以及PR)及后续计划

squidruge commented 4 months ago

c2c 2d部分文档已完成,代码部分针对重点规模已完成,面向其他规模还需完善以下部分: 1)完善factor,支持64以下基的分解,预计6.19之前完成 2)恢复大质数基部分的代码,预计6.24之前完成 3)实现half版本,预计6.28之前完成

pr:https://github.com/Cambricon/mlu-ops/pull/1045#issue-2330261459

squidruge commented 4 months ago

batch =768, stride = 768 c2c 2d性能如下: image