doombeaker commented 3 years ago

背景

本 issue 主贴（此贴）记录分工和对应的 PR，方便跟进。

解决的时间节点

Hard难度的应该在0.7.0版本之前解决，Medium应该在0.6.0版本之前完全解决，Easy难度的应该在分配当周或者下周进行解决。

负责人

@BBuf

任务分工表

[x] ~~flow.sum()仅支持dim指定维度，而torch支持dim或axis。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1089842163~~
[x] ~~oneflow._oneflow_internal.Tensor 类型不可以自动转化为Numpy类型来源：陈巧玲 OCR https://github.com/Oneflow-Inc/OneCloud/issues/69#issuecomment-1074628723~~
[x] ~~Dataloader pin_memory没有对齐的问题。需要露阳解决。优先级低。相关issue：https://github.com/Oneflow-Inc/OneTeam/issues/1180 。~~
[x] ~~将argsort的Python层逻辑迁移到Functor。来源性能需求。认领人：王世杰。 Medium。~~
[x] ~~将argwhere的Python层逻辑迁移到Functor。来源性能需求。认领人：王世杰。 Medium。~~
[x] ~~将to_local_op的Python层逻辑迁移到Functor。来源性能需求。Easy。~~
[x] ~~将empty的Python层逻辑迁移到Functor。来源性能需求。 Medium。~~
[x] flow.cuda.empty_cache 接口没对齐。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/87#issuecomment-1102115749 。来自丰伟：allocator需要通过vm从stream中获取。当前支持的条件不成熟，且功能较为薄弱。
[x] TypeError: conv2d(): missing required argument channel_pos 。来源：迟子秋。认领人：张晓雨。优先级：中。https://github.com/Oneflow-Inc/oneflow/pull/7892
[x] 支持bool Tensor的~方法。来源：中兴用户。认领人：王世杰。优先级：高。https://github.com/Oneflow-Inc/oneflow/pull/7899
[x] 新增了SoftShrink算子。开发者：王义。https://github.com/Oneflow-Inc/oneflow/pull/7826
[x] 中兴用户跑一个模型出现错误。来源：错误。认领人：张晓雨。最终定位到var op不支持dim为负数的bug，已解决：https://github.com/Oneflow-Inc/oneflow/pull/7863
[x] as_tensor 算子不支持。来源：中兴。难度：Medium 优先级高。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7855
[x] flow.randn 在 cuda:1 上直接创建tensor出错以及api没有对齐 pytorch。来源：https://github.com/Oneflow-Inc/OneTeam/issues/1213 。难度：Medium 优先级中。 https://github.com/Oneflow-Inc/oneflow/pull/7896 https://github.com/Oneflow-Inc/oneflow/pull/7914
[x] SoftPlus没有和PyTorch的接口对齐。来源：https://github.com/Oneflow-Inc/oneflow/issues/7817 。难度：Easy 。优先级中。认领人：李响。PR：https://github.com/Oneflow-Inc/oneflow/pull/7888
[x] F.pad 函数报错提示无效。来源：钟珊珊 AI-Writer。https://github.com/Oneflow-Inc/OneCloud/issues/67#issuecomment-1063799216 。Medium 优先级中。认领人：王义。https://github.com/Oneflow-Inc/oneflow/pull/7918
[x] tensor 类型不可以直接使用 numpy 作为索引。来源：钟珊珊 AI-Writer。https://github.com/Oneflow-Inc/OneCloud/issues/67#issuecomment-1065098590 Medium 优先级中。认领人：王迎港。https://github.com/Oneflow-Inc/oneflow/pull/7935
[x] 缺flow.cuda.manual_seed_all(seed) 接口。来源：钟珊珊 AI-Writer。https://github.com/Oneflow-Inc/OneCloud/issues/67#issuecomment-1066291996 Hard 优先级中。认领人：韩彬彬。https://github.com/Oneflow-Inc/oneflow/pull/7957
[x] 缺nn.init.orthogonal_ 初始化方法接口。来源：钟珊珊 AI-Writer。https://github.com/Oneflow-Inc/OneCloud/issues/67#issuecomment-1066291996 Hard 优先级中。认领人：钟珊珊。参考链接：https://github.com/apache/incubator-mxnet/blob/5f0efbbe33a1ef2af140e91a8fd367cd3bf92373/python/mxnet/initializer.py#L547 。https://github.com/Oneflow-Inc/oneflow/pull/8009
[x] 缺flow.cuda.current_device() 接口。来源：钟珊珊 AI-Writer。https://github.com/Oneflow-Inc/OneCloud/issues/67#issuecomment-1066340504 Medium 优先级中。认领人：刘丰伟。https://github.com/Oneflow-Inc/oneflow/pull/7856
[x] set_grad_enabled 接口没有和PyTorch对齐。来源：钟珊珊 AI-Writer。https://github.com/Oneflow-Inc/OneCloud/issues/67#issuecomment-1066478232 Easy 优先级中。认领人：王迎港：https://github.com/Oneflow-Inc/oneflow/pull/8016
[x] .to(device) 不支持int传参。优先级高。来源：钟珊珊 AI-Writer。https://github.com/Oneflow-Inc/OneCloud/issues/67#issuecomment-1066495109 Easy 优先级中。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7853
[x] 缺 flow.isnan()接口来源：陈巧玲 OCR https://github.com/Oneflow-Inc/OneCloud/issues/69#issuecomment-1074673614 。认领人：刘丰伟。https://github.com/Oneflow-Inc/oneflow/pull/7943
[x] 缺 flow.isinf()接口来源：陈巧玲 OCR https://github.com/Oneflow-Inc/OneCloud/issues/69#issuecomment-1074673614 认领人：刘丰伟。https://github.com/Oneflow-Inc/oneflow/pull/7943
[x] Tensor.unfold 后向错误，来源：https://github.com/Oneflow-Inc/OneTeam/issues/1230 。难度：Medium 优先级中。认领人：韩彬彬。 https://github.com/Oneflow-Inc/oneflow/pull/7883
[x] reduce sum不支持scalar tensor，来源: https://github.com/Oneflow-Inc/OneTeam/issues/1229 。难度：Medium 优先级中。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7866
[x] bicubic 模式下，Upsample后向计算结果与pytorch不一样，来源：https://github.com/Oneflow-Inc/oneflow/pull/7884#discussion_r833157622 难度：Medium 优先级中。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7884
[x] 缺 torch.manual_seed()接口，来源：袁梓洋。 https://github.com/Oneflow-Inc/OneTeam/issues/1227#issuecomment-1077460367 。认领人：韩彬彬。https://github.com/Oneflow-Inc/oneflow/pull/7957
[x] Deconv系列的Op对应的nn.functional接口没有对齐PyTorch。来源：迟子秋。难度：Medium 优先级中。认领人：钟珊珊。https://github.com/Oneflow-Inc/oneflow/pull/7991
[x] oneflow.cat和torch.cat行为不一致问题。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1076005569 优先级中。认领人：赵露阳。https://github.com/Oneflow-Inc/oneflow/pull/7921
[x] oneflow.expand和torch.expand行为不一致问题。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1076018011 。优先级中。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7913
[x] oneflow.rand()的参数传入oneflow.Size报错。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1077432622 。优先级中。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7914
[x] linalg.vector_norm在ord=0时返回了一个非Scalar Tensor，是一个没有对齐的BUG。来源：对齐swin-transformer过程中。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/8007
[x] flow.save接口在global_dst_rank=True时的报错信息需要改进，减少用户迷惑。来源：中兴用户对齐mae过程中的误用。优先级中。认领人：刘丰伟。 https://github.com/Oneflow-Inc/oneflow/pull/7964
[x] flow.randn传一个tuple会bug。来源：zzk反馈。优先级：中。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7914 。https://github.com/Oneflow-Inc/oneflow/pull/7914
[x] flow.scatter函数的dim参数不能取-1。来源：江皓哲。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1080314966 。认领人：刘沛宏。https://github.com/Oneflow-Inc/oneflow/pull/7934
[x] BatchNorm的num_batches_tracked参数未对齐。来源：钟珊珊。https://github.com/Oneflow-Inc/oneflow-documentation/issues/457 。优先级：高。 认领人：张晓雨。 https://github.com/Oneflow-Inc/oneflow/pull/7920
[x] oneflow._oneflow_internal.Tensor 类型不可以强制转成 float。来源：钟珊珊。https://github.com/Oneflow-Inc/OneCloud/issues/67#issuecomment-1065098590 认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7927
[x] 缺 flow.Tensor.new_zeros() 接口。来源：江皓哲。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1081558212 。认领人：赵露阳。https://github.com/Oneflow-Inc/oneflow/pull/7937
[x] flow.prod()缺少dtype参数。来源：江皓哲。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1081783018 。认领人：王世杰。https://github.com/Oneflow-Inc/oneflow/pull/7932
[x] oneflow.meshgrid 与 torch.meshgrid 输入参数情况未全部对齐。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/71#issuecomment-1082709073 。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7933
[x] oneflow 索引行为与torch未对齐。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1084042280 认领人：刘沛宏。https://github.com/Oneflow-Inc/oneflow/pull/7977
[x] None in [x,y,z]判断，oneflow与torch行为不一致。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1084155786 。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7938
[x] 为squeeze 实现inplace版本op squeeze_。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/71#issuecomment-1083999136 。认领人：赵露阳。https://github.com/Oneflow-Inc/oneflow/pull/7962
[x] Tensor缺少half方法。来源：林松。认领人：钟珊珊。https://github.com/Oneflow-Inc/oneflow/pull/7971
[x] 缺少flow.Tensor.new_tensor()接口。来源：江皓哲。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1088498063 。认领人：刘丰伟。https://github.com/Oneflow-Inc/oneflow/pull/7973
[x] nn.functional.one_hot与torch行为不一致。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1089824855 。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7975
[x] gather算子没有做越界的错误检查。来源：debug过程中发现。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7979
[x] cpu setitem触发了blob内存申请错误。来源：张晓雨。认领人：王迎港。oneflow-inc/oneflow#7963
[x] oneflow不支持算子flow.amax。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1089877451 认领人：夏慈杰。https://github.com/Oneflow-Inc/oneflow/pull/7996
[x] oneflow不支持算子flow.amin。来源：迟子秋。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1089877451 认领人：钟珊珊。https://github.com/Oneflow-Inc/oneflow/pull/8042
[x] numpy array 和oneflow tensor 之间的转换和torch没对齐。来源：迟子秋。 https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1089923376. https://github.com/Oneflow-Inc/oneflow/pull/7970
[x] oneflow min/max op 无法在不同数据类型间执行。来源：迟子秋。https://github.com/Oneflow-Inc/libai/pull/260#issuecomment-1098792219 。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/8021
[x] PariticalFC 在Eager Global下反向挂掉。来源：https://github.com/Oneflow-Inc/OneTeam/issues/1321 。认领人：王迎港。https://github.com/Oneflow-Inc/oneflow/pull/8041 。
[x] oneflow.nn.functional.leaky_relu 的 inplace 操作未对齐。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/87#issuecomment-1102104571 。认领人：刘丰伟。 https://github.com/Oneflow-Inc/oneflow/pull/8060
[x] flow.tensor 缺少 byte 接口。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/87#issuecomment-1102128737 。认领人：钟珊珊。 https://github.com/Oneflow-Inc/oneflow/pull/8053
[x] flow.nn 下model 无法转半精度模型。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/87#issuecomment-1102133340 。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/8059
[x] einsum。梁德澎认领。Hard。https://github.com/Oneflow-Inc/oneflow/pull/7526
[x] 修复BatchNorm1d NHWC版本BUG。朱望认领。Easy。https://github.com/Oneflow-Inc/oneflow/pull/7454
[x] 开发trunc_normal op。来源：swin-transformer。Medium。https://github.com/Oneflow-Inc/vision/pull/100
[x] 对齐PyTorch的clip_grad。BBuf认领。来源：swin-transformer。Easy。https://github.com/Oneflow-Inc/oneflow/pull/7180
[x] floor_ 算子开发。BBuf认领。来源：swin-transformer。Easy。https://github.com/Oneflow-Inc/oneflow/pull/7187
[x] flow.erfinv算子开发。李响认领。来源：swin-transformer。 Medium。PR：https://github.com/Oneflow-Inc/oneflow/pull/7163
[x] 优化linalg.vector_norm的ord=2.0的情况。认领人：BBuf。来源：swin-transformer。 Medium。PR：https://github.com/Oneflow-Inc/oneflow/pull/7160
[x] 为stack实现kernel。来源：swin-transformer。认领人：ZZK。 Medium。PR：https://github.com/Oneflow-Inc/oneflow/pull/7152 。
[x] flow.ones和torch.ones接口没有对齐，flow.div在除数和被除数均为整数时和PyTorch获得的结果不一样，PyTorch输出的是float类型，要用//才能输出为int类型，而OneFlow是输出的是int类型，这也是一个没对齐的点（但我觉得oneflow是对的，是否需要对齐还需要讨论一下）。认领人：BBuf。来源swin-transformer。https://github.com/Oneflow-Inc/oneflow/pull/7091
[x] clip_grad.py 里面.numpy()方法和mul使用方式(pytorch是inplace mul)和PyTorch没有对齐。认领人：BBuf。来源swin-transformer。https://github.com/Oneflow-Inc/oneflow/pull/8007
[x] linspace op开发。认领人：BBuf。来源：swin-transformer。 Medium。PR：https://github.com/Oneflow-Inc/oneflow/pull/7006
[x] reshape,slice,transpose的一些特例需要优化和解决bug。认领人：王雨顺。Medium。PR：https://github.com/Oneflow-Inc/oneflow/pull/6956
[x] reciprocal 算子存在bug。认领人：管张。Medium。https://github.com/Oneflow-Inc/oneflow/pull/6560。
[x] oneflow->onnx op加单测以及支持更多模型。认领人：李响。Medium。
[x] PReLU需要优化，优先级高。（来源insightface）认领人：张晓雨。Medium。https://github.com/Oneflow-Inc/oneflow/pull/6869
[x] CPU分组卷积，优先级高。（来源MobileNet系列模型）认领人：张晓雨&梁德澎。Hard。https://github.com/Oneflow-Inc/oneflow/pull/6823
[x] CPU分组反卷积，优先级高。（来源Unet等分割模型）认领人：朱望。Hard。https://github.com/Oneflow-Inc/oneflow/pull/6980
[x] MaxPool Op 差一个NHWC的实现，优先级中。（来源赵露阳）认领人：赵露阳。Medium。https://github.com/Oneflow-Inc/oneflow/pull/7214
[x] torch.from_numpy()，优先级中。来源算子对齐。认领人：王迎港。 Medium。https://github.com/Oneflow-Inc/oneflow/pull/7013
[x] 将eye_op的Python层逻辑迁移到Functor。认领人：姚迟来源性能需求。Medium https://github.com/Oneflow-Inc/oneflow/pull/7036/files
[x] prelu少了dtype和device参数。来源：和PyTorch接口对齐。认领人：王雨顺 easy PR：https://github.com/Oneflow-Inc/oneflow/pull/7118
[x] torch.movedim 没有实现，优先级中。来源对齐需要，认领人：李春游。Medium https://github.com/Oneflow-Inc/oneflow/pull/6227
[x] torch.meshgrid 功能不完整，优先级中。来源对齐需要，认领人：李春游。Medium https://github.com/Oneflow-Inc/oneflow/pull/7012
[x] torch.diagonal 没有实现，优先级中。来源对齐需要，认领人：李春游。Medium https://github.com/Oneflow-Inc/oneflow/pull/6016
[x] torch.cumsum 没有实现，优先级中。来源对齐需要。认领人：王雨顺。 Medium PR：https://github.com/Oneflow-Inc/oneflow/pull/7050
[x] fllow.select 认领人：李春游。https://github.com/Oneflow-Inc/oneflow/pull/7320
[x] flow.t / flow.T 白夏颖，已完成。https://github.com/Oneflow-Inc/oneflow/pull/7269
[x] flow.hsplit, 认领人：李春游。https://github.com/Oneflow-Inc/oneflow/pull/7407
[x] flow.vsplit 认领人：李春游。https://github.com/Oneflow-Inc/oneflow/pull/7407
[x] flow.tensor_split 认领人：李春游。https://github.com/Oneflow-Inc/oneflow/pull/7407
[x] flow.swapaxes 认领人：李响。PR: https://github.com/Oneflow-Inc/oneflow/pull/7179
[x] flow.as_strided。认领人：李春游。https://github.com/Oneflow-Inc/oneflow/pull/7275
[x] PixelShufflev2在Python层的逻辑可以封装为一个Functor。Easy。李响认领。https://github.com/Oneflow-Inc/oneflow/pull/7745
[x] 缺 torch.repeat_interleave()接口，来源：袁梓洋。 https://github.com/Oneflow-Inc/OneTeam/issues/1227#issuecomment-1077460367 。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/7965 (前置pr index_select) &
[x] torch.all, torch.any。来源性能需求。认领人：王世杰Hard。https://github.com/Oneflow-Inc/oneflow/pull/6784
[x] 非FP32类型Tensor访问Numpy报错。来源BBuf。Hard 。认领人：刘丰伟。https://github.com/Oneflow-Inc/oneflow/pull/7432
[x] onerec_decoder_op lazy迁到eager。认领人：姚迟来源广搜模型场景。 Medium。https://github.com/Oneflow-Inc/oneflow/pull/6911
[x] torch.nn.functional.normalize，优先级中。来源之江，认领人：李春游。Medium https://github.com/Oneflow-Inc/oneflow/pull/6940
[x] Pool Op 重构，优先级中。（来源 #6734-comment ）认领人：刘丰伟。Medium https://github.com/Oneflow-Inc/oneflow/pull/6853
[x] Tensor.mul_() ，优先级中。(来源用户实现BertAdam()缺少) 认领人：管张汇泓 Medium。https://github.com/Oneflow-Inc/oneflow/pull/6861
[x] Tensor.add_()缺少alpha参数，优先级中，认领人：刘丰伟。(来源用户实现BertAdam()缺少) Easy。https://github.com/Oneflow-Inc/oneflow/pull/6867
[x] torch.var实现Kernel，优先级中。认领人：刘丰伟。Medium。https://github.com/Oneflow-Inc/oneflow/pull/7024
[x] 自动测试疑存BUG，优先级高。（来源conv,matmul,bn多次ci测试）认领人：张建浩和张晓雨。
[x] 检查OneFlow现存的Op是否存在多包了一层nn.Module，优先级中。认领人：李响。Easy
[x] 将bmm的Python层逻辑迁移到Functor。来源性能需求。认领人：李响。Easy。
[x] 将BroadCastLike的Python层逻辑迁移到Functor，去掉多余的nn.Module封装。来源性能需求。认领人：李响。Medium。
[x] 将chunk的Python层逻辑迁移到Functor。来源性能需求。认领人：李响。Easy。
[x] 将expand_op的Python层逻辑迁移到Functor。来源性能需求。认领人：梁德澎。Easy。
[x] 将_flow_flatten的Python层逻辑迁移到Functor。来源性能需求。Easy。
[x] 将floor_op的Python层逻辑迁移到Functor。来源性能需求。Easy。
[x] 将gather_op的Python层逻辑迁移到Functor。来源性能需求。认领人：姚迟 Easy。
[x] 将gather_nd_op的Python层逻辑迁移到Functor。来源性能需求。认领人：姚迟 Easy。
[x] OneFlow的l2_normalize有Bug，l2_norm的axis意义应该是在某一个维度上做norm. 我们是从该axis到最后，做norm。对应的解决方案可以是前后加2个transpose。#787 。认领人：刘沛宏。 Medium。
[x] 优化diagonal的CUDA Kernel。认领人：姚子航来源 https://github.com/Oneflow-Inc/oneflow/pull/7546。 Medium
[x] flow.swapdims 认领人：马诚宇。https://github.com/Oneflow-Inc/oneflow/pull/7659
[x] reduce_ops.py 里的max、min、sum等操作可以改成Functor，然后直接导出。Easy。认领人：钟珊珊。https://github.com/Oneflow-Inc/oneflow/pull/8085
[x] Tensor.addcmul_()，优先级中。（来源用户实现BertAdam()缺少）认领人：李春游。 Medium 。
[x] 缺 torch.tensordot()接口，来源：袁梓洋。 https://github.com/Oneflow-Inc/OneTeam/issues/1227#issuecomment-1077460367 认领人：王义。https://github.com/Oneflow-Inc/oneflow/pull/7968
[x] 缺少tensor.median()方法，来源：任天和。https://github.com/Oneflow-Inc/libai/issues/259 。认领人：王世杰。https://github.com/Oneflow-Inc/oneflow/pull/8069
[x] flow.as_tensor从numpy array转换时无法显式指定data type。来源：迟子秋。https://github.com/Oneflow-Inc/libai/pull/260#issuecomment-1107738050 。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/8097
[x] oneflow.nn.functional.interpolate与torch行为不一致。来源：迟子秋。 https://github.com/Oneflow-Inc/libai/pull/260#issuecomment-1108372399 。认领人：张晓雨，钟珊珊。https://github.com/Oneflow-Inc/oneflow/pull/8105
[x] 实现flow.embedding op。认领人：姚子航。 https://github.com/Oneflow-Inc/oneflow/pull/8110
[x] 实现cosine_similarity。认领人：王世杰。https://github.com/Oneflow-Inc/oneflow/pull/8119
[x] linalg.norm 形状错误bug。认领人：张晓雨。https://github.com/Oneflow-Inc/oneflow/pull/8185
[x] cumprod 后向计算错误。认领人：刘丰伟。https://github.com/Oneflow-Inc/oneflow/pull/8136
[x] sub 算子支持alpha参数。认领人：刘丰伟。https://github.com/Oneflow-Inc/oneflow/pull/8026
[ ] oneflow tensor.type() 与 torch 未对齐。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/71#issuecomment-1082881851 认领人：王义。https://github.com/Oneflow-Inc/oneflow/pull/7948
[ ] flow.nn.utils.spectral_norm 。认领人：姚子航。https://github.com/Oneflow-Inc/oneflow/pull/8082
[ ] oneflow.matmul 函数矩阵乘法没对齐。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/71#issuecomment-1080290869 认领人：zzk。https://github.com/Oneflow-Inc/oneflow/pull/6937
[x] flow.view_as 认领人：姚子航 https://github.com/Oneflow-Inc/oneflow/pull/8077
[ ] oneflow.inverse 关于矩阵求逆接口没实现。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/71#issuecomment-1080227746 优先级中。认领人：王义。
[ ] flow.load()方法无 map_location参数来源：陈巧玲 OCR https://github.com/Oneflow-Inc/OneCloud/issues/69#issuecomment-1077027266 认领人：王迎港。
[ ] 为unsqueeze 实现inplace版本op unsqueeze_。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/71#issuecomment-1083999136 。认领人：赵露阳。
[ ] onehot，Eager和Lazy没有对齐，优先级中。来源许啸宇。认领人：王雨顺 Easy 。
[ ] 优化Upsample的CUDA Kernel。认领人：张晓雨来源 https://github.com/Oneflow-Inc/OneTeam/issues/767。 Medium
[x] torch.nn.Embedding完整功能，优先级中。来源外部用户，认领人：姚子航。Hard
[ ] torch.multinomial 没有实现，优先级中。来源对齐需要，认领人：姚子航。Medium
[ ] flow.split_with_sizes 认领人：姚子航。
[x] flow.cumsum支持，tensor.cumsum不支持。另外flow.cumsum不能指定dtype。来源：迟子秋。https://github.com/Oneflow-Inc/libai/pull/260#issuecomment-1103459793 。认领人：刘丰伟。https://github.com/Oneflow-Inc/oneflow/pull/8065
[ ] AI-Writer 性能比PyTorch慢15%，需要调查。来源：钟珊珊 AI-Writer。https://github.com/Oneflow-Inc/OneTeam/issues/1214 难度：Medium 优先级中。
[ ] global 模型加载 local 参数时，报错不清晰。来源：https://github.com/Oneflow-Inc/OneCloud/issues/70#issuecomment-1077397584 优先级中。
[ ] oneflow.linalg.inv 关于矩阵求逆接口没实现。来源：林松。https://github.com/Oneflow-Inc/OneCloud/issues/71#issuecomment-1080227746 优先级中。
[ ] oneflow里nn.init.zeros() 循环取索引初始化出现非0数。来源：袁梓洋。https://github.com/Oneflow-Inc/OneTeam/issues/1227#issuecomment-1080453803 。
[ ] BatchNorm1d参数affine=False时有" Only local tensors have 'device'. Please use '.placement' for consistent tensors."的bug。来源：迟子秋。https://github.com/Oneflow-Inc/libai/pull/160#issuecomment-1086582245 。（需要参考LayerNorm把gamma和beta变成optional）。
[ ] flow.Tensor 整数数组索引的规则与 torch.Tensor 不一致。来源：江皓哲。https://github.com/Oneflow-Inc/OneTeam/issues/1184#issuecomment-1088362789
[ ] 缺少类似torch的torch.cuda.synchronize以及torch.cuda.max_memory_alocated接口。来源: 任天和。https://github.com/Oneflow-Inc/libai/issues/259
[ ] torch.nn.parallel.DistributedDataParallel()的入参没有对齐。来源：任天和。https://github.com/Oneflow-Inc/libai/issues/259
[ ] oneflow.nn.utils.clip_grad_norm_不支持传入None，来源：任天和。https://github.com/Oneflow-Inc/libai/issues/259
[ ] torch.set_default_tensor_type，优先级中。来源之江。Medium
[ ] 优化AdaptiveAvgPool的CUDA Kernel。来源 https://github.com/Oneflow-Inc/OneTeam/issues/767。 Medium
[ ] Tensor.new()，优先级中。谢子鹏实现哈工大的elmo时用到的 Hard 。
[ ] torch.nn.SyncBatchNorm，优先级中。来源OneFlow QQ群用户 Hard 。
[ ] torch.nn.broadcastmatmul，优先级中。来源https://github.com/Oneflow-Inc/OneTeam/issues/780 。Medium
[ ] flow.real
[ ] flow.imag
[ ] flow.view_as_real
[ ] tensor_ops.py 可以改成Functor，然后直接导出。Easy。
[ ] flow.cdist不支持。来源：迟子秋。
[ ] tensor.unbind不支持global tensor (NotImplementedError error)。来源：迟子秋。 https://github.com/Oneflow-Inc/libai/pull/260#issuecomment-1153500398
[x] RNN 模块相关，认领人：梁德澎 https://github.com/Oneflow-Inc/oneflow/pull/8164
- [x] torch.nn.RNN，优先级中。来源之江。0.7.0版本前ready。Hard
- [x] torch.nn.LSTM，优先级中。来源之江。0.7.0版本前ready。Hard
- [x] torch.nn.GRU，优先级中。来源之江。0.7.0版本前ready。Hard
- [x] torch.nn.RNNCell，优先级中。来源之江。0.7.0版本前ready。Hard
- [x] torch.nn.GRUCell，优先级中。来源之江。0.7.0版本前ready。Hard
- [x] torch.nn.utils.rnn.pack_padded_sequence。来源：庄宇林 Couplet。Medium 优先级低。
- [x] torch.nn.utils.rnn.pad_packed_sequence。来源：庄宇林 Couplet。Medium 优先级低。
- [x] torch.nn.utils.rnn.pad_sequence。来源：庄宇林 Couplet。Medium 优先级低。
- [x] torch.nn.utils.rnn.pack_sequence。来源：庄宇林 Couplet。Medium 优先级低

https://github.com/Oneflow-Inc/oneflow/issues/6156

chengtbf commented 3 years ago

0.4.0 发布后，后续预计在 6.21 左右发布 0.5.0，由 @doombeaker 列出来其中的属于 0.5.0 的 TODO，发一个新的issue，新的issue只用来最终生成 0.5.0 的 release note，不需要记录哪个算子是谁开发的、谁 review、和什么时候合并的这些细节。

BBuf commented 3 years ago

第一阶段搬运的Module

OneFlow

对齐目标	现有算子	认领人	reviewer	PR	备注
torch.abs(torch.absolute)	oneflow.math.abs	王宏升	赵露阳	https://github.com/Oneflow-Inc/oneflow/pull/4952
torch.acosh	oneflow.math.acosh	黎晨阳	姚迟	https://github.com/Oneflow-Inc/oneflow/pull/4987
/	oneflow.math.add_n
torch.asin	oneflow.math.asin	陈岱渊	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/4955
torch.asinh	oneflow.math.asinh	陈岱渊	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/4955
torch.atan	oneflow.math.atan	张子涵	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/4956
torch.atan2	oneflow.math.atan2	应志文	赵露阳	https://github.com/Oneflow-Inc/oneflow/pull/4991
torch.atanh	oneflow.math.atanh	王一张	姚迟	https://github.com/Oneflow-Inc/oneflow/pull/4960
torch.ceil	oneflow.math.ceil	杨羿	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/4953
torch.clamp(torch.clip)	oneflow.math.clip_by_value	钟昊文	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/4946
torch.cosh	oneflow.math.cosh	石永涛	赵露阳	https://github.com/Oneflow-Inc/oneflow/pull/4943
torch.erf	oneflow.math.erf	陆陈昊	梁德澎	https://github.com/Oneflow-Inc/oneflow/pull/4954
torch.erfc	oneflow.math.erfc	陆陈昊	梁德澎
torch.expm1	oneflow.math.expm1	杨羿	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/4953
torch.floor	oneflow.math.floor	徐嘉梁	梁德澎	https://github.com/Oneflow-Inc/oneflow/pull/4964
/	oneflow.math.floordiv	俞再亮	梁德澎
torch.topk	oneflow.math.top_k	黄振华	梁德澎	#4963
torch.floor	oneflow.math.floor	叶娇娇	梁德澎
torch.as_tensor	oneflow.Tensor构造	陈岱渊
torch.from_numpy	oneflow.tensor支持从Numpy构造
torch.linspace	参考oneflow.arange module可以做到
torch.logspace	参考oneflow.arange module可以做到
torch.index_select	oneflow.gather_nd间接做到
torch.movedim	通过oneflow.transpose间接做到
	oneflow.reshape_like
	oneflow.dynamic_reshape				这个不用搬
	oneflow.slice_v2
	oneflow.slice_update
	oneflow.experimental.logical_slice
	oneflow.experimental.logical_slice_assign
	oneflow.reverse
	oneflow.gather_nd
	oneflow.scatter_nd
	oneflow.tensor_scatter_nd_update
	oneflow.tensor_scatter_nd_add
	oneflow.nonzero
	oneflow.elem_cnt
	oneflow.sync_dynamic_resize
	oneflow.stack
	oneflow.random.generate_random_batch_permutation_indices
	oneflow.random.shuffle
	oneflow.identity_n
	oneflow.cast_to_static_shape
	oneflow.expand_dims
	oneflow.broadcast_like
	oneflow.amp_white_identity
	oneflow.profiler.nvtx_start
	oneflow.profiler.nvtx_end
	oneflow.assign
	oneflow.system.assign
	oneflow.experimental.eager_assign_121
	oneflow.categorical_ordinal_encode
	oneflow.layers.categorical_ordinal_encoder
	oneflow.combined_margin_loss
	oneflow.count_not_finite
	oneflow.multi_count_not_finite
	oneflow.diag
	oneflow.nn.fused_self_attention_query_mul_key_and_value
	oneflow.eager_nccl_all_reduce
	oneflow.linalg.matmul
	oneflow.smooth_l1_loss
	oneflow.ctc_loss
	oneflow.math.floordiv
	oneflow.math.xlogy
	oneflow.math.add_n
	oneflow.math.mod
	oneflow.math.unsorted_segment_sum
	oneflow.math.unsorted_segment_sum
	oneflow.math.unsorted_segment_sum_like
	oneflow.math.unsorted_segment_sum_like
	oneflow.math.unsorted_batch_segment_sum
	oneflow.math.unsorted_batch_segment_sum
	oneflow.math.logical_and
	oneflow.math.reduced_shape_elem_cnt
	oneflow.math.broadcast_to_compatible_with
	oneflow.math.l2_normalize
	oneflow.math.squared_difference
	oneflow.math.tril
	oneflow.math.fused_scale_tril
	oneflow.math.fused_scale_tril_softmax_dropout
	oneflow.math.polyval
	oneflow.math.in_top_k

Flowingsun007 commented 3 years ago

1. 待搬运module/op

对齐目标	现有算子	认领人	reviewer	PR	备注
nn.Conv1d	nn.conv1d
nn.Conv3d	nn.conv3d
nn.GroupNorm	nn.GroupNorm
nn.InstanceNorm1d	nn.InstanceNorm1d
nn.InstanceNorm2d	nn.InstanceNorm2d
nn.InstanceNorm3d	nn.InstanceNorm3d
nn.MaxPool1d	nn.max_pool1d
nn.MaxPool2d	nn.max_pool3d
nn.AvgPool1d	nn.avg_pool1d
nn.AvgPool3d	nn.avg_pool3d
nn.L1Loss	nn.L1Loss
nn.BCELos	nn.BCELoss
nn.MSELoss	nn.MSELoss
nn.BCEWithLogitsLoss	nn.BCEWithLogitsLoss
nn.MarginRankingLoss	nn.MarginRankingLoss
nn.TripletMarginLos	nn.TripletMarginLoss
nn.PixelShuffle	nn.PixelShuffle
nn.KLDivLoss	nn.KLDivLoss
torch.one_hot	one_hot
torch.pad	pad
nn.ReflectionPad2d	reflection_pad2d
nn.ReplicationPad2d	replication_pad2d
nn.ConstantPad2d	constant_pad2d
nn.ZeroPad2d	zero_pad2d
torch.bernoulli	random.bernoulli
torch.random.seed	random.gen_seed
torch.any	math.reduce_any
torch.min	math.reduce_min
torch.max	math.reduce_max
torch.prod	math.reduce_prod
torch.all	math.reduce_all
torch.logsumexp	math.reduce_logsumexp
torch.sort	sort
torch.argsort	argsort

2.其他op(torch没有类似实现/有类似实现但不同命名)

nn.moments bias_add nn.compat_conv2d nn.fused_bias_add_gelu nn.fused_bias_add_dropout nn.softmax_grad nn.sparse_cross_entropy nn.softmax_cross_entropy_with_logits nn.sparse_softmax_cross_entropy_with_logits nn.distributed_sparse_softmax_cross_entropy_with_logits nn.sigmoid_cross_entropy_with_logits nn.random_mask_like nn.conv2d_transpose nn.torch_conv2d_transpose nn.mish nn.swish nn.PixelShufflev2 pad_grad same_padding distributed_partial_fc_sample math.two_stage_reduce_max math.two_stage_reduce_min math.reduce_euclidean_norm

optimizer.SGDW optimizer.LARS optimizer.LazyAdam optimizer.LAMB optimizer.CombinedOptimizer optimizer.grad_clipping.by_global_norm optimizer.warmup.constant optimizer.warmup.linear optimizer.CustomScheduler optimizer.PiecewiseConstantScheduler optimizer.PiecewiseScalingScheduler optimizer.PolynomialScheduler optimizer.PolynomialSchduler optimizer.LinearCosineScheduler optimizer.ExponentialScheduler optimizer.InverseTimeScheduler optimizer.NaturalExpScheduler optimizer.loss_scale.static_loss_scale optimizer.loss_scale.dynamic_loss_scale

quantization.min_max_observer quantization.moving_average_min_max_observer quantization.fake_quantization

regularizers.l1_l2 regularizers.l1 regularizers.l2

summary.scalar summary.create_summary_writer summary.flush_summary_writer summary.histogram summary.pb summary.image

gen_tensor_buffer tensor_buffer_to_tensor tensor_to_tensor_buffer tensor_buffer_to_list_of_tensors

data.OFRecordRawDecoder data.OFRecordBytesDecoder data.OFRecordImageDecoderRandomCrop data.OFRecordImageDecoder data.coco_reader data.ofrecord_image_classification_readerd data.OneRecDecoder data.megatron_gpt_mmap_data_loader

image.resize image.target_resize image.image.CropMirrorNormalize image.random_crop image.decode image.batch_align iamge.normalize image.flip random.CoinFlip detection.object_bbox_flip detection.object_bbox_scale detection.object_segmentation_polygon_flip detection.object_segmentation_polygon_scale detection.object_segmentation_polygon_to_mask

doombeaker commented 3 years ago

备份（从这个表里筛选出每周的计划）

对齐目标	现有算子	认领人	reviewer	PR	备注
torch.subtract torch.sub	flow.sub		姚迟	https://github.com/Oneflow-Inc/oneflow/pull/4993	已搬，需完善 doctest 和 testcase
torch.arcsinh	flow.arcsinh	陈岱渊	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/4955	merged
torch.clamp(torch.clip)	oneflow.math.clip_by_value	钟昊文	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/4946	merged
/	oneflow.math.floordiv	俞再亮	梁德澎
torch.topk	oneflow.math.top_k（需要重写kernel）	黄振华	梁德澎	#4963
torch.floor	oneflow.math.floor	叶娇娇	梁德澎	https://github.com/Oneflow-Inc/oneflow/pull/4995
torch.as_tensor	oneflow.Tensor构造
torch.from_numpy	oneflow.tensor支持从Numpy构造
torch.linspace	参考oneflow.arange module可以做到
torch.logspace	参考oneflow.arange module可以做到
torch.index_select	oneflow.gather_nd间接做到
torch.movedim	通过oneflow.transpose间接做到				这个不用搬
torch.subtract	flow.sub	徐芬	姚迟	https://github.com/Oneflow-Inc/oneflow/pull/4993
	oneflow.reshape_like
	oneflow.dynamic_reshape
	oneflow.slice_v2
	oneflow.slice_update
	oneflow.experimental.logical_slice
	oneflow.experimental.logical_slice_assign
	oneflow.reverse
	oneflow.gather_nd
	oneflow.scatter_nd
	oneflow.tensor_scatter_nd_update
	oneflow.tensor_scatter_nd_add
	oneflow.nonzero
torch.numel(torch.Tensor.nelement)	oneflow.elem_cnt	钟昊文
	oneflow.sync_dynamic_resize
	oneflow.stack	陈岱渊
	oneflow.random.generate_random_batch_permutation_indices
	oneflow.random.shuffle
	oneflow.identity_n
	oneflow.cast_to_static_shape
	oneflow.expand_dims
	oneflow.broadcast_like
	oneflow.amp_white_identity
	oneflow.profiler.nvtx_start
	oneflow.profiler.nvtx_end
	oneflow.assign
	oneflow.system.assign
	oneflow.experimental.eager_assign_121
	oneflow.categorical_ordinal_encode
	oneflow.layers.categorical_ordinal_encoder
	oneflow.combined_margin_loss
	oneflow.count_not_finite
	oneflow.multi_count_not_finite
	oneflow.diag	唐娜娜
	oneflow.nn.fused_self_attention_query_mul_key_and_value
	oneflow.eager_nccl_all_reduce
	oneflow.linalg.matmul
	oneflow.smooth_l1_loss	叶娇娇		https://github.com/Oneflow-Inc/oneflow/pull/5256
	oneflow.ctc_loss
	oneflow.math.xlogy
	oneflow.math.add_n
	oneflow.math.mod
	oneflow.math.unsorted_segment_sum
	oneflow.math.unsorted_segment_sum
	oneflow.math.unsorted_segment_sum_like
	oneflow.math.unsorted_segment_sum_like
	oneflow.math.unsorted_batch_segment_sum
	oneflow.math.unsorted_batch_segment_sum
	oneflow.math.logical_and
	oneflow.math.reduced_shape_elem_cnt
	oneflow.math.broadcast_to_compatible_with
	oneflow.math.l2_normalize
	oneflow.math.squared_difference
	oneflow.math.tril
	oneflow.math.fused_scale_tril
	oneflow.math.fused_scale_tril_softmax_dropout
	oneflow.math.polyval
	oneflow.math.in_top_k

nn.Conv1d	nn.conv1d	杨羿
nn.Conv3d	nn.conv3d	吴方闻
nn.GroupNorm	nn.GroupNorm
nn.InstanceNorm1d	nn.InstanceNorm1d	杜承垚		https://github.com/Oneflow-Inc/oneflow/pull/5131	merged
nn.InstanceNorm2d	nn.InstanceNorm2d	杜承垚		https://github.com/Oneflow-Inc/oneflow/pull/5131	merged
nn.InstanceNorm3d	nn.InstanceNorm3d	杜承垚		https://github.com/Oneflow-Inc/oneflow/pull/5131	merged
nn.MaxPool1d	nn.max_pool1d	石永涛	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/5021	C++反向描述已完成并merge，python接口未实现（cudnn bug）
nn.MaxPool3d	nn.max_pool3d	石永涛	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/5021	merged
nn.AvgPool1d	nn.avg_pool1d	应志文	赵露阳	https://github.com/Oneflow-Inc/oneflow/pull/5165	merge，python接口未实现（cudnn bug）
nn.AvgPool3d	nn.avg_pool3d	应志文	赵露阳	https://github.com/Oneflow-Inc/oneflow/pull/5165	merged
nn.L1Loss	nn.L1Loss	王宏升	赵露阳	https://github.com/Oneflow-Inc/oneflow/pull/5084
nn.Smooth_L1_Loss	nn.Smooth_L1_Loss	王宏升	赵露阳
nn.BCELos	nn.BCELoss	王宏升	赵露阳
nn.MSELoss	nn.MSELoss	石永涛	张晓雨	https://github.com/Oneflow-Inc/oneflow/pull/5116	merged
nn.BCEWithLogitsLoss	nn.BCEWithLogitsLoss	叶娇娇		https://github.com/Oneflow-Inc/oneflow/pull/5173
nn.MarginRankingLoss	nn.MarginRankingLoss	钟昊文
nn.TripletMarginLos	nn.TripletMarginLoss	钟昊文
nn.PixelShuffle	nn.PixelShuffle	石永涛			merged
nn.KLDivLoss	nn.KLDivLoss	石永涛	赵露阳	https://github.com/Oneflow-Inc/oneflow/pull/5155	merged
torch.one_hot	one_hot	钟昊文
torch.pad	pad	叶娇娇
nn.ReflectionPad2d	reflection_pad2d	吴方闻		#5172	merged
nn.ReplicationPad2d	replication_pad2d
nn.ConstantPad2d	constant_pad2d	陈岱渊
nn.ZeroPad2d	zero_pad2d
torch.bernoulli	random.bernoulli
torch.random.seed	random.gen_seed
torch.any	math.reduce_any	王宏升
torch.min	math.reduce_min	黄振华		#5022
torch.max	math.reduce_max	黄振华		#5022
torch.prod	math.reduce_prod	黄振华		#5022
torch.all	math.reduce_all	王宏升
torch.logsumexp	math.reduce_logsumexp
torch.sort	sort
torch.argsort	argsort

nn.moments bias_add nn.compat_conv2d nn.fused_bias_add_gelu nn.fused_bias_add_dropout nn.softmax_grad nn.sparse_cross_entropy nn.softmax_cross_entropy_with_logits nn.sparse_softmax_cross_entropy_with_logits nn.distributed_sparse_softmax_cross_entropy_with_logits nn.sigmoid_cross_entropy_with_logits nn.random_mask_like nn.conv2d_transpose nn.torch_conv2d_transpose nn.mish nn.swish nn.PixelShufflev2 pad_grad same_padding distributed_partial_fc_sample math.two_stage_reduce_max math.two_stage_reduce_min math.reduce_euclidean_norm

optimizer.SGDW optimizer.LARS optimizer.LazyAdam optimizer.LAMB optimizer.CombinedOptimizer optimizer.grad_clipping.by_global_norm optimizer.warmup.constant optimizer.warmup.linear optimizer.CustomScheduler optimizer.PiecewiseConstantScheduler optimizer.PiecewiseScalingScheduler optimizer.PolynomialScheduler optimizer.PolynomialSchduler optimizer.LinearCosineScheduler optimizer.ExponentialScheduler optimizer.InverseTimeScheduler optimizer.NaturalExpScheduler optimizer.loss_scale.static_loss_scale optimizer.loss_scale.dynamic_loss_scale

quantization.min_max_observer quantization.moving_average_min_max_observer quantization.fake_quantization

regularizers.l1_l2 regularizers.l1 regularizers.l2

summary.scalar summary.create_summary_writer summary.flush_summary_writer summary.histogram summary.pb summary.image

gen_tensor_buffer tensor_buffer_to_tensor tensor_to_tensor_buffer tensor_buffer_to_list_of_tensors

data.OFRecordRawDecoder data.OFRecordBytesDecoder data.OFRecordImageDecoderRandomCrop data.OFRecordImageDecoder data.coco_reader data.ofrecord_image_classification_readerd data.OneRecDecoder data.megatron_gpt_mmap_data_loader

image.resize image.target_resize image.image.CropMirrorNormalize image.random_crop image.decode image.batch_align iamge.normalize image.flip random.CoinFlip detection.object_bbox_flip detection.object_bbox_scale detection.object_segmentation_polygon_flip detection.object_segmentation_polygon_scale detection.object_segmentation_polygon_to_mask

doombeaker commented 3 years ago

doctest 指南

什么是 doctest

doctest 是一个 Python 的标准包，它使得程序运行时，会把写在 docstring 里的特定格式的字符串，当作 Python 代码执行一遍，并且做校验。

简单而言，有了 doctest，我们就可以把测试代码写在 docstring 中，一举两得。

怎么用 doctest

分两步：

按照约定的规范，在 docstring 中加入代码
引入 doctest 包，调用它的 testmod 方法

简单的例子

def myadd(x, y):
    """
        returns x + y

    Exmaple:
    >>> x = 5
    >>> y = 6
    >>> myadd(x, y)
    11
    """
    return x + y

if __name__ == "__main__":
    import doctest
    doctest.testmod()

以上注意要点：

要被当作 Python 代码执行的字符串，应该以 >>> 开头
以上的每句语句，默认都应该有一个输出，输出是不需要 >>>> 开头的（比如上面的 11），如果不写输出，则是默认没有输出。

输出字符串匹配

def myfun(a):
    """
    Example:

    >>> myfun(100) #doctest: +ELLIPSIS
    [0, 1, 2, ..., 99]
    """
    print(list(range(0,a)))

if __name__ == "__main__":
    import doctest
    doctest.testmod()

以上的例子中，使用了 #doctest: +ELLIPSIS，有了这个 flag，在 docstring 中的下一行的“期待输出中”， ... 可以匹配测试时输出的任意字符串。

这对于有内存地址的情况，比较有用。

给 OneFlow 的 Module 添加 doctest

class LeakyReLU(Module):
    r"""Applies the element-wise function:

    .. math::
        \text{LeakyReLU}(x) = \max(0, x) + \text{negative_slope} * \min(0, x)

    or 

    .. math::
        \text{LeakyRELU}(x) = \begin{cases}
            x, & \text{ if } x \geq 0 \\
            \text{negative_slope} \times x, & \text{ otherwise }
        \end{cases}

    Args:
        negative_slope: Controls the angle of the negative slope. Default: 1e-2
        inplace: can optionally do the operation in-place. Default: ``False``

    Shape:
        - Input: :math:`(N, *)` where `*` means, any number of additional
          dimensions
        - Output: :math:`(N, *)`, same shape as the input

    For example: 

    .. code-block:: python

        >>> import oneflow.experimental as flow
        >>> import numpy as np
        >>> flow.enable_eager_execution()
        >>> m = flow.nn.LeakyReLU(0.1)
        >>> input = flow.Tensor(np.array([1, 2]))
        >>> output = m(input)
        >>> output.shape
        flow.Size([2])
    """
    pass

要求

搬运的module 都要附上 doctest
记得 PR 中截图附上 docstring 的编译效果
每个 module 起码有3个及以上的 check，且其中起码有一个数值 check（数值 check 区别于 shape、dim 等 check）

BBuf commented 3 years ago

添加后向算子指南

0x0. 介绍

目前一些Module的后向复用的仍然是User OP中注册的后向，在OneFlow的0.4.0以及以后的版本中，Module的后向将统一放在oneflow/core/autograd/gradient_funcs 这个文件夹中，这里已经实现了不少Module的后向，比如BatchGather，Concat，PReLU，Reshape等等。

新版OneFlow Module后向示例

之前大家搬运的Module只考虑了前向，如果backward的测试可以正常运行原因可能是你实现的Module的后向在这里已经有了，或者是复用了静态图User OP的后向。但当你的Module有动态属性，或者注册后向的User OP是由多个OP拼成的，这个时候测试Module的Backwad可能就会挂掉，我们必须对这些Module重写后向注册代码。（现在是要对所有Module都重写后向，即使Module的Backward可以正常运行，但它的后向没有在gradient_funcs中重写，那么我们就需要为其添加C++后向代码实现。

0x1. 以Transpose为例来新增一个后向算子

下面我们以Transpose Module为例，来一步步为其添加C++后向代码实现。

一，首先明确Transpose Module的前向使用的是哪个User OP？

在oneflow/python/nn/modules/transpose.py中我们可以发现Transpose Module的构建使用的是transpose这个User OP，那么我们找到transpose这个User OP的梯度注册代码把它迁移到gradient_funcs中就可以了。注意，如果这个Module是由多个Module或者User OP拼出来的，那么我们需要确认这些小的Module或者User OP是否后向都已经在gradient_funcs中实现了，如果没有那么需要为这些小OP继续添加后向C++代码实现。

还需要说明的一点是，某一些OP不需要注册反向，比如greater，lesss，argwhere等，记得及时避开。

二，基于User OP的梯度注册代码提取梯度Op

我们先定位到oneflow/user/ops/transpose_ops.cpp的REGISTER_USER_OP_GRAD("transpose")函数，这个函数就是为transpose 这个User OP添加后向的，我们需要做的事情就是把这个函数迁移到gradient_funcs。

这里我们需要关注这个梯度注册的代码中具体使用了哪些Op，比如transpose这个User OP的梯度注册代码中使用到的也是transpose这个OP，这个也是期望中的，只不过它的perm属性参数和前向传入的perm是一个置换关系。我们现在需要将transpose这个求梯度的User Op写到oneflow/core/framework/op_expr_grad_function.h和oneflow/core/framework/op_expr_grad_function.cpp中，这样就可以将这些求梯度的Op统一定义到一个文件，方便我们查看以及管理。

三，在`gradient_funcs`中实现梯度注册的具体逻辑

在oneflow/core/autograd/gradient_funcs新建transpose.cpp来为transpose这个Module添加反向，首先需要定义一个继承了OpExprInterpState的TransposeInterpState类来记录transpose这个Module的属性参数以及对应输入的梯度信息。

并且这个类由于继承了OpExprInterpState，也拥有了它的SaveTensorForBackward方法，可以保存这个Module的输入Tensor，因为某些Module的反向是必须要知道输入Tensor的信息才可以完成反向计算的。

接下来，我们定义一个Transpose类，继承OpExprGradFunction这个模板类，模板参数即为我们刚才定义好的TransposeInterpState。我们只需要复写这三个类中的三个成员函数即可：

class Transpose : public OpExprGradFunction<TransposeInterpState> {
 public:
  Maybe<void> Init(const OpExpr& op) override;
  Maybe<void> Capture(TransposeInterpState* ctx, const TensorTuple& inputs,
                      const TensorTuple& outputs, const AttrMap& attrs) const override;
  Maybe<void> Apply(const TransposeInterpState* ctx, const TensorTuple& out_grads,
                    TensorTuple* in_grads) const override;

 private:
  AttrMap base_attrs_;
  std::shared_ptr<OpExpr> grad_op_;
};

其中Init用来初始化反向过程中需要用到的Op，比如这里的grad_op_ = JUST(op_expr_helper::TransposeOp(*/\*perm=\*/*perm, GradientOpName(op_name)));就预定义好了反向需要用到的梯度Op。

Capture用来捕获反向Op执行时需要的信息，不仅包含Attr相关的参数信息，也包含我们上面提到的必要的输入Tensor，当前这个Transpose的反向由于不需要知道输入Tensor，所以这里没有捕获输入Tensor。

Apply用来完成真正的反向计算。主要就是通过Apply捕获的Attr参数信息和输入Tensor，以及Module前向的输出Tensor，调用Init预定义的Op来获得结果。

0x2. 重新编译源码

完成在oneflow/core/autograd/gradient_funcs中实现反向的C++代码后，我们需要重新编译OneFlow源码，这样这个Op的反向才会生效。运行：

cmake .. && make -jx

yayeoCddy commented 3 years ago

所有的GAN相关训练都需要基于torch.Tensor.detach 这个算子(目前是@liyurui 在修)

图像生成/超分任务Pix2pix, DCGAN, SRGAN模型需要迁移以下算子：	pytorch	oneflow待搬运	备注
torch.Tensor.detach	无	目前是@liyurui 在搬
torch.nn.ConvTranspose2d	flow.nn.conv2d_transpose	不太清楚oneflow原本这两个反卷积的区别	目前是@zhangxiaoyu在搬
	flow.nn.torch_conv2d_transpose
	flow.nn.bias_add	动态图中是否还需要？
	flow.nn.sigmoid_cross_entropy_with_logits	算法层面可拼,pytorch没有对应算子,有无搬运必要?
torch.pad/torch.nn.ConstantPad2d	flow.pad/flow.nn.ConstantPad2d	原本没有对齐,如果复杂可以考虑先搬flow.constant_pad2d	陈岱渊
nn.MSELoss	flow.math.squared_difference	flow是否可以拼？有无搬运必要？

BBuf commented 3 years ago

test_add.py 反向测试边界不够多，需要补充。
test_avgpool2d.py 需要重构测试，numpy实现，并且添加反向测试，这个最好删除放到test_pooling里面去。（BBuf）
test_batchnorm.py 需要重构测试。
test_broadcast_like.py np.allclose精度范围没指定。
test_cast.py 需要重构测试，并添加反向测试代码。
test_constant.py 需要重构重试，并添加反向测试代码。
test_conv.py 需要重构重试，并添加反向测试代码。
test_flatten.py 需要重构测试，并添加反向测试代码。
test_gather.py 需要重构测试，并添加反向测试代码。
test_masked_fill.py 需要重构测试，并添加反向测试代码。
test_math_ops.py 大多数Module都需要重构，并添加反向测试代码。
test_mean.py 是不是可以放到test_math_ops.py里面，并且需要重构，并添加反向测试代码。
test_module_to.py 需要重构。
test_mul.py 需要重构，并添加反向测试代码。
test_normalization.py 需要重构，并添加反向测试代码。(Luyang)
test_ones_like.py 需要重构，并添加反向测试代码。
test_pooling.py 需要重构，并添加反向测试代码。
test_reciprocal.py 需要重构，并添加反向测试代码。
test_slice.py 需要重构，并添加反向测试代码。(Luyang)
test_sparse.py 需要重构，并添加反向测试代码。
test_sub.py 需要重构，并添加反向测试代码。
test_sum.py 需要重构，并添加反向测试代码。
test_to.py 需要重构，并添加反向测试代码，建议改名为test_tensor_to.py。

另外之江最近添加的静态图版本里面的math.xxx的module，在review的时候必须要求把实现和测试放到math_ops.py和test_math_ops.py里面。如果已经合并进主分支了，需要重新调整一下位置。

测试的过程中一定要注意多遍历测试边界，及时报告BUG。

@BBuf 和 @Flowingsun007 已完成。

puchapu commented 3 years ago

ReID 算法所需算子	pytorch	oneflow待搬运	备注
torch.expand
torch.addmm		通过 flow.multipy 和 flow.add 拼	钟昊文
torch.nn.functional.one_hot	flow.one_hot		钟昊文
torch.nn.marginrankingloss		可以 python 端拼	钟昊文
torch.max/min	flow.math.reduce_max/sum		黄振华，在做
	flow.tripletloss	可以 python 端拼	钟昊文
	flow.train.CheckPoint
	flow.optimizer.PiecewiseScalingScheduler
	flow.optimizer.warmup.linear

hengzi commented 3 years ago

test_add.py 反向测试边界不够多，需要补充。

test_avgpool2d.py 需要重构测试，numpy实现，并且添加反向测试，这个最好删除放到test_pooling里面去。（BBuf）

test_batchnorm.py 需要重构测试。

test_broadcast_like.py np.allclose精度范围没指定。

test_cast.py 需要重构测试，并添加反向测试代码。

test_constant.py 需要重构重试，并添加反向测试代码。

test_conv.py 需要重构重试，并添加反向测试代码。

test_flatten.py 需要重构测试，并添加反向测试代码。

test_gather.py 需要重构测试，并添加反向测试代码。

test_masked_fill.py 需要重构测试，并添加反向测试代码。

test_math_ops.py 大多数Module都需要重构，并添加反向测试代码。

test_mean.py 是不是可以放到test_math_ops.py里面，并且需要重构，并添加反向测试代码。

test_module_to.py 需要重构。

test_mul.py 需要重构，并添加反向测试代码。

test_normalization.py 需要重构，并添加反向测试代码。(Luyang)

test_ones_like.py 需要重构，并添加反向测试代码。

test_pooling.py 需要重构，并添加反向测试代码。

test_reciprocal.py 需要重构，并添加反向测试代码。

test_slice.py 需要重构，并添加反向测试代码。(Luyang)

test_sparse.py 需要重构，并添加反向测试代码。

test_sub.py 需要重构，并添加反向测试代码。

test_sum.py 需要重构，并添加反向测试代码。

test_to.py 需要重构，并添加反向测试代码，建议改名为test_tensor_to.py。

另外之江最近添加的静态图版本里面的math.xxx的module，在review的时候必须要求把实现和测试放到math_ops.py和test_math_ops.py里面。如果已经合并进主分支了，需要重新调整一下位置。

测试的过程中一定要注意多遍历测试边界，及时报告BUG。

sum，mean，max, min 等几个reduce 相关的重构我已经在做了，统一放在了*_reduce_ops.py文件 #5022

YongtaoShi commented 3 years ago

test_add.py 反向测试边界不够多，需要补充。

test_avgpool2d.py 需要重构测试，numpy实现，并且添加反向测试，这个最好删除放到test_pooling里面去。（BBuf）

test_batchnorm.py 需要重构测试。

test_broadcast_like.py np.allclose精度范围没指定。

test_cast.py 需要重构测试，并添加反向测试代码。

test_constant.py 需要重构重试，并添加反向测试代码。

test_conv.py 需要重构重试，并添加反向测试代码。

test_flatten.py 需要重构测试，并添加反向测试代码。

test_gather.py 需要重构测试，并添加反向测试代码。

test_masked_fill.py 需要重构测试，并添加反向测试代码。

test_math_ops.py 大多数Module都需要重构，并添加反向测试代码。

test_mean.py 是不是可以放到test_math_ops.py里面，并且需要重构，并添加反向测试代码。

test_module_to.py 需要重构。

test_mul.py 需要重构，并添加反向测试代码。

test_normalization.py 需要重构，并添加反向测试代码。(Luyang)

test_ones_like.py 需要重构，并添加反向测试代码。

test_pooling.py 需要重构，并添加反向测试代码。

test_reciprocal.py 需要重构，并添加反向测试代码。

test_slice.py 需要重构，并添加反向测试代码。(Luyang)

test_sparse.py 需要重构，并添加反向测试代码。

test_sub.py 需要重构，并添加反向测试代码。

test_sum.py 需要重构，并添加反向测试代码。

test_to.py 需要重构，并添加反向测试代码，建议改名为test_tensor_to.py。

另外之江最近添加的静态图版本里面的math.xxx的module，在review的时候必须要求把实现和测试放到math_ops.py和test_math_ops.py里面。如果已经合并进主分支了，需要重新调整一下位置。

测试的过程中一定要注意多遍历测试边界，及时报告BUG。

test_pooling.py里面现在只有maxpool的代码，所以我改成test_maxpool.py了 https://github.com/Oneflow-Inc/oneflow/pull/5021 。后面需要的话可以改回来。

doombeaker commented 3 years ago

讨论：算子搬不搬

以下是 6月30 日讨论后，确认暂时不搬运的：

PyTorch	OneFlow中已有算子	是否搬运	备注
nn.functional.cross_entropy nn.functional.binary_cross_entropy	nn.sparse_cross_entropy nn.softmax_cross_entropy_with_logits nn.sparse_softmax_cross_entropy_with_logits nn.distributed_sparse_softmax_cross_entropy_with_logits nn.sigmoid_cross_entropy_with_logits	看情况	其中的 sparse_softmax_cross_entropy_with_logits 已经封装为 oneflow.experimental.nn.CrossEntropyLoss。其它的几个，需要和原作者郭冉对照，和 PyTorch 对齐搬运。部分是内部调用用于性能优化的，就需要导出为用户接口了
无	oneflow.sync_dynamic_resize	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
无	oneflow.tensor_scatter_nd_update	否	与 PyTorch 对齐，这种 tf 的接口不需要搬运
无	oneflow.tensor_scatter_nd_add	否	与 PyTorch 对齐，这种 tf 的接口不需要搬运
无	oneflow.random.shuffle	否
无	oneflow.identity	否	OneFlow 原有的 identity 应该是静态图中常用，动态图几乎用不到（？）。PyTorch 中有 torch.nn.Identity 类（已经搬运），接口和 oneflow.identity 不大一样，如果要实现 PyTorch 版本，很可能需要重写 userop
无	oneflow.identity_n	否	这个内部优化时调用，不应该导出给用户
无	oneflow.expand_dims	否	PyTorch 中有 unsqueeze ，OneFlow 已经对齐 unsqueeze
无	oneflow.math.unsorted_segment_sum	否	PyTorch 中使用 torch.index_add 实现类似功能。暂时不搬，除非搭模型遇到了
无	oneflow.math.reduced_shape_elem_cnt	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
无	oneflow.math.squared_difference	否	计算差的平方，用减法和pow拼就可以。
无	oneflow.math.fused_scale_tril	否	可以搬运，但是不用导出给用户使用
无	oneflow.math.polyval	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
无	oneflow.nn.moments	否	这个算子只是同时计算平均值和标准差。这在 PyTorch 的接口里，可以直接用低级基础的运算符拼接而成
无	oneflow.bias_add	否	PyTorch 中没有这个算子，动态图中对这个算子也没什么需要
无	oneflow.nn.fused_bias_add_gelu	否	可以搬运，但是不用导出给用户使用
无	oneflow.nn.fused_bias_add_dropout	否	可以搬运，但是不用导出给用户使用
无	oneflow.softmax_grad	否	可以根据需要搬运，但是没必要导出成用户接口
无	random_mask_like	否	可以用 ones + dropout 拼凑
无	conv2d_transpose	否	现有和 PyTorch 对齐的 conv2d_transpose 已经搬运，原有和 TensorFlow 对齐的 conv2d_transpose 可以舍弃
无	oneflow.pad_grad	否	这种算子本身在 OneFlow 中就不应该导出
无	oneflow.same_padding	否	感觉不用单独做一个算子，而是作为 padding 算子的一个参数存在
无	oneflow.math.unsorted_segment_sum_like	否	PyTorch 中使用 torch.index_add 实现类似功能。暂时不搬，除非搭模型遇到了
无	oneflow.math.unsorted_batch_segment_sum	否	PyTorch 中使用 torch.index_add 实现类似功能。暂时不搬，除非搭模型遇到了

doombeaker commented 3 years ago

全面过了一遍，从原有的 400+ 个 lazy API 中，筛选知道，还剩余以下算子（170+）还没有从 lazy 搬运到 eager。其中值得搬运的在 50 个左右（考虑交给社区搬运）。

算子	是否搬运	备注
oneflow.broadcast_to_compatible_with	是
oneflow.categorical_ordinal_encode	是	可以有需要时再搬
oneflow.combined_margin_loss	是
oneflow.data.decode_ofrecord	是
oneflow.data.decode_random	是
oneflow.data.ImageCodec	是
oneflow.data.ImageDecoderRandomCropResize	是
oneflow.data.ImagePreprocessor	是
oneflow.data.ImageResizePreprocessor	是
oneflow.data.MegatronGPTMMapDataLoader	是
oneflow.data.NormByChannelPreprocessor	是
oneflow.data.ofrecord_image_classification_reader	是
oneflow.data.ofrecord_loader	是
oneflow.data.OFRecordBytesDecoder	是
oneflow.data.onerec_reader	是
oneflow.data.OneRecDecoder	是
oneflow.data.RawCodec	是
oneflow.diag	是
oneflow.gather_nd	是
oneflow.image_flip	是
oneflow.image_random_crop	是
oneflow.image_target_resize	是
oneflow.in_top_k	是
oneflow.nn.conv3d	是
oneflow.nn.ctc_greedy_decoder	是
oneflow.nn.dropout	是
oneflow.nn.leaky_relu	是
oneflow.nn.PixelShufflev2	是
oneflow.nn.TripletMarginLoss	是
oneflow.nonzero	是
oneflow.object_bbox_flip	是	王世杰认领
oneflow.object_bbox_scale	是	王世杰认领
oneflow.object_segmentation_polygon_flip	是	王世杰认领
oneflow.object_segmentation_polygon_scale	是	王世杰认领
oneflow.object_segmentation_polygon_to_mask	是	王世杰认领
oneflow.one_hot	是
oneflow.pad	是	需要和 torch.nn.functional.pad 对齐
oneflow.range	是
oneflow.reflection_pad2d	是	可以给社区人员搬运
oneflow.replication_pad2d	是	可以给社区人员搬运
oneflow.reverse	是	可以给社区人员搬运
oneflow.scatter_nd	是	和 gather_nd 配套
oneflow.smooth_l1_loss	是	可以给社区人员搬运，要写 functional
oneflow.to	是	不是简单的算子搬运，是对齐，好像还没做完
oneflow.acc	否	acc是一个底层的算子，不是普通算子
oneflow.advanced.distribute_add	否	advanced空间的算子与优化有关
oneflow.advanced.distribute_clone	否	advanced空间的算子与优化有关
oneflow.advanced.distribute_concat	否	advanced空间的算子与优化有关
oneflow.advanced.distribute_map	否	advanced空间的算子与优化有关
oneflow.advanced.distribute_split	否	advanced空间的算子与优化有关
oneflow.amp_white_identity	否	感觉是与底层优化有关的算子
oneflow.cast_to_current_logical_view	否	与OneFlow里的并行view有关
oneflow.cast_to_static_shape	否
oneflow.constant	否	动态图可以用numpy直接赋值
oneflow.constant_initializer	否	静态同用于修改 variable 才需要的
oneflow.constant_like	否	动态图可以用numpy直接赋值
oneflow.constant_scalar	否	动态图可以用numpy直接赋值
oneflow.count_not_finite	否	不需要导出给用户
oneflow.data.load_mnist	否	根据 tutorial 的需求重构，或者用已有的
oneflow.distributed_partial_fc_sample	否	和底层优化有关
oneflow.dynamic_reshape	否	动态图不需要，本身就是dynamic的
oneflow.eager_nccl_all_reduce	否	貌似不应该暴露给用户
oneflow.empty_initializer	否	静态同用于修改 variable 才需要的
oneflow.expand_dims	否	和 unsqeeuze 功能重复
oneflow.gather	否	tf 的 gather 不好懂不好用
oneflow.get_all_variables	否	静态图有关
oneflow.get_job_set	否	静态图有关
oneflow.get_variable	否	静态图有关
oneflow.hierarchical_parallel_cast	否	底层并行有关
oneflow.identity	否	动态图用不上
oneflow.identity_n	否	动态图用不上
oneflow.indexed_slices_reduce_sum	否	貌似不应该暴露给用户
oneflow.layers.batch_normalization	否	暂时不搬，用户需要可以自己拼
oneflow.layers.batch_normalization_add_relu	否	暂时不搬，用户需要可以自己拼
oneflow.layers.batch_normalization_relu	否	暂时不搬，用户需要可以自己拼
oneflow.layers.categorical_ordinal_encoder	否	可以有需要时再搬
oneflow.layers.conv1d	否	暂时不搬，用户需要可以自己拼
oneflow.layers.conv2d	否	暂时不搬，用户需要可以自己拼
oneflow.layers.conv3d	否	暂时不搬，用户需要可以自己拼
oneflow.layers.dense	否	暂时不搬，用户需要可以自己拼
oneflow.layers.layer_norm	否	暂时不搬，用户需要可以自己拼
oneflow.layers.layer_norm_grad	否	暂时不搬，用户需要可以自己拼
oneflow.layers.layer_norm_param_grad	否	暂时不搬，用户需要可以自己拼
oneflow.layers.prelu	否	暂时不搬，用户需要可以自己拼
oneflow.layers.upsample_2d	否	插值再 PyTorch 里都放到 interpolate 里了
oneflow.logical_slice	否	貌似不应该暴露给用户
oneflow.logical_slice_assign	否	貌似不应该暴露给用户
oneflow.losses.add_loss	否	PyTorch 风格的方式不这样写了
oneflow.manual_seed	否	没有docstring，搬运可能需要底层重构
oneflow.math.fused_scale_tril	否	和底层优化有关
oneflow.math.fused_scale_tril_softmax_dropout	否	和底层优化有关
oneflow.math.polyval	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
oneflow.math.reduce_all	否	reduce 逻辑 and，PyTorch里没有，未来有需要再搬运
oneflow.math.reduce_any	否	reduce 逻辑 or，PyTorch里没有，未来有需要再搬运
oneflow.math.reduce_euclidean_norm	否	可以用oneflow.experimental.linalg.norm算子实现相同功能，默认ord=None为2范数，dim对应tf的axis
oneflow.math.reduce_logsumexp	否	PyTorch里没有，未来有需要再搬运
oneflow.math.reduced_shape_elem_cnt	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
oneflow.math.rint	否	和已经搬运的round重复了
oneflow.math.squared_difference	否	计算差的平方，用减法和pow拼就可以。
oneflow.math.two_stage_reduce_max	否	和底层优化有关
oneflow.math.two_stage_reduce_min	否	和底层优化有关
oneflow.math.xdivy	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
oneflow.math.xlogy	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
oneflow.nn.batch_normalization	否	PyTorch里的是BatchNormxD，已经用另外的方法实现，未来有需要再搬运
oneflow.nn.bias_add	否	PyTorch里没有，未来有需要再搬运
oneflow.nn.distributed_sparse_softmax_cross_entropy_with_logits	否	感觉是与底层优化有关的算子
oneflow.nn.fused_bias_add_dropout	否	感觉是与底层优化有关的算子
oneflow.nn.fused_bias_add_gelu	否	感觉是与底层优化有关的算子
oneflow.nn.fused_self_attention_query_mul_key_and_value	否	感觉是与底层优化有关的算子
oneflow.nn.init.calculate_gain	否
oneflow.nn.init.constant_	否
oneflow.nn.moments	否	这个算子只是同时计算平均值和标准差。这在 PyTorch 的接口里，可以直接用低级基础的运算符拼接而成
oneflow.nn.Parameter	否	lazy的这个，应该去掉导出
oneflow.nn.random_mask_like	否	PyTorch里没有，未来有需要再搬运
oneflow.nn.sigmoid_cross_entropy_with_logits	否	PyTorch里没有，未来有需要再搬运
oneflow.nn.softmax_cross_entropy_with_logits	否	PyTorch里没有，未来有需要再搬运
oneflow.nn.softmax_grad	否	貌似不应该暴露给用户
oneflow.nn.sparse_cross_entropy	否	PyTorch里没有，未来有需要再搬运
oneflow.nn.sparse_softmax_cross_entropy_with_logits	否	PyTorch里没有，未来有需要再搬运
oneflow.pack	否	pack是一个底层的算子，不是普通算子
oneflow.parallel_cast	否	与OneFlow里的并行view有关
oneflow.placement	否	与OneFlow里的并行view有关
oneflow.quantization.fake_quantization	否	量化有关，需要时再搬运
oneflow.quantization.min_max_observer	否	量化有关，需要时再搬运
oneflow.quantization.moving_average_min_max_observer	否	量化有关，需要时再搬运
oneflow.random.gen_seed	否
oneflow.random.generate_random_batch_permutation_indices	否
oneflow.random.shuffle	否	PyTorch 中有各种更细分的shuffle类，没有这种通用的shuffle方法
oneflow.random_normal_initializer	否	静态图用于修改 variable 才需要的
oneflow.random_uniform_initializer	否	静态图用于修改 variable 才需要的
oneflow.regularizers.l1	否	flow.ling.norm 可以替代
oneflow.regularizers.l1_l2	否	flow.ling.norm 可以替代
oneflow.regularizers.l2	否	flow.ling.norm 可以替代
oneflow.reshape_like	否	动态图不需要
oneflow.same_padding	否	感觉不需要，PyTorch中融合到其它操作中了，比如AdapativePool
oneflow.square_sum	否	貌似是一个临时的实验性接口
oneflow.ssp_variable_proxy	否	貌似不应该暴露给用户
oneflow.tensor_scatter_nd_add	否	有需要再搬运
oneflow.tensor_scatter_nd_update	否	有需要再搬运
oneflow.unique_with_counts	否	貌似是一个临时的实验性接口
oneflow.unpack	否	unpack是一个底层的算子，不是普通算子
oneflow.unsorted_batch_segment_sum	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
oneflow.unsorted_segment_sum	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
oneflow.unsorted_segment_sum_like	否	先搁置，它是静态图常用，动态图不需要。未来动静转换时，遇到具体需求再搬运。
oneflow.variance_scaling_initializer	否
oneflow.watch	否	静态图才需要
oneflow.watch_diff	否	静态图才需要
oneflow.zeros_initializer	否	静态图用于修改 variable 才需要的
oneflow.ones_initializer	否	静态图用于修改 variable 才需要的
oneflow.nn.compat_conv2d
oneflow.nn.layer_norm
oneflow.optimizer.CombinedOptimizer
oneflow.optimizer.CustomScheduler
oneflow.optimizer.ExponentialScheduler
oneflow.optimizer.grad_clipping.by_global_norm
oneflow.optimizer.InverseTimeScheduler
oneflow.optimizer.LAMB
oneflow.optimizer.LARS
oneflow.optimizer.LazyAdam
oneflow.optimizer.LinearCosineScheduler
oneflow.optimizer.loss_scale.DynamicLossScalePolicy
oneflow.optimizer.loss_scale.StaticLossScalePolicy
oneflow.optimizer.NaturalExpScheduler
oneflow.optimizer.PiecewiseConstantScheduler
oneflow.optimizer.PiecewiseScalingScheduler
oneflow.optimizer.PolynomialSchduler
oneflow.optimizer.PolynomialScheduler
oneflow.optimizer.SGDW
oneflow.optimizer.warmup.constant
oneflow.optimizer.warmup.linear

knightXun commented 2 years ago

有些算子可以适当分派给社区实现

kaijieshi7 commented 2 years ago

有 is_tensor() 的需求

kaijieshi7 commented 2 years ago

有 nn.Dropout2d 的需求

yuanms2 commented 2 years ago

为什么einsum 这个没有在列表里

ZylOo0 commented 2 years ago

一些 padding 相关的算子：

torch.nn.utils.rnn.pack_padded_sequence
torch.nn.utils.rnn.pad_packed_sequence
torch.nn.utils.rnn.pad_sequence
torch.nn.utils.rnn.pack_sequence

zhongshsh commented 2 years ago

torch.multinomial 的需求

需求场景描述

在NLP的AI-Writer任务中，预测阶段设置阈值为n，截取所有符合阈值的预测结果，需要在这部分结果中抽取一个作为最终的预测结果，抽样的目的是让每一次预测都在合理的范围内有所不同，从而尽可能接近人类的语言习惯，让模型不那么呆板。

对应代码与解决方案

抽样调用的是 torch.multinomial，调用代码为

ix = torch.multinomial(probs, num_samples=1)

目前已使用 numpy.random.multinomial 或者 np.random.choice 替代，修改代码为

p = probs.numpy().astype(np.float64)
p /= p.sum()

ix = np.random.choice(np.arange(probs.shape[0]), size=1, p=p)

sample = np.random.multinomial(n=1, pvals=p)
ix = np.argmax(sample)

zhongshsh commented 2 years ago

set_grad_enabled 的需求

需求场景描述

部分计算可能不需要梯度更新，部分可能需要，此时在 torch 中可以使用 set_grad_enabled 并通过 is_train 参数进行判断。

with torch.set_grad_enabled(is_train):
 ...

本质上，torch.set_grad_enabled(False) 等同于 torch.no_grad()，但是 set_grad_enabled 因为参数原因更为灵活一些。

解决方案

if is_train:
 with flow.grad_enable():
  ...
else:
 with flow.no_grad():
  ...

其他问题

为啥 torch 叫 enable_grad，oneflow 叫 grad_enable ？二者是存在什么区别吗？

接口上的没对齐，改。

Oneflow-Inc / oneflow

OneFlow 算子对齐 PyTorch 完备计划推进表 #4936

背景

解决的时间节点

相关文档

负责人

任务分工表

第一阶段搬运的Module

OneFlow

1. 待搬运module/op

2.其他op(torch没有类似实现/有类似实现但不同命名)

备份（从这个表里筛选出每周的计划）

doctest 指南

什么是 doctest

怎么用 doctest

简单的例子

输出字符串匹配

给 OneFlow 的 Module 添加 doctest

要求

添加后向算子指南

0x0. 介绍

0x1. 以Transpose为例来新增一个后向算子

一，首先明确Transpose Module的前向使用的是哪个User OP？

二，基于User OP的梯度注册代码提取梯度Op

三，在`gradient_funcs`中实现梯度注册的具体逻辑

0x2. 重新编译源码

讨论：算子搬不搬

torch.multinomial 的需求

需求场景描述

对应代码与解决方案

set_grad_enabled 的需求

需求场景描述

解决方案

其他问题

Oneflow-Inc / oneflow

OneFlow 算子对齐 PyTorch 完备计划推进表 #4936

背景

解决的时间节点

相关文档

负责人

任务分工表

第一阶段搬运的Module

OneFlow

1. 待搬运module/op

2.其他op(torch没有类似实现/有类似实现但不同命名)

备份（从这个表里筛选出每周的计划）

doctest 指南

什么是 doctest

怎么用 doctest

简单的例子

输出字符串匹配

给 OneFlow 的 Module 添加 doctest

要求

添加后向算子指南

0x0. 介绍

0x1. 以Transpose为例来新增一个后向算子

一，首先明确Transpose Module的前向使用的是哪个User OP？

二，基于User OP的梯度注册代码提取梯度Op

三，在gradient_funcs中实现梯度注册的具体逻辑

0x2. 重新编译源码

讨论：算子搬不搬

torch.multinomial 的需求

需求场景描述

对应代码与解决方案

set_grad_enabled 的需求

需求场景描述

解决方案

其他问题

三，在`gradient_funcs`中实现梯度注册的具体逻辑