jcf94 / blog-comments

A repository for my personal blog.
http://jcf94.com/
2 stars 0 forks source link

矩阵乘法与 SIMD 那些事 | Chenfan Blog #170

Open jcf94 opened 3 years ago

jcf94 commented 3 years ago

https://jcf94.com/2021/08/28/2021-08-28-simd/

自工作以来荒废了好久了,我又开始写博客啦~(不知道这一次能坚持多久…逃) 最近在比较多的帮团队面试,因为我们这边主要是 focuse 在 AI 编译栈以及更偏底层一些的算子实现方面的工作,在面一些编译方向的候选人时,我这边最后一关通常是让他们写一个高效的矩阵乘的实现。 然后结果一直都没有遇到能写出来让我觉得还可以的人…唉,是我要求的太高了吗?

sunjiweiswift commented 2 years ago

针对59这种质数,使用sve vla会不会有较好的效果

jcf94 commented 2 years ago

@sunjiweiswift 针对59这种质数,使用sve vla会不会有较好的效果

赞,虽然我没实际了解过 VLA 是怎么实现的,不过至少从功能描述上看 ARM 已经想到了从硬件上直接解决这种不规则长度向量化的问题了,我觉得肯定是比啥都不做要效果更好的。

sunjiweiswift commented 2 years ago

想咨询一下,在调试TIR的时候,会不停的递归调用VisitStmt。通过Python运行,gdb attach到libtvm.so。用起来很不方便。请教下 有其他的便捷的方法么

feihugis commented 1 year ago

@sunjiweiswift 想咨询一下,在调试TIR的时候,会不停的递归调用VisitStmt。通过Python运行,gdb attach到libtvm.so。用起来很不方便。请教下 有其他的便捷的方法么

可以试试? gdb --args python ....