Open zhangtao22 opened 6 years ago
what is your gcc version and python version?
中间有两个编译依赖错误,我都解决了,最后编译出来了,报了一个这个错误 tensorflow.python.framework.errors_impl.NotFoundError: /home/zhangtao/work/InceptText-Tensorflow/lib/deform_conv_layer/deform_conv.so: undefined symbol: _ZN10tensorflow8internal21CheckOpMessageBuilder9NewStringB5cxx11Ev
just follow this one CharlesShang/TFFRCNN#108
我这边是gcc5,是把下边注释打开,把上边注释掉是吧,Python是2.7
g++ -std=c++11 -shared -o roi_pooling.so roi_pooling_op.cc \ roi_pooling_op.cu.o -I $TF_INC -I $NSYNC_INC -fPIC -D GOOGLE_CUDA -lcudart -L $CUDA_HOM E/lib64 -L $TF_LIB -ltensorflow_framework -D_GLIBCXX_USE_CXX11_ABI=0
yes,have a try
试了,把所有gcc5打开,上边的注释掉,还是这个错误tensorflow.python.framework.errors_impl.NotFoundError: /home/zhangtao/work/InceptText-Tensorflow/lib/deform_conv_layer/deform_conv.so: undefined symbol: _ZN10tensorflow8internal21CheckOpMessageBuilder9NewStringB5cxx11Ev
follow this One https://github.com/Zardinality/TF_Deformable_Net
感觉除了降gcc g++版本没有其他办法了
@zhangtao22 请问除了去gcc5相关掉注释,还用改其他值吗?我报错跟你不一样。
4 errors detected in the compilation of "/tmp/tmpxft_00005a43_000000007_deform_psroi_pooling_op_gpu.cu.cpp1.ii". g++: error: deform_psroi_pooling_op.cu.o: No such file or directory
undefined symbol: _ZTIN10tensorflow8OpKernelE**
你这个问题我没有遇到过啊
好吧,谢谢。
have you solved your problem when change the gcc version @zhangtao22
@xieyufei1993 没有
the error is what?
还是解决不了啊
我都按照github上面的答案,试了个遍,没解决。
@ccnankai 你也是用的gcc5嘛?
我现在用虚拟机里面gcc4.9编译出来的deform_psroi_pooling.so替换了原来的同名库,还是有这个错误 undefined symbol: _ZTIN10tensorflow8OpKernelE
@zhangtao22 4.9 5.4 我都用了,不行。服了
try this One I also meet this error before
@xieyufei1993 Thank you for your advice . use the command pip install tensorflow-gpu==1.3 or compile tensorflow source code ?
just use the command pip install tensorflow-gpu==1.3
I just come back to class, thank you for your advice .
我执行了pip install tensorflow-gpu==1.3.0 --user,然后进入lib文件夹下make,出现/usr/bin/ld: cannot find -ltensorflow_framework
@zhangtao22 设这个问题。各种我都试了 跑不起来 问题出在 “nvcc -std=c++11 -c -o deform_psroi_pooling_op.cu.o deform_psroi_pooling_op_gpu.cu.cc -I $TF_INC -D GOOGLE_CUDA=1 -x cu -Xcompiler -fPIC -D GOOGLE_CUDA -arch=$ARCH“” 不能生成deform_psroi_pooling_op.cu.o 弄了好多天 ,哎
@ccnankai 你解决了吗?怎么解决的?
@zhangtao22 没解决 ,所有环境我都试了,换了机器都不行,只编译通过TFFRCNN 我没查到解决方法。
@zhangtao22 这篇论文泛化能力强吗?能检测较长的文字行吗? 效果不咋样的话,我就放弃了
@ccnankai 应该可以吧,我还没有试。你现在gcc,g++,tensorflow都是什么版本,什么问题
@zhangtao22 好像跟g++版本没什么关系 tensorflow 1.0 1.3 1.4 1.11我都试了 都是can't find deform_psroi_pooling_op.cu.o 你这个问题 /usr/bin/ld: cannot find -ltensorflow_framework 1.4以上版本就没有了
@ccnankai 是的啊,我用tensorflow-gpu==1.3.0就有这个问题,你用的tensorflow是哪个版本?出现过我这个问题嘛?是怎么解决的
@ccnankai 我用tf-gpu 1.4没有出现你说这个问题
@ccnankai cuda是8,cudnn是6,这两我一直没有换过
@ccnankai 作者不是让你换tf-gpu 1.3嘛
我用tensorflow1.3也有这个问题,TF_Deformable_Net 上面要求1.4
我换了1.3之后也有 can't find deform_psroi_pooling_op.cu.o 我现在重新在docker 上跑下, 环境都搞乱了。
@ccnankai 你用1.3的时候我那个cannot find -ltensorflow_framework你是咋解决的啊?
@ccnankai 谢谢
@xieyufei1993 你用的tensorflow-gpu,cuda,还有gcc,g++都是什么版本啊
tensorflow_gpu==1.3 cuda8.0 gcc4.9
@zhangtao22 我编译通过了,然后各种问题
@xieyufei1993 你好,请问inceptext效果怎么样啊?能定位长的文字吗? 你那儿有效果图吗?
@zhangtao22 @ccnankai 请问你们解决了吗?我编译时没有报错,train 时报Traceback (most recent call last): File "train_main.py", line 19, in <module> import model File "/data1/users/elag/github/InceptText-Tensorflow/model.py", line 11, in <module> from lib.deform_conv_layer.deform_conv_op import deform_conv_op File "/data1/users/elag/github/InceptText-Tensorflow/lib/deform_conv_layer/deform_conv_op.py", line 8, in <module> _deform_conv_module = tf.load_op_library(filename) File "/home/elag/.virtualenvs/py35env/lib/python3.5/site-packages/tensorflow/python/framework/load_library.py", line 56, in load_op_library lib_handle = py_tf.TF_LoadLibrary(library_filename, status) File "/home/elag/.virtualenvs/py35env/lib/python3.5/site-packages/tensorflow/python/framework/errors_impl.py", line 473, in __exit__ c_api.TF_GetCode(self.status.status)) tensorflow.python.framework.errors_impl.NotFoundError: /data1/users/elag/github/InceptText-Tensorflow/lib/deform_conv_layer/deform_conv.so: undefined symbol: _ZN10tensorflow8internal21CheckOpMessageBuilder9NewStringB5cxx11Ev
/python2.7/site-packages/tensorflow/include/unsupported/Eigen/CXX11/../../../Eigen/src/Core/MathFunctions.h(1265): warning: calling a constexpr host function("real") from a host device function("abs") is not allowed. The experimental flag '--expt-relaxed-constexpr' can be used to allow this lib/python2.7/site-packages/tensorflow/include/unsupported/Eigen/CXX11/../../../Eigen/src/Core/MathFunctions.h(1270): warning: calling a constexpr host function("real") from a host device function("abs") is not allowed. The experimental flag '--expt-relaxed-constexpr' can be used to allow this. why?