Open MuGuo opened 5 years ago
你好, 我只是把从文件读取的数据,转换到从hive表中数据并且数据量变大,由于数据格式不一样,我做了一部分处理,并不影响算法准确性。算法准确性主要依赖于你的 iter,lr,window,p,q等参数。
郭艳燕 notifications@github.com 于2019年6月24日周一 上午11:34写道:
po主的代码十分精妙,但是其中有一些不通用的代码例如“ usersFiles : String="select phone_no from xyqb.user ",”以及Node2Vec.scala中的getUsers()部分代码,如果删除是否对算法的正确性有影响呢?我主要注释了以上部分,和Node2Vec.scala中的indexedNodes = indexedNodes.join(users).filter(x =>x._2._2==1).map(x =>(x._1,x._2. 1)).filter(._2.neighbors.length>0).repartition(2000).cache 恳请回复十分感激
— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/warmdog/node2vec_revised/issues/1?email_source=notifications&email_token=ACYTJP4NCOWOX35MZUAST6TP4A6CDA5CNFSM4H22VQWKYY3PNVWWK3TUL52HS4DFUVEXG43VMWVGG33NNVSW45C7NFSM4G3GA2SA, or mute the thread https://github.com/notifications/unsubscribe-auth/ACYTJP2QDJTRXYJN5B5HDSTP4A6CDANCNFSM4H22VQWA .
po主的代码十分精妙,但是其中有一些不通用的代码例如“ usersFiles : String="select phone_no from xyqb.user ",”以及Node2Vec.scala中的getUsers()部分代码,如果删除是否对算法的正确性有影响呢?我主要注释了以上部分,和Node2Vec.scala中的indexedNodes = indexedNodes.join(users).filter(x =>x._2._2==1).map(x =>(x._1,x._2.1)).filter(._2.neighbors.length>0).repartition(2000).cache 恳请回复~十分感激~