Closed fhyme closed 7 years ago
@fhyme 你需要的是 enumerate 吗?
def enumerate(self):
"""
enumerate this RDD.
>>> dpark.parallelize(["a", "b", "c", "d"], 3).enumerate().collect()
[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd')]
"""
@zzl0 原来有enumerate,多谢多谢,没有注意到
通过textFile创建rdd,文件中的每一行是一个document,现在需要进行分词、转vector等,怎么样给每一行自动添加一个行号,跟其在text file中的对应行号一致