Я новичок в использовании python, поэтому простите, если вопрос звучит банально. Если у меня есть RDD:
[(((1, 0), 0.0), (2, 0)),
(((1, 0), 0.0), (3, 0)),
(((2, 0), -0.0), (1, 0)),
(((2, 0), -0.0), (3, 0)),
(((3, 0), -0.0), (1, 0)),
(((3, 0), -0.0), (2, 0))]
Я хочу объединить значения, имеющие общий ключ. Так что в основном мой вывод должен быть-
[(((1, 0), 0.0), [(2, 0),(3,0)])
(((2, 0), -0.0), [(1, 0),(3,0)])
(((3, 0), -0.0), [(1, 0),(2,0)])]
Я пытался использовать groupByKey()
, но так и не смог найти решение. Любая помощь будет признательна. Спасибо.
Это должно помочь:
rdd.groupByKey().mapValues(list).collect()
А можно принимать ответ?