GraphX對edgelist文件格式的要求

前陣子踩過的一個坑,發朋友圈了,轉過來記錄一下。

是關於GraphX讀取edgelist文件失敗的問題,報invalid line錯誤。後來從《Spark GraphX圖計算核心源碼分析【圖構建器、頂點、邊】》查到,GraphX能識別的edgelist文件的格式,兩列之間用一個或多個空格分隔,而不能是用逗號分隔的csv。如下圖所示。973GB的文件再處理一遍我找誰說理去。。。。。

在這裏插入圖片描述

發佈了171 篇原創文章 · 獲贊 2 · 訪問量 25萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章