Spark 的 GraphX组件用于图并行性和数据并行计算,它建立在一个称为"图论" 的数学分支上。它是位于Spark核心之上的分布式图处理框架。GraphX为大型数据集的图带来并行、迭代处理的速度和可伸缩性。 GraphX API虽然很棒,但是存在一些限制。首先,它们只适用于Scala; 第二个 限制是它们只能在RDD(弹性分布式数据集)上工作,Spark GraphFrame提供了一个声明性API,可用于大型图上的交互式查询和独 立程序。GraphFrame API中的主要编程抽象是一个GraphFrame。 Spark GraphFrame支持分布式属性图的图计算。
【Spark】GraphFrame
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
Spark history UI历史监控构建
fct2001140269
2020-07-07 00:27:52
大数据组件监控体系构建
fct2001140269
2020-07-07 00:27:52
Hadoop RPC初探
鸣宇淳
2020-07-04 13:42:15
Spark葵花宝典:一小时速成Spark
爱编程的小和尚
2020-07-03 21:53:52
spark之MLlib机器学习-Kmeans
_飞奔的蜗牛_
2020-07-03 07:42:46
hadoop数据上传hdfs出错
_飞奔的蜗牛_
2020-07-03 07:42:36
【HBase】从MiniBase学LSM算法
pierre94
2020-06-27 09:27:26
HBase学习提纲:助你一臂之力
爱编程的小和尚
2020-06-26 11:03:11
Zookeeper学习提纲:助你一臂之力
爱编程的小和尚
2020-06-26 11:03:10
impala drop删除表注意问题
Sin_Geek
2020-06-26 03:06:44
hive函数to_unix_timestamp与unix_timestamp效率问题
可怕,hive版本1.2.1,實踐中發現,to_unix_timestamp比unix_timestamp函數快幾十甚至上百倍!!!
Sin_Geek
2020-06-26 03:06:44
hive where过滤条件中数值比较注意问题
Sin_Geek
2020-06-26 03:06:44
hive的between-and问题
Sin_Geek
2020-06-26 03:06:44
HIVE decimal类型溢出问题
Sin_Geek
2020-06-26 03:06:44