原创 Airflow 配置celery+rabbitmq和celery+redis

Airflow 配置celery+rabbitmq 1、安裝celery和rabbitmq組件 pip3 install apache-airflow[celery] pip3 install apache-airflow[rabbi

原创 CentOS7安裝Airflow

實驗環境: centos7 python3.6 安裝配置: 1.看看是否有gcc,沒有的話需要進行安裝: yum install gcc  (後續安裝airflow如果不成功,可以再次執行,它會更新包)【這個很重要哦】 2.安裝腳本和依賴

原创 Amabari-server start錯誤:Table 'ambari.metainfo' doesn't exist

最近在搭建Amabari大數據集羣,過程中也是幾經挫折,這裏主要來講一下amabari-start過程中的Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorExcepti

原创 微服務概述

原文鏈接:https://blog.csdn.net/Soinice/article/details/83989225 本文是我在學習微服務時看的其他博主介紹的一篇概念文章,覺得寫得非常清晰全

原创 Python如何import其它.py文件及其函數

如上圖所示,我想在test_1.py文件中import我在lstm_1.py中定義的LstmParam和 LstmNetwork。我直接採用的是最簡單的引用方法:from lstm_1 import LstmParam, LstmNet

原创 ERROR 1819 (HY000): Your password does not satisfy the current policy requirements

轉自:https://www.cnblogs.com/ivictor/p/5142809.html 爲了加強安全性,MySQL5.7爲root用戶隨機生成了一個密碼,在error log中,關於error log的位置,如果安裝的是RPM

原创 Hadoop完全分佈式環境下,DataNode進程正常啓動,但是網頁上不顯示DataNode節點

Hadoop完全分佈式環境下,上傳文件到hdfs上時報錯: 19/05/15 11:03:12 WARN hdfs.DFSClient: DataStreamer Exception org.apache.hadoop.ipc.Remo

原创 CentOS7安裝MySQL

1.安裝依賴 yum search libaio           #檢索是否有對應庫 yum install -y libaio        #安裝依賴包 2.檢查MySQL是否已經安裝 yum installed | gre

原创 VMware安裝CentOS7的詳細過程

原文:https://www.jianshu.com/p/ce08cdbc4ddb?utm_source=tuicool&utm_medium=referral   本篇文章主要介紹了VMware安裝Centos7超詳細過程(圖文),具有

原创 Spark-Streaming實時數據分析

  1.Spark Streaming功能介紹 1)定義 Spark Streaming is an extension of the core Spark API that enables scalable, high-throughp

原创 Spark-HBase集成錯誤之 java.lang.NoClassDefFoundError: org/htrace/Trace

在進行Spark與HBase 集成的過程中遇到以下問題: java.lang.IllegalArgumentException: Error while instantiating 'org.apache.spark.sql.hive.

原创 Spark SQL快速離線數據分析

  1.Spark SQL概述 1)Spark SQL是Spark核心功能的一部分,是在2014年4月份Spark1.0版本時發佈的。 2)Spark SQL可以直接運行SQL或者HiveQL語句 3)BI工具通過JDBC連接Spar

原创 Spark2.X集羣運行模式

  1.幾種運行模式介紹 Spark幾種運行模式: 1)Local 2)Standalone(Spark自己的集羣管理) 3)Yarn 4)Mesos(Spark初期支持) 下載IDEA並安裝,可以百度一下免費文檔。 2.spark St

原创 Spark on Yarn運行錯誤:Yarn application has already ended! It might have been killed or unable to launch

Spark on Yarn模式運行錯誤: bin/spark-shell --master yarn --deploy-mode client #報錯 查看8088頁面上的工作日誌 錯誤原因:在執行任務時檢測到虛擬機的內存太小,2.

原创 基於IDEA環境下的Spark2.X程序開發

  1.Windows開發環境配置與安裝 下載IDEA並安裝,可以百度一下免費文檔。 2.IDEA Maven工程創建與配置 1)配置maven 2)新建Project項目 3)選擇maven骨架 4)創建項目名稱 5)選擇