原创 Streaming-kafka-mysql (scalikejdbc)
package kafka import java.sql.DriverManager import com.typesafe.config.ConfigFactory import org.apache.kafka.common.
原创 關於git的ssh免密步驟
1.打開安裝好的見客戶端 2.點擊Help,選中Show SSH Key 生成免密登錄密碼 3.打開git項目網頁,找到SSH Keys 4.將生成的免密登錄密碼粘貼到git網頁 5.用IDEA直接拉取數據
原创 利用sqoop將存入在HDFS上的數據導入到MySQL中
首先要在mysql中創建表 執行導出的命令: bin/sqoop export \ --connect jdbc:mysql://localhost:3306/庫名 \
原创 SQL的存儲過程
使用存儲過程: 存儲過程可以改變SQL語句的運行性能,提高執行效率;還可以作爲一種安全機制,使用戶通過它來訪問未被授權的表和視圖。存儲過程包括的創建、執行、查看、修改和刪除 概念:存儲過程是一組預先編譯好的Tr
原创 Python學習第二天(if 與while)
if語句: 格式如下: if 要判斷的條件: 條件成立時,要做的事情 ... else:
原创 Python入門
註釋: 單行註釋 # (爲了保持格式規範,在#號後面加一個空格) 多行註釋 """ """ 1.計算機的三大件: cpu:中央處理器,是一塊超大規模的集成電路 負責
原创 sql開發注意點
1.在postgre中數據類型的轉換: String =》text double =》double precision 2.在postgre中給表及字段添加註釋: comment on table 表名 is ' ' ;給表添加註釋 c
原创 tableau數據可視化工具
教程地址 https://www.tableau.com/zh-cn/learn/training https://mp.weixin.qq.com/s/E547hfDXV_w78O0d9qKBYg 維度&度量是什麼? 維度:用來對數據進
原创 新方式分析JSON(三範式)---
package Batch2 import org.apache.spark.sql.types._ import org.apache.spark.sql.{DataFrame, Dataset, SQLContext} imp
原创 三範式(面向對象,面向過程,面向函數)
package Batch2 import org.apache.spark.sql.types._ import org.apache.spark.{SparkConf, SparkContext} import org.apach
原创 關於IDEA中maven項目無法new scala類的問題
點擊File 進入到Project Structure 手動添加scala即可
原创 zeroMq的使用
ZeroMQ簡介: ZeroMQ是一種基於消息隊列的多線程網絡庫.提供跨越多種傳輸協議(TCP:傳輸控制協議,當傳輸出現錯誤時,能自動予以糾正;UDP:用戶數據包協議,當傳輸出現錯誤時會將錯誤信息丟棄;)的套接字,ZeroMQ是一個可伸縮
原创 ALS算法(推薦系統)
測試數據 用戶ID,物品ID,評分 1,101,5.0 1,102,3.0 1,103,2.5 2,101,2.0 2,102,2.5 2,103,5.0 2,104,2.0 3,101,2.5 3,104,4.0 3,105,4.5
原创 MongoDB入門
卸載:https://blog.csdn.net/benben_2015/article/details/83065478 最新版MongoDB支持事務 : https://docs.mongodb.com/manual/core/tra
原创 spark-mongoDB的Api
導入依賴 <dependency> <groupId>org.mongodb.spark</groupId> <artifactId>mongo-spark-connector_2.11<