原创 Flink【優質】面試題摘錄

一、概念和基礎篇 1. 簡單介紹一下Flink  Flink核心是一個流式的數據流執行引擎,其針對數據流的分佈式計算提供了數據分佈、數據通信以及容錯機制等功能。基於流執行引擎,Flink提供了諸多更高抽象層的API以便用戶編寫分佈式任務

原创 LayUI前端開發實戰記錄

一、使用彈出框完成頁面遮罩 layer.msg('加載中......', {icon: 16, shade: [0.5, '#f5f5f5'], scrollbar: false, offset: 'auto', time: 2000}

原创 Clickhouse實戰筆記

一、數據刪除 ALTER TABLE  table_name  DELETE where date = '2020-01-08' 二、行轉列   三、REPLACE() 對字段內容進行替換 select  REPLACE('7654

原创 GItHub:【大數據實戰項目】彙總

一、Spark 1、《Spark 大型電商項目實戰》 * 用戶訪問session分析 * 頁面單跳轉化率統計 * 熱門商品離線統計 博客地址:http://blog.csdn.net/u012318074/article/category

原创 GitHub:TensorFlow

一、FlinkML/flink-tensorflow flink-tensorflow - TensorFlow support for Apache Flink https://github.com/FlinkML/flink-tens

原创 機器學習競賽彙總

一、競賽|數據競賽Top解決方案開源整理 https://mp.weixin.qq.com/s/_4QG0dWhh784lF0n1wymcw   二、覆盤所有NLP比賽的TOP方案 https://github.com/zhpmatrix

原创 文本分類機器學習算法摘記

一、 KMeans的優劣 優點:     1.是解決聚類問題的一種經典算法,簡單、快速     2.對處理大數據集,該算法保持可伸縮性和高效率     3.當結果簇是密集的,它的效果較好 缺點     1.必須事先給出k(要生成的簇的數目

原创 GitHub:大數據生態架構【源碼解讀】彙總(按照GitHub的star排倒序)

一、Spark源碼系列   1、酷玩 Spark: Spark 源代碼解析、Spark 類庫等 https://github.com/lw-lin/CoolplaySpark 2、Spark源碼剖析 https://github.com/

原创 SQL:查詢每科目前三名學生及分數

一、創建得分表 -- 創建student_score表 CREATE TABLE student_score(     name varchar(20),     subject varchar(20),     score int )

原创 GitHub:NLP學習

一、fighting41love/funNLP NLP民工的樂園: 幾乎最全的中文NLP資源庫 詞庫 工具包 學習資料 https://github.com/fighting41love/funNLP   二、nlpinaction/le

原创 GitHub: ML/AI/DL collection

一、hoya012/deep_learning_object_detection Description:A paper list of object detection using deep learning. https://gith

原创 Mahout用戶推薦 學習筆記

一、 Mahout推薦的推薦系統引擎是模塊化的,分爲5個主要部分組成:數據模型,相似度算法,近鄰算法,推薦算法,算法評分器。 二、 選擇UserCF,ItemCF,SlopeOne的 3種推薦算法,進行7種組合的測試。  userCF1

原创 GitHub:機器學習彙總

一、劉建平博客機器學習配套GitHub代碼 博客: http://cnblogs.com/pinard GitHub:https://github.com/ljpzzz/machinelearning 點贊 收藏

原创 Scala學習筆記:重要知識點摘記

一、Scala基礎語法     1. Scala 中使用 val 語句可以定義函數,def 語句定義方法。   2. Scala是面向行的語言, 語句末尾的分號 ; 是可選的。   3. Scala沒有java中的原生類型   4. Sc

原创 機器學習:學術論文的來源

1.GitHub上開源代碼標註引用的論文; NeuRec/evaluation/Evaluate.py https://github.com/wubinzzu/NeuRec/blob/948aa1131b0f3dfd99b4d0d0d9e