原创 springboot優雅結合redis
Redis和springboot 整合redisUtil類 Springboot整合redis(一般人都能看懂的Lettuce版本)
原创 scrapy爬取抖音視頻
# -*- coding: utf-8 -*- import scrapy from douyin.items import DouyinItem import json import jsonpath # jsonpath是用來方便
原创 Flink計算最熱門TopN商品
爲了統計每個窗口下最熱門的商品,我們需要再次按窗口進行分組,這裏根據ItemViewCount中的windowEnd進行keyBy()操作。然後使用ProcessFunction實現一個自定義的TopN函數TopNHotItems來計算點
原创 kafka 自定義存儲offset 到mysql中
kafka0.9版本之前,offset存儲在zookeeper,0.9版本以及之後,默認offset存儲在kafka的一個內置的topic中。除此之外,kafka還可以選擇自定義存儲offset。 offset的維護是相當繁瑣的,因爲需要
原创 scrapy爬取京東的數據
import scrapy from scrapy import Field class JdItem(scrapy.Item): # define the fields for your item here like:
原创 sparkStreaming 實現kafka offset自定義保存
KafkaUtils.createDirectStream 區別Receiver接收數據,這種方式定期地從kafka的topic+partition中查詢最新的偏移量,再根據偏移量範圍在每個batch裏面處理數據,使用的是kafka的簡單
原创 Flink源碼閱讀(1.7.2)
https://www.cnblogs.com/code2one/p/10574873.html
原创 scrapy 爬取前程無憂讓找工作變得輕而易舉
# -*- coding: utf-8 -*- import scrapy from qcwy.items import QcwyItem from urllib import parse import re class A51jo
原创 搜狗微信採集
10月29日搜狗微信改版了,無法通過搜索公衆號名字獲取對應文章了,不過通過搜索主題獲取對應文章還是可以的 目的:獲取搜狗微信中搜索主題返回的文章。 涉及反爬機制:cookie設置,js加密。 按照正常的採集流程,此時按F12打開瀏
原创 Hibernate(JPA)註解大全
@Entity(name=”EntityName”) 必須,name爲可選,對應數據庫中一的個表 @Table(name=””,catalog=””,schema=””) 可選,通常和@Entity配合使用,只能標註在實體的cl
原创 JPA的事務註解@Transactional總結
@Transactional事務使用總結: 異常在A方法內拋出,則A方法就得加註解 多個方法嵌套調用,如果都有 @Transactional 註解,則產生事務傳遞,需要 Propagation.REQUIRED 如果註解上只寫 @Tra
原创 ScalikeJDBC
Just write SQL and get things done! ScalikeJDBC is a tidy SQL-based DB access library for Scala that naturally wraps JD
原创 SpringBoot-Quartz
SpringBoot整合Quartz作爲調度中心使用完整實例 https://github.com/EalenXie/SpringBoot-Quartz#springboot%E6%95%B4%E5%90%88quartz%E4%BD%9
原创 全面瞭解監控知識體系
前言介紹 監控是整個運維乃至整個產品生命週期中最重要的一環,事前及時預警發現故障,事後提供詳實的數據用於追查定位問題。 目前業界有很多不錯的開源產品可供選擇。選擇一款開源的監控系統,是一個省時省力,效率最高的方案。當然對監控不是很明白的朋
原创 HBase 中加鹽(Salting)之後的表如何讀取:協處理器篇
在 《HBase Rowkey 設計指南》 文章中,我們介紹了避免數據熱點的三種比較常見方法: 加鹽 - Salting 哈希 - Hashing 反轉 - Reversing 其中在加鹽(Salting)的方法裏面是這麼描述的:給 Ro