原创 【MySQL】CentOS7安裝MySQL7並更改初始化密碼

1、官方安裝文檔 http://dev.mysql.com/doc/mysql-yum-repo-quick-guide/en/ 2、下載 Mysql yum包 http://dev.mysql.com/downloads/repo/yu

原创 【網絡營銷】CPA、CPS、CPM、CPT、CPC 是什麼

【原文鏈接】https://www.a-edm.com/cpa.html   網絡營銷之所以越來越受到重視一個主要的原因就是因爲“精準”。相比較傳統媒體的陳舊廣告形式,網絡營銷能爲廣告主帶來更爲確切的效果與回報,更有傳統媒體所沒有的即時互

原创 【SQL】SELECT col, COUNT(DISTINCT other_col) FROM tab GROUP BY col的兩種寫法

To count distinct values inside of a GROUP BY, use the following. SELECT col, COUNT(DISTINCT other_col) FROM tab GROUP

原创 【Shell】別把&和nohup混爲一談, 根本不是同一個東西好不好 ------ 聊聊./a.out & , nohut ./a.out , nohup ./a.out &的區別

【原文鏈接】https://blog.csdn.net/stpeace/article/details/76389073   在第一家公司工作的時候, 我認識了&,在第二家公司工作的時候, 我認識了nohup, 這就是淵源。 隨後, 我就

原创 【產品】推薦系統的冷啓動和評論推薦

【原文鏈接】http://www.woshipm.com/pd/818285.html   推薦系統的冷啓動 本篇文章是寫給產品經理看的,所以說,我們不討論算法,只說方法。 冷啓動在整個推薦系統中,是一個非常重要而又非常難的一件事情,推薦

原创 【爬蟲】Scrapy Item Pipeline

【原文鏈接】https://doc.scrapy.org/en/latest/topics/item-pipeline.html   爬蟲爬取了一個 item 後, 它會被髮送到 Item Pipeline, which 通過好幾個組件

原创 【爬蟲】Scrapy 中利用 XPath 丟棄所有跟 footer 相關的內容

【前言】利用 Scrapy 爬取網站文字的時候發現,footer 中的 Copyright 等文字會影響後續分詞的效果,因此決定將網頁的 HTML 中有關 footer 的內容都丟棄。以下是不排除 footer 中內容的時候拿到網頁的所有

原创 【基礎知識】深拷貝和淺拷貝的區別是什麼?

【原文鏈接】https://stackoverflow.com/questions/184710/what-is-the-difference-between-a-deep-copy-and-a-shallow-copy Shallow

原创 【特徵工程】機器學習中離散型特徵的處理 —— 獨熱碼 (one-hot)

【原文鏈接】https://www.cnblogs.com/daguankele/p/6595470.html   1、什麼是獨熱碼   獨熱碼,在英文文獻中稱做 one-hot code, 直觀來說就是有多少個狀態就有多少比特,而且只有

原创 【爬蟲】Scrapy Feed Exports

【原文鏈接】https://doc.scrapy.org/en/latest/topics/feed-exports.html#topics-feed-exports   Feed exports New in version 0.10.

原创 【爬蟲】Python Scrapy 基礎概念 —— 請求和響應

【原文鏈接】https://doc.scrapy.org/en/latest/topics/request-response.html   Scrapy uses Request and Response 對象來爬網頁. Typicall

原创 【XPath】語法、Axes、操作符

【原文鏈接】https://www.w3schools.com/xml/xpath_syntax.asp   XPath Syntax XPath uses path expressions to select nodes or node

原创 【爬蟲】Scrapy 爬取excel中500個網址首頁,使用Selenium模仿用戶瀏覽器訪問,將網頁title、url、文本內容組成的item保存至json文件

創建含有網址首頁的excel文件 host_tag_網站名稱_主域名_子域名.xlsx 編輯讀取excel文件的工具類項目FileUtils 新建項目FileUtils 編輯file_utils.py # -*- coding: u

原创 【爬蟲】Python Scrapy 教程

【原文鏈接】https://doc.scrapy.org/en/latest/intro/tutorial.html In this tutorial, we’ll assume that Scrapy is already instal

原创 【爬蟲】Scrapy Item

【原文鏈接】https://doc.scrapy.org/en/latest/topics/items.html   Items The main goal in scraping is to extract structured dat