原创 python通過thrift連接hive,異步執行查詢

在開始之前,我們需要具備一些基礎知識: 什麼是hive? hive是基於Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,並提供完整的sql查詢功能,可以將sql語句轉換爲MapReduce任務進行運行。 hi

原创 HTTP 連接建立方式

當我們在瀏覽一個web頁面時,頁面裏的元素可能是來自於多個源的,例如每張圖片有各自的來源。我們在瀏覽一個擁有2張圖片的web頁面時,瀏覽器需要發起3個HTTP事務,一個用於獲取頂層HTML頁面元素,另兩個獲取相對應的圖片。 串行連接 如果

原创 HTTP 報文頭 初解

在 HTTP報文 一章中,我們介紹了HTTP協議由 行、頭、體組成。而本章,介紹 “頭” 如果你寫了一個小爬蟲,但抓出來的結果和想象的不同(例如界面樣式,返回內容和人工看有差異,或者是需要登錄),你可以更改你發送的HTTP請求的head

原创 360搜索在微服務架構下的技術平臺實踐(一) -- 單體架構

單體架構 單體架構是最常見的架構方式,將所有功能、業務邏輯都放在一個web容器中,成爲一個應用。這就是我們常說的單體架構。 例如,我們有一個小型商城系統,那麼如下圖所示: 在這裏,我們將所有的功能都放在一個web容器中,例如訂單管理、商

原创 Mysql 事務隔離級別、InnoDB實現隔離機制

當多個線程都開啓事務操作數據庫中的數據時,數據庫系統要能進行隔離操作,以保證各個線程獲取數據的準確性。 隔離級別 在SQL標準中定義了四種隔離級別,每一種級別都規定了一個事務中所做的修改,在事務內和事務間的可見性。較低級別的隔離通常可以

原创 HTTP 延時

HTTP性能優化一直是個十分重要的話題,但要進行優化,首先得找出有哪些地方會導致HTTP延時。 HTTP 請求過程 在HTTP請求傳輸的過程中,會經歷這樣的場景和可能遇見如下的問題: 1 . 用戶輸入或打開一個地址,client查找本地h

原创 Url 初步介紹

基礎背景: URI: uri(Uniform Resource Identifier) 是統一資源標識符,就像互聯網上的地址一樣,在世界範圍內唯一標識並定位資源 URL: url是uri最常見的形式,URL描述了一臺特定服務器上某資

原创 HTTP 狀態碼

HTTP的狀態碼被分爲了5大類,分別是: 1xx : Hold on (等着) 2xx : Here you go (執行完了,沒毛病,拿着結果回去吧) 3xx : Go away (你要的不在我這兒,去別處找) 4xx : You fu

原创 Mysql分區表 介紹和使用

試想這樣一個場景: 你有一張表,存儲引擎爲InnoDB,裏面存儲的數據量達到了上億級別。 此時,因爲數據量巨大,肯定不能在每次查詢的時候都掃描全表。 就算是使用索引(B-Tree),除非使用索引覆蓋查詢,否則數據庫服務器需要

原创 HTTP 報文詳解

報文的組成部分 HTTP報文 由起始行、首部、主體組成。 1、 起始行: 起始行是一個由行分隔的ASCII文本,每行都以一個由兩個字符組成的行終止符作爲結束,行終止符爲 一個回車符 + 一個換行符,可以寫作CRLF 2、 首部: 首