［日誌分析］在nginx日誌中，提取有效的request uri

原創

Lesley dude

2020-02-26 04:14

最近在做公司的nginx log分析，其中一個需求是提取這個月每天被訪問Top10的頁面，及其訪問量。

做這個需求，首先要清洗出有效的頁面訪問。我採用排除法，去掉 .js .css之類的訪問。但最初，我並不能全面的瞭解要去掉帶有哪些後綴的request。

經過清洗 -> 抽樣 -> 清洗 -> 抽樣 -> 清洗，最終需要過濾掉含有下列後綴的uri

.js .css . gif .jpeg .jpg .png .ico .txt .swf .xml .JPEG .PNG .JPG

#python代碼：
if re.search(r"(\.js|\.css|\.gif|\.jpe?g|\.png|\.ico|\.txt|\.swf|\.JPE?G|\.PNG|\.xml)", request[1]):
        continue

不同公司的日誌可能存在一些特殊情況，這還需要抽樣分析

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

php7.4編譯

wget https://www.php.net/distributions/php-7.4.33.tar.gz ./configure --prefix=/usr/local/php7.4 --with-openssl --with-

charley158

2024-04-28 23:51:42

從零開始學架構V2-架構設計流程-2

一、架構設計流程架構的設計的是爲了降低整體的複雜性，那麼架構設計的第一步就是熟悉業務，識別其中的核心訴求，僅考慮技術的話就是識別複雜度。 1.1 識別複雜度架構的複雜度主要來源於第一節中介紹的“高性能”“高可用”“可擴展”等幾個方面，實

原創

2024-04-25 23:56:26

從零開始學架構V2-初識架構設計-1

一、架構設計的主要目的爲了解決軟件系統複雜度帶來的問題二、複雜性來源軟件的架構設計是一個非常複雜的過程；基於業務&技術現狀、公司成本、團隊規模、團隊技術能力、近三年業務發展規模預測、技術發展趨勢等條件篩選出合適的技術、編寫多種架構設計

原創

2024-04-25 23:56:25

1 名工程師輕鬆管理 20 個工作流，創業企業用 Serverless 讓數據處理流程提效

作者：嶽洋、陳德全、劉靜娜北京語勢科技有限公司成立於 2023 年 6 月，語勢科技定位爲“智能投資時代的主題入口”，在資管行業從以機構爲核心轉向以用戶爲核心的變革時代，通過打造主題投資引擎，賦能普惠投資一體化，打造以投資者和資管機構爲主

原創

2024-04-28 21:12:22

11個Python循環技巧

本文分享自華爲雲社區《Python中的循環技巧指南》，作者：檸檬味擁抱。當我們處理數據時，有時候需要創建多個列表以存儲不同類型或不同條件下的數據。在Python中，我們可以利用循環來快速、高效地創建這些列表。本文將介紹如何使用循環在Pyt

原創

2024-04-28 10:33:08

實踐探討Python如何進行異常處理與日誌記錄

本文分享自華爲雲社區《Python異常處理與日誌記錄構建穩健可靠的應用》，作者：檸檬味擁抱。異常處理和日誌記錄是編寫可靠且易於維護的軟件應用程序中至關重要的組成部分。Python提供了強大的異常處理機制和靈活的日誌記錄功能，使開發人員能夠

原創

2024-04-25 22:33:43

西安站開營！AI 編碼助手通義靈碼幫大學生“整活兒”

如何更好地與 AI 爲伴，做時代的先進開發者？4 月 17 日，阿里雲推出的 AI 編程助手通義靈碼與雲工開物“高校訓練營”走進西安多所高校開啓實操培訓，結合 AI 輔助編程的發展背景、通義靈碼的具體能力和應用實操，幫助在校大學生了解人工智

原創

2024-04-24 21:12:06

Google Chrome驅動程序 124.0.6367.62（正式版本）去哪下載？

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【Jethro Shen】問了一個Python谷歌驅動下載的問題。二、實現過程這裏【Kim】和【Crazy】給了一個指導，如上圖所示。說來奇怪，在鏈接中看了沒有

原創

2024-04-24 09:48:52

高效率Python開發工具PyCharm v2024.1——更新AI Assistant功能

JetBrains PyCharm是一種Python IDE，其帶有一整套可以幫助用戶在使用Python語言開發時提高其效率的工具。此外，該IDE提供了一些高級功能，以用於Django框架下的專業Web開發。立即獲取PyCharm v20

原創

2024-04-23 11:34:45

“AI 程序員入職系列”第二彈：如何利用通義靈碼光速改寫項目編程語言？

通義靈碼入職阿里云云原生團隊後，已經展示過 Ta 生成單元測試和自動生成代碼的強大實力。今天，阿里雲後端工程師雲徊將從項目開發的實際需求出發，演示通義靈碼在開發工作中可提供的幫助。通義靈碼在 Git 開發項目中起到了哪些作用？雲徊所在的

原創

2024-04-22 21:12:11

下載量超 200 萬，最近頻繁登上熱搜的 AI 程序員，大家怎麼看

人狠話不多，會熟練使用 200 多種編程語言，寫得了代碼，做得了測試，7 天 24 小時隨叫隨到…… 硅基程序員通義靈碼首次入職阿里雲，有網友說：終於不穿格子衫了！還有網友說：這簡歷，作爲一個 HR 我很難不心動！人狠話不多的通義靈碼，

原創

2024-04-22 21:12:06

python讀取一個文件裏面幾百個csv數據集然後按照列名合併一個數據集

大家好，我是Python進階者。一、前言前幾天在Python最強王者交流羣【FiNε_】問了一個Python自動化辦公，問題如下：python 讀取一個文件裏面幾百個csv數據集然後按照列名合併一個數據集。二、實現過程這裏【隔壁

原創

2024-04-21 21:52:42

探祕Python爬蟲技術：王者榮耀英雄圖片爬取

項目需求作爲一款風靡全球的MOBA遊戲，《王者榮耀》擁有衆多精美絕倫的英雄角色。玩家們對於自己心愛的英雄角色總是充滿着熱情和好奇。他們渴望收集自己喜歡的英雄的圖片，用於做壁紙、頭像或者分享給朋友。然而，要手動一張一張地下載這些圖片實

原創

2024-04-19 23:26:23

寫給職場新人｜從迷茫到屢獲殊榮的技術人成長之路

在這個時代，技術的每一次飛躍都在重塑我們的工作方式。借Up技術人專欄活動寫了這篇文章，回望一下我和計算機打交道的這幾年，希望能給學生或職場新人們一些幫助。 1.錨定方向：學生生涯的一次探險如果用一個詞語概括我的本科階段，那大概就

原創

2024-04-19 23:17:23

24小時熱門文章

［日誌分析］在nginx日誌中，提取有效的request uri

《日本蠟燭圖》讀書筆記 & 技術分析回測

《期貨-市場技術分析》讀書筆記

Python多線程編程深度探索：從入門到實戰

mongodb處理json數據很好

35K*14 薪，入職了！這公司只要不裁員，我能一直呆下去！

［日誌分析］在nginx日誌中，提取有效的request uri

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結