十年風雨路 · 一心鑄精品

接一個官網 留一件精品 做一個項目 樹一塊樣板

關于shell命令的問題

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。使用python即可完美提取這是一般Apache的Log內容:192.168.1.1--[20/Nov/2011:01:10:35+0100]"GET/feed.atomHTTP/1.0"200259653192.168.1.2--[20/Nov/2011:01:10:49+0100]"GET/feed.atomHTTP/1.1"3041

時間:2014年07月02日 點擊量:

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。

 

使用python即可完美提取
這是一般Apache的 Log 內容:
192.168.1.1 - - [20/Nov/2011:01:10:35 +0100] "GET /feed.atom HTTP/1.0" 200 259653
192.168.1.2 - - [20/Nov/2011:01:10:49 +0100] "GET /feed.atom HTTP/1.1" 304 153
192.168.1.3 - - [20/Nov/2011:01:10:50 +0100] "GET /2008/1/23/no HTTP/1.0" 404 472
192.168.1.4 - - [20/Nov/2011:01:10:50 +0100] "GET /feed.atom?_qt=data HTTP/1.1"
先調出Log文件

with open('/var/log/apache2/access.log') as f:
for line in f:


然后提取用戶訪問記錄

import re
from collections import defaultdict
from heapq import nlargest

with open('log.txt') as f:
count = defaultdict(int)
for line in f:
    match = re.search(r' "\w+ (.*?) HTTP/', line)
    if match is None:
        continue
    uri = match.group(1).split('?')[0]
    count[uri] = count[uri] + 1

most_common = nlargest(5, count.items(), key=lambda x: x[1])
print most_common

推薦案例

  • 成都森美啦園林綠化工程公

  • 四川尚恒科技有限公司

  • 成都九邦物流有限責任公司

  • 四川品睿餐飲管理有限公司

  • 美繪陶社陶藝手繪工作室-暖

  • 成都恩多施生物工程技術有

  • 汶川羌人土特產有限公司

  • 印刷設計公司網站No.3138

聯系我們 / CONTACT US

  • 四川省成都市金牛區五福橋東路229號龍湖北城天街28棟903室
  • 服務熱線:400-000-2367 028-86088588
  • 總機:028-62322623-0
  • 傳真:028-62322623-823

掃碼訪問冠辰手機網站

版權所有 Copyright © 2002-2019 四川冠辰科技開發有限公司  www.dr-bra.com 保留所有權利  蜀ICP備11012605號

地址:四川省成都市金牛區五福橋東路229號龍湖北城天街28棟903室

服務熱線:400-000-2367 028-86088588 總機:028-62322623-0 傳真:028-62322623-823

国产亚洲精品俞拍视频