博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Web 访问日志分析
阅读量:6839 次
发布时间:2019-06-26

本文共 2799 字,大约阅读时间需要 9 分钟。

用途

  1. 记录访问服务器的远程主机 IP 地址,可以得知浏览者来自何处
  2. 记录浏览者访问 web 资源,可以了解网站哪些部分最受欢迎
  3. 记录浏览者使用浏览器,可以根据大多数浏览者使用浏览器对站点进行优化
  4. 记录浏览者访问时间

访问日志位置

1.Apache

在 httpd.conf 和引用的*.conf文件中查找 CustomLog "logs/access.log" combined
说明:

a.CustomLog 访问日志配置指令b.logs/access.log 访问日志记录文件c.combined 日志格式
  1. Nginx
    在 nginx.conf 或引用的 *.conf 文件中查找 access_log logs/access.log main
    说明:
    a.access_log 访问日志配置指令b.logs/access.log 访问日志记录文件c.main 日志格式

访问日志格式

1、Apache

LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combinedLogFormat "%h %l %u %t \"%r\" %>s %b" common

2、nginx

log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '              '$status $body_bytes_sent "$http_referer" '              '"$http_user_agent" "$http_x_forwarded_for"';

3、通用日志格式 common

127.0.0.1 - - [14/May/2017:12:45:29 +0800] "GET /index.html HTTP/1.1" 200 4286远程主机IP            请求时间         时区  方法    资源      协议     状态码 发送字节

4、组合日志格式 combined

127.0.0.1 - - [14/May/2017:12:51:13 +0800] "GET /index.html HTTP/1.1" 200 4286 "http://127.0.0.1/" "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36"远程主机IP            请求时间         时区  方法    资源      协议     状态码 发送字节    referer字符           浏览器信息

5、日志状态码

2XX:

200: 请求成功201: 创建成功202: 接受请求204: 无内容

3XX:

301: 永远重定向302: 临时重定向303: 临时重定向(HTTP1.1 同302)307: 临时重定向(HTTP1.1 POST方法)

4XX:

400: 错误请求401: 访问拒绝403: 访问禁止404: 未找到405: 请求方法错误

5XX:

500: 服务器内部错误503: 服务不可用505: 网关超时

日志统计

1、查看访问 IP 地址

cat access.log|awk '{print $1}'cat access.log|awk '{print $1}'|sort

2、查看每个 IP 地址访问次数

cat access.log|awk '{print $1}'|sort|uniq -ccat access.log|awk '{print $1}'|sort|uniq -c|sort -nrcat access.log|awk '{print $1}'|sort|uniq -c|sort -nr|head -10

3、统计总访问 IP 数量

cat access.log|awk '{print $1}'|sort|uniq -c|wc -l

4、访问指定时间后的日志

cat access.log|awk '$4>"[23/Aug/2014:23:58:00"'cat access.log|awk '($4>"[23/Aug/2014:23:58:00"){print $1}'cat access.log|awk '($4>"[23/Aug/2014:23:58:00"){print $1}'|sort|uniq -c|sort -nr

5、访问指定资源的日志

cat access.log|awk '$7 ~/.html$/'cat access.log|awk '($7 ~/.html$/){print $1 " " $7 " " $9}'cat access.log|awk '($7 ~/.js$/){print $10 " " $7}'|sort|uniq -c|sort -nr|head -10cat access.log|awk '($10 > 10000 && $7 ~/.js$/){print $10 " " $7}'|sort|uniq -c|sort -nr|head -10

6、统计总流量

cat access.log|awk '{sum+=$10}END{print sum}'cat access.log|awk '($7 ~/.css$/){sum+=$10}END{print sum}'grep "04/May/2017" access.log|awk '($7 ~/.css$/){sum+=$10}END{print sum}'

7、状态码统计

cat access.log|awk '{print $9}' |sort|uniq -c|sort -nrcat access.log|awk '($9 ~/^400$/)' | wc -lcat access.log | awk '($4 ~/^\[04\/May\/2017/){print $9}'|sort|uniq -c|sort -nrcat access.log | awk '$9 ~/400/ && $4 ~/^\[04\/May\/2017/'|wc -lgrep "04/May/2017" access.log | awk '{print $9}'|sort|uniq -c|sort -nr

作者:kk

首发链接:

转载于:https://blog.51cto.com/51reboot/2167297

你可能感兴趣的文章
冒泡排序
查看>>
android studio 各种问题
查看>>
ios中一个开发者证书如何创建多个app应用
查看>>
创建和存储 cookie
查看>>
BZOJ2351[BeiJing2011]Matrix——二维hash
查看>>
Redis常用命令整理
查看>>
js的水仙花数的输出
查看>>
Codeforces Gym 100269 Dwarf Tower (最短路)
查看>>
mongo explain分析详解
查看>>
软件测试艺术一:程序正确性证明
查看>>
面向对象课程第二单元作业总结
查看>>
2549 自然数和分解
查看>>
ATL CLR MFC Win32 常规 的区别
查看>>
查看SQL Server Resource Database以及修改系统表
查看>>
scau实验题 8596 Longest Ordered Subsequence
查看>>
getopt例子
查看>>
浅说Java中的反射机制(一)
查看>>
jquery之行自加自减
查看>>
单向链表的有关操作(链式存储结构)
查看>>
Spring @PostConstruct and @PreDestroy example
查看>>