複製鏈接
請複製以下鏈接發送給好友

Apache日誌

鎖定
想要知道什麼人在什麼時候瀏覽了網站的哪些內容嗎?查看Apache的訪問日誌就可以知道。訪問日誌是Apache的標準日誌,本文詳細解釋了訪問日誌的內容以及相關選項的配置。
中文名
Apache日誌
功    能
日誌功能

Apache日誌應用簡介

Apache內建了記錄服務器活動的功能,這就是它的日誌功能。這個《Apache日誌》系列文章介紹的就是Apache的訪問日誌、錯誤日誌,以及如何分析日誌數據,如何定製Apache日誌,如何從日誌數據生成統計報表等內容。
如果Apache的安裝方式是默認安裝,服務器一運行就會有兩個日誌文件生成。這兩個文件是access_log(在Windows上是access.log)和error_log(在Windows上是error.log)。採用默認安裝方式時,這些文件可以在/usr/local/apache/logs下找到;對於Windows系統,這些日誌文件將保存在Apache安裝目錄的logs子目錄。不同的包管理器會把日誌文件放到各種不同的位置,所以你可能需要找找其他的地方,或者通過配置文件查看這些日誌文件配置到了什麼地方。

Apache日誌程序分析

學習SEO不看日誌是不行的,或者説不看日誌你就不能成為一個真正的seo高手,經常的注意一下自己網站的日誌分析蜘蛛爬行的規律是很有用的,另外日誌還有助於解決各種安全問題,如你不知道的IP在訪問你的後台等.
日誌根據服務器的不同而不同,一般有IIS和Apache兩種,下面我們依次來看一下.
第一步自然是得到日誌文件,這個各個站都是不同的,有的是isp提供下載只能保存幾天的,也有的是從ftp可以找到日誌,具體要詢問自己的空間提供商,如果是你自己的服務器的話,IIS的日誌可以在Windows文件夾下的system32\LogFiles\W3SVC1下.而Apache的日誌默認是在安裝地址的logs文件夾下,如果沒有的話需要更改服務器配置,例如以tomcat為例,需要修改server.xml文件加入
directory="logs" prefix="localhost_access_log." suffix=".txt"
pattern="combined" resolveHosts="false"
然後就會在logs文件夾下生成類似於localhost_access_log.2010-07-07.txt的文件。接下來由青島seo為大家一起來分析一下日誌把。我們以本站Apache服務器所產生的幾條日誌為例為大家簡要講解一下
比如説:
72.30.142.174 - - [08/Jul/2010:05:24:10 +0800] "GET /robots.txt HTTP/1.0" 200 27 "null" "Mozilla/5.0 (compatible; Yahoo! slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
這就意味着雅虎的蜘蛛(72.30.142.174 )在2010-7-8 05:24:10(東八區區時)以get的方式訪問http://www.qingdao-seo.net/robots.txt這個文件大小為27個字節,訪問取得了圓滿成功。
再比如説:222.173.101.196 - - [08/Jul/2010:07:14:11 +0800] "GET /list_bg.gif HTTP/1.1" 404 988 "http://www.qingdao-seo.net/" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; GTB6.5; Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) )"
這個就比較悲慘,這是一個用户在通過首頁訪問list_bg.gif文件,結果服務器上沒有返回了404的代碼,這時我們就知道我們的網站看上去有一些問題需要去處理了,為什麼沒有這個文件呢?....
好問題解決了,我們知道了返回代碼200代表着訪問成功,404代表着目標文件未找到,其他的我從網上找了一個大全的,希望對大家有幫助.

Apache日誌術語

返回碼
"100" : Continue 客户必須繼續發出請求
"101" : witching Protocols 客户要求服務器根據請求轉換HTTP協議版本 200交易成功
"200" : OK 交易成功
"201" : Created 提示知道新文件的URL
"202" : Accepted 接受和處理、但處理未完成
"203" : Non-Authoritative Information 返回信息不確定或不完整
"204" : No Content 請求收到,但返回信息為空
"205" : Reset Content 服務器完成了請求,用户代理必須復位當前已經瀏覽過的文件
"206" : Partial Content 服務器已經完成了部分用户的GET請求
"300" : Multiple Choices 請求的資源可在多處得到
"301" : Moved permanently 刪除請求數據
"302" : Found 在其他地址發現了請求數據
"303" : See Other 建議客户訪問其他URL或訪問方式
"304" : Not Modified 客户端已經執行了GET,但文件未變化
"305" : Use Proxy 請求的資源必須從服務器指定的地址得到
"306" 前一版本HTTP中使用的代碼,現行版本中不再使用
"307" : Temporary Redirect 申明請求的資源臨時性刪除
"400" : Bad Request 錯誤請求,如語法錯誤
"401" : Unauthorized 請求授權失敗
"402" : Payment Required 保留有效ChargeTo頭響應
"403" : Forbidden 請求不答應
"404" : Not Found 沒有發現文件、查詢或URl
"405" : Method Not Allowed 用户在Request-Line字段定義的方法不答應
"406" : Not Acceptable 根據用户發送的Accept拖,請求資源不可訪問
"407" : Proxy Authentication Required 類似401,用户必須首先在代理服務器上得到授權
"408" : Request Time-out 客户端沒有在用户指定的餓時間內完成請求
"409" : Conflict 對當前資源狀態,請求不能完成
"410" : Gone 服務器上不再有此資源且無進一步的參考地址
"411" : Length Required 服務器拒絕用户定義的Content-Length屬性請求
"412" : precondition Failed 一個或多個請求頭字段在當前請求中錯誤
"413" : Request Entity Too Large 請求的資源大於服務器答應的大小
"414" : Request-URI Too Large 請求的資源URL長於服務器答應的長度
"415" : unsupported Media Type 請求資源不支持請求項目格式
"416" : Requested range not satisfiable請求中包含Range請求頭字段,在當前請求資源範圍內沒有range指示值,請求也不包含If-Range請求頭字段
"417" : Expectation Failed 服務器不滿足請求Expect頭字段指定的期望值,假如是代理服務器,
"500" : Internal Server Error 服務器產生內部錯誤
"501" : Not Implemented 服務器不支持請求的函數
"502" : Bad Gateway 服務器暫時不可用,有時是為了防止發生系統過載
"503" : Service Unavailable 服務器過載或暫停維修
"504" : Gateway Time-out 關口過載,服務器使用另一個關口或服務來響應用户,等待時間設定值較長
"505" : HTTP Version not supported 服務器不支持或拒絕支請求頭中指定的HTTP版本