access.log记录格式如下 remotehost rfc931 authuser [date] “method URL” status bytes [Result Codes]:[Hierarchy Codes] 如: 221.222.213.64 - - [15/Nov/2006:00:00:03 +0800] “GET http://bbs.ci123.com/sample.jpg HTTP/1.1″ 200 240673 TCP_MEM_HIT:NONE 可以通过脚本查看一些统计信息,如各种反应状态所占的比例,通常较好的情况下HIT所占的比例(应该就是所谓的命中率)可以在70%~80% cat access.log|gawk ‘{print $11}’|sort|uniq -c|sort -nr 154389 TCP_MEM_HIT:NONE TCP_HIT A valid copy of the requested object was in the cache. The requested object was not in the cache. The requested object was cached but STALE. The IMS query for the object resulted in “304 not modified”. The requested object was cached but STALE. The IMS query failed and the stale object was delivered. The requested object was cached but STALE. The IMS query returned the new content. The client issued a “no-cache” pragma, or some analogous cache control command along with the request. Thus, the cache has to refetch the object. The client issued an IMS request for an object which was in the cache and fresh. The object was believed to be in the cache, but could not be accessed. Request for a negatively cached object, e.g. “404 not found”, for which the cache believes to know that it is inaccessible. Also refer to the explainations for negative_ttl in your squid.conf file. A valid copy of the requested object was in the cache and it was in memory, thus avoiding disk accesses. Access was denied for this request. The requested object was retrieved from the cache during offline mode. The offline mode never validates any object, see offline_mode in squid.conf file. A valid copy of the requested object was in the cache. The requested object is not in this cache. Access was denied for this request. An invalid request was received. During “-Y” startup, or during frequent failures, a cache in hit only mode will return either UDP_HIT or this code. Neighbours will thus only fetch hits. Seen with errors and cachemgr requests. The following codes are no longer available in Squid-2: ERR_* Errors are now contained in the status code. See: TCP_CLIENT_REFRESH_MISS. See: TCP_SWAPFAIL_MISS. Deleted, TCP_IMS_HIT used instead. Hit objects are no longer available. See: UDP_MISS_NOFETCH. 后面找到了中文版,补充全一些: 相应于HTTP请求,下列标签可能出现在access.log文件的第四个域。 TCP_HIT Squid发现请求资源的貌似新鲜的拷贝,并将其立即发送到客户端。 TCP_MISS Squid没有请求资源的cache拷贝。 TCP_REFRESH_HIT Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。原始服务器返回304(未修改)响应,指示squid的拷贝仍旧是新鲜的。 TCP_REF_FAIL_HIT Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。然而,原始服务器响应失败,或者返回的响应Squid不能理解。在此情形下,squid发送现有cache拷贝(很可能是陈旧的)到客户端。 TCP_REFRESH_MISS Squid发现请求资源的貌似陈旧的拷贝,并发送确认请求到原始服务器。原始服务器响应新的内容,指示这个cache拷贝确实是陈旧的。 TCP_CLIENT_REFRESH_MISS Squid发现了请求资源的拷贝,但客户端的请求包含了Cache-Control: no-cache指令。Squid转发客户端的请求到原始服务器,强迫cache确认。 TCP_IMS_HIT 客户端发送确认请求,Squid发现更近来的、貌似新鲜的请求资源的拷贝。Squid发送更新的内容到客户端,而不联系原始服务器。 TCP_SWAPFAIL_MISS Squid发现请求资源的有效拷贝,但从磁盘装载它失败。这时squid发送请求到原始服务器,就如同这是个cache丢失一样。 TCP_NEGATIVE_HIT 在对原始服务器的请求导致HTTP错误时,Squid也会cache这个响应。在短时间内对这些资源的重复请求,导致了否命中。 negative_ttl指令控制这些错误被cache的时间数量。请注意这些错误只在内存cache,不会写往磁盘。下列HTTP状态码可能导致否定 cache(也遵循于其他约束): 204, 305, 400, 403, 404, 405, 414, 500, 501, 502, 503, 504。 TCP_MEM_HIT Squid在内存cache里发现请求资源的有效拷贝,并将其立即发送到客户端。注意这点并非精确的呈现了所有从内存服务的响应。例如,某些cache在内存里,但要求确认的响应,会以TCP_REFRESH_HIT, TCP_REFRESH_MISS等形式记录。 TCP_DENIED 因为http_access或http_reply_access规则,客户端的请求被拒绝了。注意被http_access拒绝的请求在第9域的值是NONE/-,然而被http_reply_access拒绝的请求,在相应地方有一个有效值。 TCP_OFFLINE_HIT 当offline_mode激活时,Squid对任何cache响应返回cache命中,而不用考虑它的新鲜程度。 TCP_REDIRECT 重定向程序告诉Squid产生一个HTTP重定向到新的URI(见11.1节)。正常的,Squid不会记录这些重定向。假如要这样做,必须在编译squid前,手工定义LOG_TCP_REDIRECTS预处理指令。 NONE 无分类的结果用于特定错误,例如无效主机名。 相应于ICP查询,下列标签可能出现在access.log文件的第四域。 UDP_HIT Squid在cache里发现请求资源的貌似新鲜的拷贝。 UDP_MISS Squid没有在cache里发现请求资源的貌似新鲜的拷贝。假如同一目标通过HTTP请求,就可能是个cache丢失。请对比UDP_MISS_NOFETCH。 UDP_MISS_NOFETCH 跟UDP_MISS类似,不同的是这里也指示了Squid不愿去处理相应的HTTP请求。假如使用了-Y命令行选项,Squid在启动并编译其内存索引时,会返回这个标签而不是UDP_MISS。 UDP_DENIED 因为icp_access规则,ICP查询被拒绝。假如超过95%的到某客户端的ICP响应是UDP_DENIED,并且客户端数据库激活了(见附录A),Squid在1小时内,停止发送任何ICP响应到该客户端。若这点发生,你也可在cache.log里见到一个警告。 UDP_INVALID Squid接受到无效查询(例如截断的消息、无效协议版本、URI里的空格等)。Squid发送UDP_INVALID响应到客户端。 附:HTTP响应状态码Table 13-1列出了数字HTTP响应CODE和理由短句。注意Squid和其他HTTP客户端仅仅关注这些数字值。理由短句是纯解释性的,不会影响响应的意义。对每个状态码,也提供了一个到RFC 2616的具体节的索引。注意状态码0和600是squid使用的非标准的值,不会在RFC里提到。
假如Squid从原始服务器没有接受到任何响应,你可在access.log里看到状态码0。假如Squid接受到的响应没有包含HTTP头部,就会出现状态码600。在少数情况下,某些原始服务器仅发送响应body,而忽略了任何头部。 13.2.3 access.log对端编码下列编码可能出现在access.log的第9域。请参考10.10节关于Squid如何对cache丢失情况,选择有效的下一跳。 NONE 这指明Squid对本次请求,不会与任何其他服务器(邻居或原始服务器)通信。它通常与cache命中、拒绝请求、cache管理请求、错误、和所有的ICP查询这些类型联合出现。 DIRECT Squid直接转发请求到原始服务器。该域的第2半部分显示原始服务器的IP地址,或主机名-假如禁止了log_ip_on_direct。 SIBLING_HIT 在姐妹cache返回ICP或HTCP命中后,Squid发送请求到姐妹cache。 PARENT_HIT 在父cache返回ICP或HTCP命中后,Squid发送请求到父cache。 DEFAULT_PARENT Squid选择该父cache,因为其在squid.conf的cache_peer行里被标志为default。 FIRST_UP_PARENT Squid转发请求到该父cache,因为它是位于已知活跃列表里的第一个父cache。 FIRST_PARENT_MISS Squid转发请求到该父cache,它第一个响应ICP/HTCP丢失消息。换句话说,对这个特殊的ICP/HTCP查询,在这个特殊时刻,被选中的父cache有最佳的往返时间(RTT)。注意标准RTT可能被人工矫正过,取决于cache_peer指令的weight选项。 CLOSEST_PARENT_MISS Squid选择该父cache,因为它报告到原始服务器的RTT最低。这点仅在2个cache都激活了netdb,并且原始服务器(或在同一子网内的其他server)返回ICMP ping消息。 CLOSEST_PARENT 这点类似CLOSEST_PARENT_MISS,除了RTT计算不是来自ICP/HTCP响应消息外。代替的,它们来自Squid保留的更老的计算方式,例如netdb交换功能。 CLOSEST_DIRECT Squid基于netdb算法,转发请求到原始服务器。这点在满足下述任何条件时发生:
ROUNDROBIN_PARENT Squid转发请求到该父cache,因为设置了round-robin选项,并且它有最低的使用计数器。 CD_PARENT_HIT Squid基于cache摘要算法(见10.7节)转发请求到该父cache。 CD_SIBLING_HIT Squid基于cache摘要算法转发请求到该姐妹cache。 CARP Squid选择该父cache,基于cache数组路由协议算法(见10.9节)。 ANY_PARENT 作为最后的手段,Squid选择该父cache,因为没有其他方法能选择可行的下一跳。 注意大部分上述编码可能以TIMEOUT_开头,这表明在等待ICP/HTCP响应时发生超时。例如: 1066038165.382 345 193.233.46.21 TCP_MISS/200 2836 GET http://www./home/../images/home.jpg TIMEOUT_CLOSEST_DIRECT/213.219.122.19 image/jpeg 可使用icp_query_timeout指令来调整超时。 事例: |
|