Q:網(wǎng)站的最大并發(fā)連接數(shù)
A:最近我們網(wǎng)站常常報503錯誤:“HTTP Error 503. The service is unavailable”。但刷一兩下又正常。估計很可能是超過網(wǎng)站的最大并發(fā)連接數(shù)了。
究竟什么是http連接?一張頁面加載過程中,又是圖片又是樣式、腳本,對于這些東西的請求,是共用一個連接還是多個連接?
網(wǎng)上有人說,為了節(jié)省連接數(shù),應(yīng)該盡量將外部CSS,js合并,或者內(nèi)聯(lián);甚至圖片也合成一張,再用CSS定位。顯然,在這里,一個請求就用一個連接,請求完成連接即被關(guān)掉。
但IIS里,有選項“保持HTTP連接”,且有超時時間可供設(shè)置。如果每請求一樣?xùn)|西,就開啟一個連接,并且這個連接遲遲不死,保持激活,那么要多少連接才夠用?這里的意思,應(yīng)該是一個連接可以供多次使用。
究竟哪個才對?其實都對。
http協(xié)議無狀態(tài),無連接。無連接的含義就是限制每次連接只處理一個請求,收到應(yīng)答后即斷開。但據(jù)說這個是http1.0。
http1.1里,提出了持久連接(persistentconnection)的概念,也就是說同一條 HTTP連接,可以依次處理多個請求。據(jù)說目前大多數(shù)瀏覽器都支持這個。想想也有道理,建立一個http連接,消耗的成本是很高的,類似數(shù)據(jù)庫連接,所以我們都盡量在一個數(shù)據(jù)庫連接里完成所有的操作,正如你到超市里買東西,不可能去一趟只買一樣,不然的話,買齊所有東西天都黑了。
不過,即使有持久連接的概念,還是有點疑惑:同一張頁面真的只用一個連接嗎?假如有些東西特別大,比如圖片,其他元素等不及了怎么辦?會不會另外開辟一個連接?http超時時間如果都設(shè)20分鐘,未免太浪費了吧?
另外,就算同一張頁面只用一個連接,將css、js、圖片合并,也有意義。因為數(shù)量少了,發(fā)送的請求也少了,這個對性能應(yīng)該也有影響。
附錄1:
一個典型的網(wǎng)頁,是由一個 html 文件和內(nèi)嵌的各類元素組成的,這些元素包括頁面內(nèi)的圖片,css文件,javascript 文件等等。每一個內(nèi)嵌的元素在 HTTP 協(xié)議的層面上和那個 html文件是沒有區(qū)別的:也就是都需要瀏覽器去服務(wù)器上抓下來。一個早期典型的瀏覽器是這樣實現(xiàn)的:當用戶敲入網(wǎng)址之后,瀏覽器和服務(wù)器建立連接,請求這個html 頁面,然后邊接收服務(wù)器發(fā)送的 html頁面,邊解析,碰到內(nèi)嵌元素,可以立即開第二條連接請求。另外,如果內(nèi)嵌元素很多,他可能會開多條連接同時請求。當所有需要的元素都下載完畢之后,瀏覽器就會將頁面畫出來。這個過程就是最早期的 HTTP/1.0 協(xié)議所設(shè)想的瀏覽器實現(xiàn)。
HTTP/1.0 這種多連接的運作模式是可以改進的。建立 TCP連接的過程是這樣:客戶端給服務(wù)器發(fā)一個網(wǎng)絡(luò)包說我要和你建立連接,服務(wù)器收到之后回一個網(wǎng)絡(luò)包說“我愿意”,然后客戶端要再發(fā)給服務(wù)器一個網(wǎng)絡(luò)包說“好那咱們開始傳數(shù)據(jù)吧”。這一來一去三個包才能建立 TCP連接。連接建立之后,瀏覽器給服務(wù)器發(fā)請求,服務(wù)器給瀏覽器回應(yīng)。完事之后又要來回幾個網(wǎng)絡(luò)包關(guān)閉 TCP連接。如果頁面有很多文件長度很短的元素,每個元素都需要單建一條連接就會導(dǎo)致網(wǎng)絡(luò)上大量的都是 TCP 建立連接和斷開連接的網(wǎng)絡(luò)包。另外,TCP有一個特性叫做 slow start,其含義可以大致這樣解釋:TCP連接要求發(fā)送端發(fā)送一定數(shù)量的網(wǎng)絡(luò)包之后接收端就要回一個“我收到”的網(wǎng)絡(luò)包,而且網(wǎng)絡(luò)包在經(jīng)過每個路由器的時候包頭都要被重寫,所以在網(wǎng)絡(luò)不丟包的情況下網(wǎng)絡(luò)包越大網(wǎng)絡(luò)的效率就越高。TCP 連接尋找最優(yōu)網(wǎng)絡(luò)包大小的方法是,在 TCP連接建立的初期,網(wǎng)絡(luò)包的大小是很小的,根據(jù)網(wǎng)絡(luò)狀況,兩端的程序才會逐步增大網(wǎng)絡(luò)包的大小以適應(yīng)帶寬提高網(wǎng)絡(luò)傳輸?shù)男省K詾g覽器給服務(wù)器發(fā)請求,如果每發(fā)一個請求就關(guān)閉連接的話,那這個連接的數(shù)據(jù)傳輸很難達到帶寬所能承載的速度。
基于這種種原因,HTTP/1.1 很快出來了,提出了持久連接(persistentconnection)的概念,也就是說同一條 HTTP連接,可以依次處理多個請求,同時用一定的機制保證各個請求之間的分離性。具體的操作過程是:服務(wù)器給瀏覽器發(fā)送回應(yīng)之后,并不馬上關(guān)閉連接;瀏覽器判斷上一個請求的回應(yīng)已經(jīng)收完的情況下,可以在這同一個連接上發(fā)第二個請求。這種運作模式大大減少了網(wǎng)絡(luò)包,實驗也表明這種做法很有效。但是,由于服務(wù)器上保持連接要占用一定的資源,所以一般服務(wù)器不會永久保持持久連接,而且也不推薦瀏覽器和服務(wù)器之間建立過多的持久連接。計算機基礎(chǔ)知識
持久連接可以進一步提速。這就是 pipelining了。上面可以看到,瀏覽器需要等待持久連接里上一個請求的回應(yīng)完全收完才能發(fā)送后面的請求。如果和服務(wù)器的連接比較慢,往往持久連接大部分時間都花在等待而非數(shù)據(jù)發(fā)送/接收上。pipelining的意思是,瀏覽器可以在一個持久連接里一次給服務(wù)器發(fā)送多個請求,服務(wù)器在這個連接上依次回應(yīng)這些請求。這種運作方式和瀏覽器緩存結(jié)合起來的時候會尤其有效果。比方,圖片瀏覽過后會存在瀏覽器緩存中,再次請求的時候瀏覽器會對服務(wù)器說,我這里已經(jīng)有這個圖片的緩存了,修改時間是XXXX,如果服務(wù)器上這個圖片在這之后沒有修改過,就不用重發(fā)了。這種情況下,服務(wù)器會發(fā)一個很短的 304 Not Modified 類型的回應(yīng)。如果沒有pipelining,每次這樣問一下都要等待網(wǎng)絡(luò)上傳輸打一個來回;而如果有 pipelining,瀏覽器可以同時問服務(wù)器我這里 4個圖片是否有修改,如果服務(wù)器對 pipelining 支持的好,它甚至可以將四個回應(yīng)放到同一個網(wǎng)絡(luò)包里面?zhèn)骰貋恚@是一個大大的加速。
pipelining 最早提出的時候還有一種設(shè)想的用法是,如果服務(wù)器對 pipelining 支持的好,可以把同一個 pipeline 里面的兩個請求放到兩個 CPU 上去處理,這樣能進一步加快響應(yīng)速度。當然這個可能也沒什么用。
========================================
附錄2:
引言
HTTP是一個屬于應(yīng)用層的面向?qū)ο蟮膮f(xié)議,由于其簡捷、快速的方式,適用于分布式超媒體信息系統(tǒng)。它于1990年提出,經(jīng)過幾年的使用與發(fā)展,得到不斷地完善和擴展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的規(guī)范化工作正在進行之中,而且HTTP-NG(Next Generation of HTTP)的建議已經(jīng)提出。
HTTP協(xié)議的主要特點可概括如下:
1.支持客戶/服務(wù)器模式。
2.簡單快速:客戶向服務(wù)器請求服務(wù)時,只需傳送請求方法和路徑。請求方法常用的有GET、HEAD、POST。每種方法規(guī)定了客戶與服務(wù)器聯(lián)系的類型不同。由于HTTP協(xié)議簡單,使得HTTP服務(wù)器的程序規(guī)模小,因而通信速度很快。
3.靈活:HTTP允許傳輸任意類型的數(shù)據(jù)對象。正在傳輸?shù)念愋陀蒀ontent-Type加以標記。
4.無連接:無連接的含義是限制每次連接只處理一個請求。服務(wù)器處理完客戶的請求,并收到客戶的應(yīng)答后,即斷開連接。采用這種方式可以節(jié)省傳輸時間。
5.無狀態(tài):HTTP協(xié)議是無狀態(tài)協(xié)議。無狀態(tài)是指協(xié)議對于事務(wù)處理沒有記憶能力。缺少狀態(tài)意味著如果后續(xù)處理需要前面的信息,則它必須重傳,這樣可能導(dǎo)致每次連接傳送的數(shù)據(jù)量增大。另一方面,在服務(wù)器不需要先前信息時它的應(yīng)答就較快。
一、HTTP協(xié)議詳解之URL篇
http(超文本傳輸協(xié)議)是一個基于請求與響應(yīng)模式的、無狀態(tài)的、應(yīng)用層的協(xié)議,常基于TCP的連接方式,HTTP1.1版本中給出一種持續(xù)連接的機制,絕大多數(shù)的Web開發(fā),都是構(gòu)建在HTTP協(xié)議之上的Web應(yīng)用。
HTTP URL (URL是一種特殊類型的URI,包含了用于查找某個資源的足夠的信息)的格式如下:
http://host[“:“port][abs_path]
http表示要通過HTTP協(xié)議來定位網(wǎng)絡(luò)資源;host表示合法的Internet主機域名或者IP地址;port指定一個端口號,為空則使用缺省端口80;abs_path指定請求資源的URI;如果URL中沒有給出abs_path,那么當它作為請求URI時,必須以“/”的形式給出,通常這個工作瀏覽器自動幫我們完成。
eg:
1、輸入:www.guet.edu.cn,瀏覽器自動轉(zhuǎn)換成:http://www.guet.edu.cn/
2、http:192.168.0.116:8080/index.jsp
二、HTTP協(xié)議詳解之請求篇
http請求由三部分組成,分別是:請求行、消息報頭、請求正文
1、請求行以一個方法符號開頭,以空格分開,后面跟著請求的URI和協(xié)議的版本,格式如下:Method Request-URI HTTP-Version CRLF
其中 Method表示請求方法;Request-URI是一個統(tǒng)一資源標識符;HTTP-Version表示請求的HTTP協(xié)議版本;CRLF表示回車和換行(除了作為結(jié)尾的CRLF外,不允許出現(xiàn)單獨的CR或LF字符)。
請求方法(所有方法全為大寫)有多種,各個方法的解釋如下:
GET 請求獲取Request-URI所標識的資源
POST在Request-URI所標識的資源后附加新的數(shù)據(jù)
HEAD請求獲取由Request-URI所標識的資源的響應(yīng)消息報頭
PUT 請求服務(wù)器存儲一個資源,并用Request-URI作為其標識
DELETE請求服務(wù)器刪除Request-URI所標識的資源
TRACE 請求服務(wù)器回送收到的請求信息,主要用于測試或診斷
CONNECT 保留將來使用
OPTIONS 請求查詢服務(wù)器的性能,或者查詢與資源相關(guān)的選項和需求
應(yīng)用舉例:
GET方法:在瀏覽器的地址欄中輸入網(wǎng)址的方式訪問網(wǎng)頁時,瀏覽器采用GET方法向服務(wù)器獲取資源,eg:GET /form.html HTTP/1.1 (CRLF)
POST方法要求被請求服務(wù)器接受附在請求后面的數(shù)據(jù),常用于提交表單。
eg:POST /reg.jsp HTTP/ (CRLF)
Accept:image/gif,image/x-xbit,… (CRLF)
…
HOST:www.guet.edu.cn (CRLF)
Content-Length:22 (CRLF)
Connection:Keep-Alive (CRLF)
Cache-Control:no-cache (CRLF)
(CRLF) //該CRLF表示消息報頭已經(jīng)結(jié)束,在此之前為消息報頭
user=jeffrey&pwd=1234//此行以下為提交的數(shù)據(jù)
HEAD方法與GET方法幾乎是一樣的,對于HEAD請求的回應(yīng)部分來說,它的HTTP頭部中包含的信息與通過GET請求所得到的信息是相同的。利用這個方法,不必傳輸整個資源內(nèi)容,就可以得到Request-URI所標識的資源的信息。該方法常用于測試超鏈接的有效性,是否可以訪問,以及最近是否更新。
2、請求報頭后述
3、請求正文(略)
三、HTTP協(xié)議詳解之響應(yīng)篇
在接收和解釋請求消息后,服務(wù)器返回一個HTTP響應(yīng)消息。
HTTP響應(yīng)也是由三個部分組成,分別是:狀態(tài)行、消息報頭、響應(yīng)正文
1、狀態(tài)行格式如下:
HTTP-Version Status-Code Reason-Phrase CRLF
其中,HTTP-Version表示服務(wù)器HTTP協(xié)議的版本;Status-Code表示服務(wù)器發(fā)回的響應(yīng)狀態(tài)代碼;Reason-Phrase表示狀態(tài)代碼的文本描述。
狀態(tài)代碼有三位數(shù)字組成,第一個數(shù)字定義了響應(yīng)的類別,且有五種可能取值:
1xx:指示信息–表示請求已接收,繼續(xù)處理
2xx:成功–表示請求已被成功接收、理解、接受
3xx:重定向–要完成請求必須進行更進一步的操作
4xx:客戶端錯誤–請求有語法錯誤或請求無法實現(xiàn)
5xx:服務(wù)器端錯誤–服務(wù)器未能實現(xiàn)合法的請求
常見狀態(tài)代碼、狀態(tài)描述、說明:
200 OK//客戶端請求成功
400 Bad Request//客戶端請求有語法錯誤,不能被服務(wù)器所理解
401 Unauthorized //請求未經(jīng)授權(quán),這個狀態(tài)代碼必須和WWW-Authenticate報頭域一起使用
403 Forbidden//服務(wù)器收到請求,但是拒絕提供服務(wù)
404 Not Found//請求資源不存在,eg:輸入了錯誤的URL
500 Internal Server Error //服務(wù)器發(fā)生不可預(yù)期的錯誤
503 Server Unavailable//服務(wù)器當前不能處理客戶端的請求,一段時間后可能恢復(fù)正常
eg:HTTP/1.1 200 OK (CRLF)
2、響應(yīng)報頭后述
3、響應(yīng)正文就是服務(wù)器返回的資源的內(nèi)容
四、HTTP協(xié)議詳解之消息報頭篇
HTTP消息由客戶端到服務(wù)器的請求和服務(wù)器到客戶端的響應(yīng)組成。請求消息和響應(yīng)消息都是由開始行(對于請求消息,開始行就是請求行,對于響應(yīng)消息,開始行就是狀態(tài)行),消息報頭(可選),空行(只有CRLF的行),消息正文(可選)組成。
HTTP消息報頭包括普通報頭、請求報頭、響應(yīng)報頭、實體報頭。
每一個報頭域都是由名字+“:”+空格+值 組成,消息報頭域的名字是大小寫無關(guān)的。
1、普通報頭
在普通報頭中,有少數(shù)報頭域用于所有的請求和響應(yīng)消息,但并不用于被傳輸?shù)膶嶓w,只用于傳輸?shù)南ⅰ?br />
eg:
Cache-Control 用于指定緩存指令,緩存指令是單向的(響應(yīng)中出現(xiàn)的緩存指令在請求中未必會出現(xiàn)),且是獨立的(一個消息的緩存指令不會影響另一個消息處理的緩存機制),HTTP1.0使用的類似的報頭域為Pragma。
請求時的緩存指令包括:no-cache(用于指示請求或響應(yīng)消息不能緩存)、no-store、max-age、max-stale、min-fresh、only-if-cached;
響應(yīng)時的緩存指令包括:public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age、s-maxage.
eg:為了指示IE瀏覽器(客戶端)不要緩存頁面,服務(wù)器端的JSP程序可以編寫如下:response.sehHeader(“Cache-Control“,“no-cache“);
//response.setHeader(“Pragma“,“no-cache“);作用相當于上述代碼,通常兩者//合用
這句代碼將在發(fā)送的響應(yīng)消息中設(shè)置普通報頭域:Cache-Control:no-cache
Date普通報頭域表示消息產(chǎn)生的日期和時間
Connection普通報頭域允許發(fā)送指定連接的選項。例如指定連接是連續(xù),或者指定“close”選項,通知服務(wù)器,在響應(yīng)完成后,關(guān)閉連接
2、請求報頭
請求報頭允許客戶端向服務(wù)器端傳遞請求的附加信息以及客戶端自身的信息。
常用的請求報頭
Accept
Accept請求報頭域用于指定客戶端接受哪些類型的信息。eg:Accept:image/gif,表明客戶端希望接受GIF圖象格式的資源;Accept:text/html,表明客戶端希望接受html文本。
Accept-Charset
Accept-Charset請求報頭域用于指定客戶端接受的字符集。eg:Accept-Charset:iso-8859-1,gb2312.如果在請求消息中沒有設(shè)置這個域,缺省是任何字符集都可以接受。
Accept-Encoding
Accept-Encoding請求報頭域類似于Accept,但是它是用于指定可接受的內(nèi)容編碼。eg:Accept-Encoding:gzip.deflate.如果請求消息中沒有設(shè)置這個域服務(wù)器假定客戶端對各種內(nèi)容編碼都可以接受。
Accept-Language
Accept-Language請求報頭域類似于Accept,但是它是用于指定一種自然語言。eg:Accept-Language:zh-cn.如果請求消息中沒有設(shè)置這個報頭域,服務(wù)器假定客戶端對各種語言都可以接受。
Authorization
Authorization請求報頭域主要用于證明客戶端有權(quán)查看某個資源。當瀏覽器訪問一個頁面時,如果收到服務(wù)器的響應(yīng)代碼為401(未授權(quán)),可以發(fā)送一個包含Authorization請求報頭域的請求,要求服務(wù)器對其進行驗證。
Host(發(fā)送請求時,該報頭域是必需的)
Host請求報頭域主要用于指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的,eg:
我們在瀏覽器中輸入:http://www.guet.edu.cn/index.html
瀏覽器發(fā)送的請求消息中,就會包含Host請求報頭域,如下:
Host:www.guet.edu.cn
此處使用缺省端口號80,若指定了端口號,則變成:Host:www.guet.edu.cn:指定端口號
User-Agent
我們上網(wǎng)登陸論壇的時候,往往會看到一些歡迎信息,其中列出了你的操作系統(tǒng)的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,服務(wù)器應(yīng)用程序就是從User-Agent這個請求報頭域中獲取到這些信息。User-Agent請求報頭域允許客戶端將它的操作系統(tǒng)、瀏覽器和其它屬性告訴服務(wù)器。不過,這個報頭域不是必需的,如果我們自己編寫一個瀏覽器,不使用User-Agent請求報頭域,那么服務(wù)器端就無法得知我們的信息了。
請求報頭舉例:
GET /form.html HTTP/1.1 (CRLF)
Accept:image/gif,image/x-xbitmap,image/jpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,*/* (CRLF)
Accept-Language:zh-cn (CRLF)
Accept-Encoding:gzip,deflate (CRLF)
If-Modified-Since:Wed,05 Jan 2007 11:21:25 GMT (CRLF)
If-None-Match:W/“80b1a4c018f3c41:8317“ (CRLF)
User-Agent:Mozilla/4.0(compatible;MSIE6.0;Windows NT 5.0) (CRLF)
Host:www.guet.edu.cn (CRLF)
Connection:Keep-Alive (CRLF)
(CRLF)
3、響應(yīng)報頭
響應(yīng)報頭允許服務(wù)器傳遞不能放在狀態(tài)行中的附加響應(yīng)信息,以及關(guān)于服務(wù)器的信息和對Request-URI所標識的資源進行下一步訪問的信息。
常用的響應(yīng)報頭
Location
Location響應(yīng)報頭域用于重定向接受者到一個新的位置。Location響應(yīng)報頭域常用在更換域名的時候。
Server
Server響應(yīng)報頭域包含了服務(wù)器用來處理請求的軟件信息。與User-Agent請求報頭域是相對應(yīng)的。下面是
Server響應(yīng)報頭域的一個例子:
Server:Apache-Coyote/1.1
WWW-Authenticate
WWW-Authenticate響應(yīng)報頭域必須被包含在401(未授權(quán)的)響應(yīng)消息中,客戶端收到401響應(yīng)消息時候,并發(fā)送Authorization報頭域請求服務(wù)器對其進行驗證時,服務(wù)端響應(yīng)報頭就包含該報頭域。
eg:WWW-Authenticate:Basic realm=“Basic Auth Test!“//可以看出服務(wù)器對請求資源采用的是基本驗證機制。
4、實體報頭
請求和響應(yīng)消息都可以傳送一個實體。一個實體由實體報頭域和實體正文組成,但并不是說實體報頭域和實體正文要在一起發(fā)送,可以只發(fā)送實體報頭域。實體報頭定義了關(guān)于實體正文(eg:有無實體正文)和請求所標識的資源的元信息。
常用的實體報頭
Content-Encoding
Content-Encoding實體報頭域被用作媒體類型的修飾符,它的值指示了已經(jīng)被應(yīng)用到實體正文的附加內(nèi)容的編碼,因而要獲得 Content-Type報頭域中所引用的媒體類型,必須采用相應(yīng)的解碼機制。Content-Encoding這樣用于記錄文檔的壓縮方法,eg:Content-Encoding:gzip
Content-Language
Content-Language實體報頭域描述了資源所用的自然語言。沒有設(shè)置該域則認為實體內(nèi)容將提供給所有的語言閱讀
者。eg:Content-Language:da
Content-Length
Content-Length實體報頭域用于指明實體正文的長度,以字節(jié)方式存儲的十進制數(shù)字來表示。
Content-Type
Content-Type實體報頭域用語指明發(fā)送給接收者的實體正文的媒體類型。eg:
Content-Type:text/html;charset=utf-8/〉Content-Type:text/html;charset=utf-8/〉Last-Modified
Last-Modified實體報頭域用于指示資源的最后修改日期和時間。
Expires
Expires實體報頭域給出響應(yīng)過期的日期和時間。為了讓代理服務(wù)器或瀏覽器在一段時間以后更新緩存中(再次訪問曾訪問過的頁面時,直接從緩存中加載,縮短響應(yīng)時間和降低服務(wù)器負載)的頁面,我們可以使用Expires實體報頭域指定頁面過期的時間。eg:Expires:Thu,15 Sep 2006 16:23:12 GMT
HTTP1.1的客戶端和緩存必須將其他非法的日期格式(包括0)看作已經(jīng)過期。eg:為了讓瀏覽器不要緩存頁面,我們也可以利用Expires實體報頭域,設(shè)置為0,jsp中程序如下:response.setDateHeader(“Expires“,“0“);
五、利用telnet觀察http協(xié)議的通訊過程
實驗?zāi)康募霸恚?br />
利用MS的telnet工具,通過手動輸入http請求信息的方式,向服務(wù)器發(fā)出請求,服務(wù)器接收、解釋和接受請求后,會返回一個響應(yīng),該響應(yīng)會在telnet窗口上顯示出來,從而從感性上加深對http協(xié)議的通訊過程的認識。
實驗步驟:
1、打開telnet
1.1 打開telnet
運行–〉cmd–〉telnet
1.2 打開telnet回顯功能
set localecho
2、連接服務(wù)器并發(fā)送請求
2.1 open www.guet.edu.cn 80//注意端口號不能省略
HEAD /index.asp HTTP/1.0
Host:www.guet.edu.cn
/*我們可以變換請求方法,請求桂林電子主頁內(nèi)容,輸入消息如下*/
open www.guet.edu.cn 80
GET /index.asp HTTP/1.0//請求資源的內(nèi)容
Host:www.guet.edu.cn
2.2 open www.sina.com.cn 80//在命令提示符號下直接輸入telnet www.sina.com.cn 80
HEAD /index.asp HTTP/1.0
Host:www.sina.com.cn
3 實驗結(jié)果:
3.1 請求信息2.1得到的響應(yīng)是:
HTTP/1.1 200 OK//請求成功
Server: Microsoft-IIS/5.0//web服務(wù)器
Date: Thu,08 Mar 200707:17:51 GMT
Connection: Keep-Alive
Content-Length: 23330
Content-Type: text/html
Expries: Thu,08 Mar 2007 07:16:51 GMT
Set-Cookie: ASPSESSIONIDQAQBQQQB=BEJCDGKADEDJKLKKAJEOIMMH; path=/
Cache-control: private
//資源內(nèi)容省略
3.2 請求信息2.2得到的響應(yīng)是:
HTTP/1.0 404 Not Found //請求失敗
Date: Thu, 08 Mar 2007 07:50:50 GMT
Server: Apache/2.0.54 〈Unix〉
Last-Modified: Thu, 30 Nov 2006 11:35:41 GMT
ETag: “6277a-415-e7c76980“
Accept-Ranges: bytes
X-Powered-By: mod_xlayout_jh/0.0.1vhs.markII.remix
Vary: Accept-Encoding
Content-Type: text/html
X-Cache: MISS from zjm152-78.sina.com.cn
Via: 1.0 zjm152-78.sina.com.cn:80〈squid/2.6.STABLES-20061207〉
X-Cache: MISS from th-143.sina.com.cn
Connection: close
失去了跟主機的連接
按任意鍵繼續(xù)…
4 .注意事項:
1、出現(xiàn)輸入錯誤,則請求不會成功。
2、報頭域不分大小寫。
3、更深一步了解HTTP協(xié)議,可以查看RFC2616,在http://www.letf.org/rfc上找到該文件。
4、開發(fā)后臺程序必須掌握http協(xié)議
六、HTTP協(xié)議相關(guān)技術(shù)補充
1、基礎(chǔ):
高層協(xié)議有:文件傳輸協(xié)議FTP、電子郵件傳輸協(xié)議SMTP、域名系統(tǒng)服務(wù)DNS、網(wǎng)絡(luò)新聞傳輸協(xié)議NNTP和HTTP協(xié)議等中介由三種:代理(Proxy)、網(wǎng)關(guān)(Gateway)和通道(Tunnel),一個代理根據(jù)URI的絕對格式來接受請求,重寫全部或部分消息,通過 URI的標識把已格式化過的請求發(fā)送到服務(wù)器。網(wǎng)關(guān)是一個接收代理,作為一些其它服務(wù)器的上層,并且如果必須的話,可以把請求翻譯給下層的服務(wù)器協(xié)議。一個通道作為不改變消息的兩個連接之間的中繼點。當通訊需要通過一個中介(例如:防火墻等)或者是中介不能識別消息的內(nèi)容時,通道經(jīng)常被使用。
代理(Proxy):一個中間程序,它可以充當一個服務(wù)器,也可以充當一個客戶機,為其它客戶機建立請求。請求是通過可能的翻譯在內(nèi)部或經(jīng)過傳遞到其它的服務(wù)器中。一個代理在發(fā)送請求信息之前,必須解釋并且如果可能重寫它。代理經(jīng)常作為通過防火墻的客戶機端的門戶,代理還可以作為一個幫助應(yīng)用來通過協(xié)議處理沒有被用戶代理完成的請求。
網(wǎng)關(guān)(Gateway):一個作為其它服務(wù)器中間媒介的服務(wù)器。與代理不同的是,網(wǎng)關(guān)接受請求就好象對被請求的資源來說它就是源服務(wù)器;發(fā)出請求的客戶機并沒有意識到它在同網(wǎng)關(guān)打交道。
網(wǎng)關(guān)經(jīng)常作為通過防火墻的服務(wù)器端的門戶,網(wǎng)關(guān)還可以作為一個協(xié)議翻譯器以便存取那些存儲在非HTTP系統(tǒng)中的資源。
通道(Tunnel):是作為兩個連接中繼的中介程序。一旦激活,通道便被認為不屬于HTTP通訊,盡管通道可能是被一個HTTP請求初始化的。當被中繼的連接兩端關(guān)閉時,通道便消失。當一個門戶(Portal)必須存在或中介(Intermediary)不能解釋中繼的通訊時通道被經(jīng)常使用。
2、協(xié)議分析的優(yōu)勢—HTTP分析器檢測網(wǎng)絡(luò)攻擊
以模塊化的方式對高層協(xié)議進行分析處理,將是未來入侵檢測的方向。
HTTP及其代理的常用端口80、3128和8080在network部分用port標簽進行了規(guī)定
3、HTTP協(xié)議Content Lenth限制漏洞導(dǎo)致拒絕服務(wù)攻擊
使用POST方法時,可以設(shè)置ContentLenth來定義需要傳送的數(shù)據(jù)長度,例如ContentLenth:999999999,在傳送完成前,內(nèi) 存不會釋放,攻擊者可以利用這個缺陷,連續(xù)向WEB服務(wù)器發(fā)送垃圾數(shù)據(jù)直至WEB服務(wù)器內(nèi)存耗盡。這種攻擊方法基本不會留下痕跡。
http://www.cnpaf.net/Class/HTTP/0532918532667330.html
4、利用HTTP協(xié)議的特性進行拒絕服務(wù)攻擊的一些構(gòu)思
服務(wù)器端忙于處理攻擊者偽造的TCP連接請求而無暇理睬客戶的正常請求(畢竟客戶端的正常請求比率非常之小),此時從正常客戶的角度看來,服務(wù)器失去響應(yīng),這種情況我們稱作:服務(wù)器端受到了SYNFlood攻擊(SYN洪水攻擊)。
而Smurf、TearDrop等是利用ICMP報文來Flood和IP碎片攻擊的。本文用“正常連接”的方法來產(chǎn)生拒絕服務(wù)攻擊。
19端口在早期已經(jīng)有人用來做Chargen攻擊了,即Chargen_Denial_of_Service,但是!他們用的方法是在兩臺 Chargen 服務(wù)器之間產(chǎn)生UDP連接,讓服務(wù)器處理過多信息而DOWN掉,那么,干掉一臺WEB服務(wù)器的條件就必須有2個:1.有Chargen服務(wù)2.有HTTP 服務(wù)
方法:攻擊者偽造源IP給N臺Chargen發(fā)送連接請求(Connect),Chargen接收到連接后就會返回每秒72字節(jié)的字符流(實際上根據(jù)網(wǎng)絡(luò)實際情況,這個速度更快)給服務(wù)器。
5、Http指紋識別技術(shù)
Http指紋識別的原理大致上也是相同的:記錄不同服務(wù)器對Http協(xié)議執(zhí)行中的微小差別進行識別.Http指紋識別比TCP/IP堆棧指紋識別復(fù)雜許多,理由是定制Http服務(wù)器的配置文件、增加插件或組件使得更改Http的響應(yīng)信息變的很容易,這樣使得識別變的困難;然而定制TCP/IP堆棧的行為需要對核心層進行修改,所以就容易識別.
要讓服務(wù)器返回不同的Banner信息的設(shè)置是很簡單的,象Apache這樣的開放源代碼的Http服務(wù)器,用戶可以在源代碼里修改Banner信息,然后重起Http服務(wù)就生效了;對于沒有公開源代碼的Http服務(wù)器比如微軟的IIS或者是Netscape,可以在存放Banner信息的Dll文件中修改,相關(guān)的文章有討論的,這里不再贅述,當然這樣的修改的效果還是不錯的.另外一種模糊Banner信息的方法是使用插件。
常用測試請求:
1:HEAD/Http/1.0發(fā)送基本的Http請求
2:DELETE/Http/1.0發(fā)送那些不被允許的請求,比如Delete請求
3:GET/Http/3.0發(fā)送一個非法版本的Http協(xié)議請求
4:GET/JUNK/1.0發(fā)送一個不正確規(guī)格的Http協(xié)議請求
Http指紋識別工具Httprint,它通過運用統(tǒng)計學(xué)原理,組合模糊的邏輯學(xué)技術(shù),能很有效的確定Http服務(wù)器的類型.它可以被用來收集和分析不同Http服務(wù)器產(chǎn)生的簽名。
6、其他:為了提高用戶使用瀏覽器時的性能,現(xiàn)代瀏覽器還支持并發(fā)的訪問方式,瀏覽一個網(wǎng)頁時同時建立多個連接,以迅速獲得一個網(wǎng)頁上的多個圖標,這樣能更快速完成整個網(wǎng)頁的傳輸。
HTTP1.1中提供了這種持續(xù)連接的方式,而下一代HTTP協(xié)議:HTTP-NG更增加了有關(guān)會話控制、豐富的內(nèi)容協(xié)商等方式的支持,來提供更高效率的連接。