這里所說的“小偷”指的是在ASP中運用XML中的XMLHTTP組件提供的強大功能,把遠程網(wǎng)站上的數(shù)據(jù)(圖片,網(wǎng)頁及其他文件)抓取到本地,經(jīng)過各種處理后顯示到頁面上或者存儲進數(shù)據(jù)庫的一類程序。你可以通過這種小偷程序,完成過去一些似乎完全不可能實現(xiàn)的任務,比如說把某個站的頁面偷梁換柱后變成自己的頁面,或者把某個站的一些數(shù)據(jù)(文章,圖片)保存到本地數(shù)據(jù)庫中加以利用?!靶⊥怠钡膬?yōu)點有:無須維護網(wǎng)站,因為小偷程序中的數(shù)據(jù)來自其他網(wǎng)站,它將隨著該網(wǎng)站的更新而更新;可以節(jié)省大量的服務器資源,一般小偷程序就幾個文件,所有網(wǎng)頁內(nèi)容都是來自其他網(wǎng)站。缺點在于:不穩(wěn)定,如果目標網(wǎng)站出錯,程序也會出錯,而且,如果目標網(wǎng)站進行升級維護,那么小偷程序也要進行相應修改;速度,因為是遠程調(diào)用,速度和在本地服務器上讀取數(shù)據(jù)比起來,肯定要慢一些。怎么樣,聽起來很神奇吧?我們現(xiàn)在就開始來學習一些“小偷”程序的入門知識吧!
我們拿個簡單點的東西來研究一下吧,QQ網(wǎng)站上的天氣預報程序
代碼如下:
%
On Error Resume Next
Server.ScriptTimeOut=9999999
Function getHTTPPage(Path)
t = GetBody(Path)
getHTTPPage=BytesToBstr(t,"GB2312")
End function
' 首先,進行小偷程序的一些初始化設(shè)置,以上代碼的作用分別是忽略掉所有非致命性錯誤,把小偷程序的運行超時時間設(shè)置得很長(這樣不會出現(xiàn)運行超時的錯誤),轉(zhuǎn)換原來默認的UTF-8編碼轉(zhuǎn)換成GB2312編碼,否則直接用XMLHTTP組件調(diào)用有中文字符的網(wǎng)頁得到的將是亂碼。
Function GetBody(url)
on error resume next
Set Retrieval = CreateObject("Microsoft.XMLHTTP")
With Retrieval
.Open "Get", url, False, "", ""
.Send
GetBody = .ResponseBody
End With
Set Retrieval = Nothing
End Function
'然后調(diào)用XMLHTTP組件創(chuàng)建一個對象并進行初始化設(shè)置。
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
Function Newstring(wstr,strng)
Newstring=Instr(lcase(wstr),lcase(strng))
if Newstring=0 then Newstring=Len(wstr)
End Function
'處理抓取回來的數(shù)據(jù)需要調(diào)用adodb.stream組件并進行初始化設(shè)置。%>
'以下即為頁面顯示部分
%
Dim wstr,str,url,start,over,city
'定義一些需要使用到的變量
city = Request.QueryString("id")
'程序傳回的ID變量(即用戶選擇的城市)賦給id
url="http://appnews.qq.com/cgi-bin/news_qq_search?city="city""
'這里設(shè)置需要抓取的頁面地址,當然你也可以直接指定某個地址而不使用變量
wstr=getHTTPPage(url)
'獲取指定頁面的全部數(shù)據(jù)
start=Newstring(wstr," html>")
'這里設(shè)置需要處理的數(shù)據(jù)的頭部,這個變量應視不同情況而設(shè)置,具體內(nèi)容可以通過查看需要抓取的頁面的源代碼來確定。因為在這個程序里我們需要抓取整個頁面,所以設(shè)置為頁面全部抓取。注意,設(shè)置的內(nèi)容必須是頁面內(nèi)容唯一的,不可以重復。
over=Newstring(wstr," /HTML>")
'和start相對應的就是需要處理的數(shù)據(jù)的尾部,同樣的,設(shè)置的內(nèi)容必須是頁面中唯一的。
body=mid(wstr,start,over-start)
'設(shè)置顯示頁面的范圍
'下面就是動用乾坤挪移+++的時候了,通過replace可以用一些字符替換掉數(shù)據(jù)中指定的字符。
body = replace(body,"skin1","天氣預報 - 斯克網(wǎng)絡")
body = replace(body,"http://appnews.qq.com/cgi-bin/news_qq_search?city","tianqi.asp?id")
'本程序中已經(jīng)完成了替換的工作,如果有其他需要的話可以繼續(xù)進行類似的替換操作。
response.write body
%>
替換完需要修改的內(nèi)容后,就可以把修改的內(nèi)容顯示在頁面上了。至此程序結(jié)束
程序使用方法及結(jié)果:把上述代碼去掉說明部分后保存為tianqi.asp,上傳到支持ASP和XML的空間下,在瀏覽器中運行即可。你可以在在這個程序的基礎(chǔ)上進行進一步的界面美化或者程序優(yōu)化。
以上只是一些關(guān)于XMLHTTP組件的初級應用,實際上它還能實現(xiàn)的功能還有很多,比如說保存遠程圖片到本地服務器上,配合adodb.stream組件可以把獲取來的數(shù)據(jù)保存進數(shù)據(jù)庫。小偷的作用和使用范圍都很廣。但是不可以拿來做違法的事哦!
也許還有人要問了,這種“小偷”程序難道只是ASP的專利嗎?非也,PHP通過fopen函數(shù)一樣可以實現(xiàn)同樣的效果,由于PHP本身的各種特點,寫出來的小偷程序和ASP相比,在體積和執(zhí)行效率上都有者明顯的優(yōu)勢,但限于篇幅,這里就不一一說明了。
您可能感興趣的文章:- ASP小偷(遠程數(shù)據(jù)獲取)程序入門教程
- 從零開始學ASP.NET-基礎(chǔ)篇
- ASP.NET與MySQL數(shù)據(jù)庫簡明圖示入門教程
- FLASH與ASP通信入門教程——做真正屬于自己的留言本
- [ASP.NET Ajax] ECMAScript基礎(chǔ)類以及Asp.net Ajax對類lt;Objectgt;的擴展
- ASP.net基礎(chǔ)知識之常見錯誤分析
- asp經(jīng)典入門教程 在ASP中使用SQL 語句
- ASP.NET MVC小結(jié)之基礎(chǔ)篇(一)
- ASP.NET MVC小結(jié)之基礎(chǔ)篇(二)
- ASP基礎(chǔ)入門第一篇(ASP技術(shù)簡介)