Classic ASP Function Strip/Remove HTML Tag/Element With Regular Expression Object

Fungsi untuk stripping HTML tag sebelumnya telah sempet di posting di blog ini, namun kali ini striping HTML dengan menggunakan Regular Expression Object, dengan Regex blok kode menjadi lebih singkat tetapi ini memerlukan VBScript versi 5.1 ke atas. blok kode fungsinya seperti berikut ini:

Function RemHTMLRegex(s)
dim oRegex
s = Trim(s)
if isNull(s) or len(s) = 0 Then Exit function
On Error Resume Next
Set oRegex = New RegExp
If Err Then
s = “Failed.”
RemHTMLRegex = s
Exit Function
End If
With oRegex
.Global = True
.IgnoreCase = True
.Pattern = “<(/)?SCRIPT|META|STYLE([^>]*)>”
s = .Replace(s, “<$1SCRIPT$3>”)
.Pattern = “<(/)?(LINK|IFRAME|FRAMESET|FRAME|APPLET|OBJECT)([^>]*)>”
s = .Replace(s, “<$1LINK$3>”)
.Pattern = “(<A[^>]+href\s?=\s?”“?javascript:)[^”“]*(”“[^>]+>)”
s = .Replace(s, “$1//protected$2″)
.Pattern = “(<IMG[^>]+src\s?=\s?”“?javascript:)[^”“]*(”“[^>]+>)”
s = .Replace(s, “$1//protected$2″)
.Pattern = “<([^>]*) on[^=\s]+\s?=\s?([^>]*)>”
s = .Replace(s, “<$1$3>”)
End With
Set oRegex = Nothing
RemHTMLRegex = s
End function

Perbedaan diantar ke dua fungsi tersebut (regex vs core asp coding) ada pada algoritma pembandingan string HTML. dengan menggunakan Regular Expression (Regex) bisa membandingkan string dengan pattern secara spesifik misalnya mencari hanya tag <IFRAME> sehingga kata <bukan_html> tidak akan di replace. sedangkan dengan fungsi core ASP coding pencarian dengan memanfaatkan tag < dan > jadi kedua kata yang digunakan dalam contoh diatas akan di replace <IFRAME> dan <bukan_html>. so silakan di pakai sesuai dengan kebutuhan dan lingkungan sever anda.

1 Response to “Classic ASP Function Strip/Remove HTML Tag/Element With Regular Expression Object”


  1. 1 arix

    mo nanya nie,,, klo fungsi untuk membaca spasi ditengah2 pake fungsi ap ya?? klo dikiri kan pake LTrim, trz dikanan pake Rtrim, dn trim utk kri dan kanan,, nah klo ditengah2 pake ap dong?? misalnya kan ad yang memasukkan “sistem hardware” maka yang kebaca “sistem hardware”, gmn tuh caranya..
    tolong dibantu ya…
    terima kasih

Leave a Reply