페이지 문자 인 코딩 난 장 판 문 제 를 철저히 해결 하 다.

본 고 는 문자열 을 유 니 코드 형식 으로 인 코딩 함으로써 데이터 가 전시 와 전송 과정 에서 실수 가 없 도록 하 는 방법 을 제공 합 니 다.클 라 이언 트 브 라 우 저가 인 코딩 을 어떻게 바 꾸 든 지 간 에 페이지 의 인 코딩 은 흐 트 러 지지 않 습 니 다.HTML/XML 에 대해 서 는&\#+10 비트 유 니 코드 코드+를 사용 합 니 다.형식 포맷 문자 입 니 다.JS 에 대해 서 는\u+4 비트 유 니 코드 코드 를 사용 하여 문자열 을 포맷 합 니 다.예 시 는 C\#로 작성 되 었 으 며 중국어,러시아어,한국어,일본 어 를 사용 하여 보 여 줍 니 다.PHP 에 대해 서 는 문장의 끝 에 언급 될 것 이다.우선,String 의 확장 클래스 가 있 습 니 다.
 
using System.Text.RegularExpressions;
namespace XXOO
{
/// <summary>
/// , Html
/// </summary>
public static class StringExtension
{
private static string GetHtmlEncodedStr(Match m)
{
string x = m.ToString();
return string.Format("&#{0};", (int)x[0]);
}
/// <summary>
/// HTML
/// </summary>
/// <param name="text"> </param>
/// <returns> : </returns>
public static string HtmlEncode( this string text )
{
return Regex.Replace(text
, "([^\\000-\\127]|&|\\\"|\\<|\\>|')"
, new MatchEvaluator(GetHtmlEncodedStr)
, RegexOptions.ECMAScript | RegexOptions.Compiled
);
}
private static string GetScriptEncodedStr(Match m)
{
string x = m.ToString();
return "\\u" + string.Format("{0:X}", (int)x[0]).PadLeft( 4, '0');
}
/// <summary>
/// Unicode :\uXXXX
/// </summary>
/// <param name="text"> </param>
/// <returns> :\u4E2D\u6587\u4E30\u539A\u8B66\u65B9</returns>
public static string ScriptEncode( this string text )
{
return Regex.Replace(text
, "([^\\000-\\127]|&|\\\"|'|\\<|\\>|\
|\\r|\\t)"
, new MatchEvaluator(GetScriptEncodedStr)
, RegexOptions.ECMAScript | RegexOptions.Compiled
);
}
}
}
은 테스트 페이지 에 사용 할 수 있 는 두 가지 방법 을 제공 했다.테스트 페이지(ASP.Net)
 
<%@ Page Language="C#" AutoEventWireup="true" CodeBehind="WebForm1.aspx.cs" Inherits="WebApplication1.WebForm1" %>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head runat="server">
<title></title>
</head>
<body>
<form id="form1" runat="server">
<pre runat="Server" id="pre"></pre>
<asp:PlaceHolder runat="Server" ID="placeHolder"></asp:PlaceHolder>
</form>
</body>
</html>
테스트 페이지 코드:
 
using XXOO;
namespace WebApplication1
{
public partial class WebForm1 : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{
var str = @"
Китайское посольство в Ираке и Багдаде отделение
이라크에서 중국 대사관과 알의 바그다드 지사 - 만수르 호텔
イラクでの ^やアルのバグダッド -マンス`ルホテル
1234567890!@#$%^&*()<>""'\|}{][:;
";
pre.InnerHtml = str.HtmlEncode();
HtmlGenericControl control = new HtmlGenericControl("script");
control.Attributes["language"] = "javascript";
control.Attributes["type"] = "text/javascript";
control.InnerHtml = string.Format("alert(\"{0}\");", str.ScriptEncode());
placeHolder.Controls.Add(control);
}
}
}
이 실 행 된 후 받 은 HTML:
 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head><title>
</title></head>
<body>
<form name="form1" method="post" action="WebForm1.aspx" id="form1">
<pre id="pre">&#20013;&#25991;&#20016;&#21402;&#35686;&#26041;&#36807;&#21518;&#21457;&#36798;&#30475;&#35265;&#21457;&#30340;&#35805;&#35813;&#24555;&#21457;&#21160;&#26426;&#21518;&#36141;&#25151;&#36151;&#27454;&#22909;
&#1050;&#1080;&#1090;&#1072;&#1081;&#1089;&#1082;&#1086;&#1077; &#1087;&#1086;&#1089;&#1086;&#1083;&#1100;&#1089;&#1090;&#1074;&#1086; &#1074; &#1048;&#1088;&#1072;&#1082;&#1077; &#1080; &#1041;&#1072;&#1075;&#1076;&#1072;&#1076;&#1077; &#1086;&#1090;&#1076;&#1077;&#1083;&#1077;&#1085;&#1080;&#1077;
&#51060;&#46972;&#53356;&#50640;&#49436; &#51473;&#44397; &#45824;&#49324;&#44288;&#44284; &#50508;&#51032; &#48148;&#44536;&#45796;&#46300; &#51648;&#49324; - &#47564;&#49688;&#47476; &#54840;&#53588;
&#12452;&#12521;&#12463;&#12391;&#12398;&#22823;&#20351;&#39208;&#12420;&#12450;&#12523;&#12398;&#12496;&#12464;&#12480;&#12483;&#12489;&#25903;&#23616;-&#12510;&#12531;&#12473;&#12540;&#12523;&#12507;&#12486;&#12523;
1234567890!@#$%&#94;&#38;*()&#60;&#62;&#34;&#39;&#92;&#124;&#125;&#123;&#93;&#91;:;
</pre>
<script language="javascript" type="text/javascript"><!--
alert("\u4E2D\u6587\u4E30\u539A\u8B66\u65B9\u8FC7\u540E\u53D1\u8FBE\u770B\u89C1\u53D1\u7684\u8BDD\u8BE5\u5FEB\u53D1\u52A8\u673A\u540E\u8D2D\u623F\u8D37\u6B3E\u597D\u000D\u000A\u041A\u0438\u0442\u0430\u0439\u0441\u043A\u043E\u0435 \u043F\u043E\u0441\u043E\u043B\u044C\u0441\u0442\u0432\u043E \u0432 \u0418\u0440\u0430\u043A\u0435 \u0438 \u0411\u0430\u0433\u0434\u0430\u0434\u0435 \u043E\u0442\u0434\u0435\u043B\u0435\u043D\u0438\u0435 \u000D\u000A\uC774\uB77C\uD06C\uC5D0\uC11C \uC911\uAD6D \uB300\uC0AC\uAD00\uACFC \uC54C\uC758 \uBC14\uADF8\uB2E4\uB4DC \uC9C0\uC0AC - \uB9CC\uC218\uB974 \uD638\uD154\u000D\u000A\u30A4\u30E9\u30AF\u3067\u306E\u5927\u4F7F\u9928\u3084\u30A2\u30EB\u306E\u30D0\u30B0\u30C0\u30C3\u30C9\u652F\u5C40-\u30DE\u30F3\u30B9\u30FC\u30EB\u30DB\u30C6\u30EB\u000D\u000A1234567890!@#$%\u005E\u0026*()\u003C\u003E\u0022\u0027\u005C\u007C\u007D\u007B\u005D\u005B:;\u000D\u000A");
// --></script>
</form>
</body>
</html>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" >
<head><title>
</title></head>
<body>
<form name="form1" method="post" action="WebForm1.aspx" id="form1">
<pre id="pre">&#20013;&#25991;&#20016;&#21402;&#35686;&#26041;&#36807;&#21518;&#21457;&#36798;&#30475;&#35265;&#21457;&#30340;&#35805;&#35813;&#24555;&#21457;&#21160;&#26426;&#21518;&#36141;&#25151;&#36151;&#27454;&#22909;
&#1050;&#1080;&#1090;&#1072;&#1081;&#1089;&#1082;&#1086;&#1077; &#1087;&#1086;&#1089;&#1086;&#1083;&#1100;&#1089;&#1090;&#1074;&#1086; &#1074; &#1048;&#1088;&#1072;&#1082;&#1077; &#1080; &#1041;&#1072;&#1075;&#1076;&#1072;&#1076;&#1077; &#1086;&#1090;&#1076;&#1077;&#1083;&#1077;&#1085;&#1080;&#1077;
&#51060;&#46972;&#53356;&#50640;&#49436; &#51473;&#44397; &#45824;&#49324;&#44288;&#44284; &#50508;&#51032; &#48148;&#44536;&#45796;&#46300; &#51648;&#49324; - &#47564;&#49688;&#47476; &#54840;&#53588;
&#12452;&#12521;&#12463;&#12391;&#12398;&#22823;&#20351;&#39208;&#12420;&#12450;&#12523;&#12398;&#12496;&#12464;&#12480;&#12483;&#12489;&#25903;&#23616;-&#12510;&#12531;&#12473;&#12540;&#12523;&#12507;&#12486;&#12523;
1234567890!@#$%&#94;&#38;*()&#60;&#62;&#34;&#39;&#92;&#124;&#125;&#123;&#93;&#91;:;
</pre>
<script language="javascript" type="text/javascript"><!--
alert("\u4E2D\u6587\u4E30\u539A\u8B66\u65B9\u8FC7\u540E\u53D1\u8FBE\u770B\u89C1\u53D1\u7684\u8BDD\u8BE5\u5FEB\u53D1\u52A8\u673A\u540E\u8D2D\u623F\u8D37\u6B3E\u597D\u000D\u000A\u041A\u0438\u0442\u0430\u0439\u0441\u043A\u043E\u0435 \u043F\u043E\u0441\u043E\u043B\u044C\u0441\u0442\u0432\u043E \u0432 \u0418\u0440\u0430\u043A\u0435 \u0438 \u0411\u0430\u0433\u0434\u0430\u0434\u0435 \u043E\u0442\u0434\u0435\u043B\u0435\u043D\u0438\u0435 \u000D\u000A\uC774\uB77C\uD06C\uC5D0\uC11C \uC911\uAD6D \uB300\uC0AC\uAD00\uACFC \uC54C\uC758 \uBC14\uADF8\uB2E4\uB4DC \uC9C0\uC0AC - \uB9CC\uC218\uB974 \uD638\uD154\u000D\u000A\u30A4\u30E9\u30AF\u3067\u306E\u5927\u4F7F\u9928\u3084\u30A2\u30EB\u306E\u30D0\u30B0\u30C0\u30C3\u30C9\u652F\u5C40-\u30DE\u30F3\u30B9\u30FC\u30EB\u30DB\u30C6\u30EB\u000D\u000A1234567890!@#$%\u005E\u0026*()\u003C\u003E\u0022\u0027\u005C\u007C\u007D\u007B\u005D\u005B:;\u000D\u000A");
// --></script>
</form>
</body>
</html>
이렇게 브 라 우 저가 어떤 인 코딩 을 사용 하 더 라 도 페이지 에 난 장 판이 생기 지 않 습 니 다.PHP PHP 의 경우 복잡 하 므 로 my sql 인 코딩 을 고려 해 야 합 니 다.이것들 은 잠시 논 하지 않 겠 다.다음은 GBK 를 HTML 인 코딩 하 는 예 를 들 어 보 겠 습 니 다.참고 로
 
function htmlEncode($text)
{
$encoded = "";
for( $index = 0; $index < strlen($text); $index++)
{
if( ord($text[$index]) <= 127 )
{
switch(ord($text[$index]))
{
case 34:
case 38:
case 39:
case 60:
case 62:
$encoded .= "&#" .ord($text[$index]).";";
break;
default:
$encoded .= $text[$index];
}
}
else
{
$char = $text[$index] . $text[$index+1];
$char = mb_convert_encoding( $char, "utf-16", "gbk");
$encoded .= "&#" . (ord($char[0])*256 + ord($char[1])) . ";";
$index++;
}
}
return $encoded;
}
function htmlEncode($text)
{
$encoded = "";
for( $index = 0; $index < strlen($text); $index++)
{
if( ord($text[$index]) <= 127 )
{
switch(ord($text[$index]))
{
case 34:
case 38:
case 39:
case 60:
case 62:
$encoded .= "&#" .ord($text[$index]).";";
break;
default:
$encoded .= $text[$index];
}
}
else
{
$char = $text[$index] . $text[$index+1];
$char = mb_convert_encoding( $char, "utf-16", "gbk");
$encoded .= "&#" . (ord($char[0])*256 + ord($char[1])) . ";";
$index++;
}
}
return $encoded;
}
후 XML 을 통 해 돌아 오 면 난 코드 를 철저히 차단 할 수 있 습 니 다.
 
echo "<?xml version=\"1.0\" encoding=\"utf-8\"?>
";
echo "<result>";
echo "<success>". ($success ? 1 : 0) ."</success>";
echo "<message>" . htmlEncode($message) . "</message>";
if( $success )
{
echo "<nickname>" . htmlEncode($nickname) . "</nickname>";
echo "<userId>".$userId."</userId>";
echo "<siteId>".$siteId."</siteId>";
echo "<isTeacher>". ($isTeacher ? 1 : 0) ."</isTeacher>";
echo "<ipAddress>" . htmlEncode($ipAddress) . "</ipAddress>";
}
echo "</result>";
본 고 는 CSDN 블 로그 에서 왔 습 니 다.전재 할 때 출처 를 표시 해 주 십시오.http://blog.csdn.net/wangjia184/archive/2009/10/26/4728318.aspx

좋은 웹페이지 즐겨찾기