javascript字母大小写转换toLocaleUpperCase,toUpperCase,toLocaleLowerCase,toLowerCase

toLowerCase() 方法用于把字符串转换为小写。

语法:stringObject.toLowerCase()

 

返回值:一个新的字符串,在其中 stringObject 的所有大写字符全部被转换为了小写字符。

  • <script type="text/javascript">
  • var str="Hello World!"
  • document.write(str.toLowerCase())
  • </script>

toUpperCase() 方法用于把字符串转换为大写。

语法:stringObject.toUpperCase()

返回值:一个新的字符串,在其中 stringObject 的所有小写字符全部被转换为了大写字符。

  • <script type="text/javascript">
  • var str="Hello World!"
  • document.write(str.toUpperCase())
  • </script>

--------------------

js实现字母大小写转换主要是用到了四个js函数,toLocaleUpperCase,toUpperCase,toLocaleLowerCase,toLowerCase 下面就这四个实现大小写转换的js函数逐一做简单的分析。

  • toLocaleUpperCase 将字符串中所有的字母字符都将被转换为大写的,同时适应宿主环境的当前区域设置。
  • toUpperCase 将字符串中的所有字母都被转化为大写字母。
  • toLocaleLowerCase 将字符串所有的字母字符都被转换为小写,同时考虑到宿主环境的当前区域设置。
  • toLowerCase 将字符串中的字母被转换为小写字母。

我们可以看到 toLocaleUpperCase 和 toUpperCase 功能都是一样的,toLocaleLowerCase 和 toLowerCase 也是一样的功能,那么他们有什么区别呢

  • (1)toLocaleUpperCase toLocaleLowerCase 这两个函数在转换字符串中的字符时,同时将适应宿主环境的当前区域设置。在大多数情况下,其结果与利用 toUpperCase toLowerCase 这两个函数所得到的结果是一样的。但是如果语言规则与常规的 Unicode 大小写映射方式冲突,那么结果就会不同。
  • (2)toUpperCase toLowerCase 方法不会转换字符串中的非字母字符。

---------------------

在toUpperCase()函数中,字符ı会转变为I,字符ſ会变为S。在toLowerCase()函数中,字符İ会转变为i,字符K会转变为k。利用这些特性可以绕过xss的某些防御。

toUpperCase():
ı  ==>I
ſ  ==>S


toLowerCase():
İ  ==>i
K  ==>k

不如我们来fuzz一下,看看toUpperCase功能如何?

if (!String.fromCodePoint) {
    (function() {
        var defineProperty = (function() {
            // IE 8 only supports `Object.defineProperty` on DOM elements
            try {
                var object = {};
                var $defineProperty = Object.defineProperty;
                var result = $defineProperty(object, object, object) && $defineProperty;
            } catch(error) {}
            return result;
        }());
        var stringFromCharCode = String.fromCharCode;
        var floor = Math.floor;
        var fromCodePoint = function() {
            var MAX_SIZE = 0x4000;
            var codeUnits = [];
            var highSurrogate;
            var lowSurrogate;
            var index = -1;
            var length = arguments.length;
            if (!length) {
                return '';
            }
            var result = '';
            while (++index < length) {
                var codePoint = Number(arguments[index]);
                if (
                    !isFinite(codePoint) || // `NaN`, `+Infinity`, or `-Infinity`
                    codePoint < 0 || // not a valid Unicode code point
                    codePoint > 0x10FFFF || // not a valid Unicode code point
                    floor(codePoint) != codePoint // not an integer
                ) {
                    throw RangeError('Invalid code point: ' + codePoint);
                }
                if (codePoint <= 0xFFFF) { // BMP code point
                    codeUnits.push(codePoint);
                } else { // Astral code point; split in surrogate halves
                    // http://mathiasbynens.be/notes/javascript-encoding#surrogate-formulae
                    codePoint -= 0x10000;
                    highSurrogate = (codePoint >> 10) + 0xD800;
                    lowSurrogate = (codePoint % 0x400) + 0xDC00;
                    codeUnits.push(highSurrogate, lowSurrogate);
                }
                if (index + 1 == length || codeUnits.length > MAX_SIZE) {
                    result += stringFromCharCode.apply(null, codeUnits);
                    codeUnits.length = 0;
                }
            }
            return result;
        };
        if (defineProperty) {
            defineProperty(String, 'fromCodePoint', {
                'value': fromCodePoint,
                'configurable': true,
                'writable': true
            });
        } else {
            String.fromCodePoint = fromCodePoint;
        }
    }());
}
for (var j = 'A'.charCodeAt(); j <= 'Z'.charCodeAt(); j++){
    var s = String.fromCodePoint(j);
    for (var i = 0; i < 0x10FFFF; i++) {
        var e = String.fromCodePoint(i);
        if (s == e.toUpperCase() && s != e) {
            document.write("char: "+e+"<br/>");
    };
};
}

其中混入了两个奇特的字符”ı”、”ſ”。

    这两个字符的“大写”是I和S。也就是说”ı”.toUpperCase() == ‘I’,”ſ”.toUpperCase() == ‘S’。通过这个小特性可以绕过一些限制。

    同样,toLowerCase也有同样的字符:

    这个”K”的“小写”字符是k,也就是”K”.toLowerCase() == ‘k’.

 

 

·····

未经允许不得转载:朱邦邦的博客 » javascript字母大小写转换toLocaleUpperCase,toUpperCase,toLocaleLowerCase,toLowerCase

赞 (0)

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址