|
888 | 888 | "cell_type": "markdown", |
889 | 889 | "metadata": {}, |
890 | 890 | "source": [ |
891 | | - "사실 영어 알파벳 소문자로 시작하는 문자열은 무조건 대문자 알파벳으로 시작하는 임의의 문자열보다 크다." |
| 891 | + "사실 영어 알파벳 소문자로 시작하는 문자열은 무조건 대문자 알파벳으로 시작하는 문자열보다 크다." |
892 | 892 | ] |
893 | 893 | }, |
894 | 894 | { |
|
951 | 951 | "cell_type": "markdown", |
952 | 952 | "metadata": {}, |
953 | 953 | "source": [ |
954 | | - ":::{tip} 유니코드 포인트\n", |
955 | | - "\n", |
956 | | - "유니코드 포인트<font size='2'>Unicode code point</font>는 유니코드에서 각 문자를 식별하기 위해 부여한 정수 번호이다.\n", |
957 | | - "예를 들어, 대문자 ‘A’는 U+0041(10진수 65), 소문자 ‘a’는 U+0061(10진수 97)로 표현되며,\n", |
958 | | - "이런한 이유로 대문자 알파벳이 소문자 알파벳보다 작다고 판단한다.\n", |
959 | | - ":::" |
| 954 | + "### 유니코드" |
| 955 | + ] |
| 956 | + }, |
| 957 | + { |
| 958 | + "cell_type": "markdown", |
| 959 | + "metadata": {}, |
| 960 | + "source": [ |
| 961 | + "**유니코드**<font size='2'>Unicode</font>란 전 세계 모든 문자를 하나의 표준 체계로 정의해 각 문자에 고유한 번호를 부여하는 국제 문자 인코딩 표준이다. 각 문자에 부여된 고유 번호를 **유니코드 코드 포인트**<font size='2'>Unicode code point</font> 또는 단순히 코드 포인트라 부른다.\n", |
| 962 | + "예를 들어, 한글 자음 `ㄱ`, `ㄲ`, `ㅎ`의 코드 포인트는 각각 12593, 12594, 12622다.\n", |
| 963 | + "문자의 코드 포인트는 `ord()` 함수를 이용하여 확인할 수 있다." |
| 964 | + ] |
| 965 | + }, |
| 966 | + { |
| 967 | + "cell_type": "code", |
| 968 | + "execution_count": 38, |
| 969 | + "metadata": {}, |
| 970 | + "outputs": [ |
| 971 | + { |
| 972 | + "data": { |
| 973 | + "text/plain": [ |
| 974 | + "12593" |
| 975 | + ] |
| 976 | + }, |
| 977 | + "execution_count": 38, |
| 978 | + "metadata": {}, |
| 979 | + "output_type": "execute_result" |
| 980 | + } |
| 981 | + ], |
| 982 | + "source": [ |
| 983 | + "ord('ㄱ')" |
| 984 | + ] |
| 985 | + }, |
| 986 | + { |
| 987 | + "cell_type": "code", |
| 988 | + "execution_count": 39, |
| 989 | + "metadata": {}, |
| 990 | + "outputs": [ |
| 991 | + { |
| 992 | + "data": { |
| 993 | + "text/plain": [ |
| 994 | + "12594" |
| 995 | + ] |
| 996 | + }, |
| 997 | + "execution_count": 39, |
| 998 | + "metadata": {}, |
| 999 | + "output_type": "execute_result" |
| 1000 | + } |
| 1001 | + ], |
| 1002 | + "source": [ |
| 1003 | + "ord('ㄲ')" |
| 1004 | + ] |
| 1005 | + }, |
| 1006 | + { |
| 1007 | + "cell_type": "markdown", |
| 1008 | + "metadata": {}, |
| 1009 | + "source": [] |
| 1010 | + }, |
| 1011 | + { |
| 1012 | + "cell_type": "code", |
| 1013 | + "execution_count": 40, |
| 1014 | + "metadata": {}, |
| 1015 | + "outputs": [ |
| 1016 | + { |
| 1017 | + "data": { |
| 1018 | + "text/plain": [ |
| 1019 | + "12622" |
| 1020 | + ] |
| 1021 | + }, |
| 1022 | + "execution_count": 40, |
| 1023 | + "metadata": {}, |
| 1024 | + "output_type": "execute_result" |
| 1025 | + } |
| 1026 | + ], |
| 1027 | + "source": [ |
| 1028 | + "ord('ㅎ')" |
| 1029 | + ] |
| 1030 | + }, |
| 1031 | + { |
| 1032 | + "cell_type": "markdown", |
| 1033 | + "metadata": {}, |
| 1034 | + "source": [ |
| 1035 | + "반면에 한글 모음 `ㅏ`와 `ㅑ`의 코드포인트는 다음과 같다." |
| 1036 | + ] |
| 1037 | + }, |
| 1038 | + { |
| 1039 | + "cell_type": "code", |
| 1040 | + "execution_count": 41, |
| 1041 | + "metadata": {}, |
| 1042 | + "outputs": [ |
| 1043 | + { |
| 1044 | + "data": { |
| 1045 | + "text/plain": [ |
| 1046 | + "12623" |
| 1047 | + ] |
| 1048 | + }, |
| 1049 | + "execution_count": 41, |
| 1050 | + "metadata": {}, |
| 1051 | + "output_type": "execute_result" |
| 1052 | + } |
| 1053 | + ], |
| 1054 | + "source": [ |
| 1055 | + "ord('ㅏ')" |
| 1056 | + ] |
| 1057 | + }, |
| 1058 | + { |
| 1059 | + "cell_type": "code", |
| 1060 | + "execution_count": 42, |
| 1061 | + "metadata": {}, |
| 1062 | + "outputs": [ |
| 1063 | + { |
| 1064 | + "data": { |
| 1065 | + "text/plain": [ |
| 1066 | + "12625" |
| 1067 | + ] |
| 1068 | + }, |
| 1069 | + "execution_count": 42, |
| 1070 | + "metadata": {}, |
| 1071 | + "output_type": "execute_result" |
| 1072 | + } |
| 1073 | + ], |
| 1074 | + "source": [ |
| 1075 | + "ord('ㅑ')" |
| 1076 | + ] |
| 1077 | + }, |
| 1078 | + { |
| 1079 | + "cell_type": "markdown", |
| 1080 | + "metadata": {}, |
| 1081 | + "source": [ |
| 1082 | + "영어 알파벳의 코드 포인트는 다음과 같다." |
| 1083 | + ] |
| 1084 | + }, |
| 1085 | + { |
| 1086 | + "cell_type": "markdown", |
| 1087 | + "metadata": {}, |
| 1088 | + "source": [ |
| 1089 | + "| 문자 | 코드 포인트 (Hex) | 코드 포인트 (Decimal) |\n", |
| 1090 | + "| :---: | :---: | :---: |\n", |
| 1091 | + "| a | U+0061 | 97 |\n", |
| 1092 | + "| ⋮ | ⋮ | ⋮ |\n", |
| 1093 | + "| z | U+007A | 122 |\n", |
| 1094 | + "| A | U+0041 | 65 |\n", |
| 1095 | + "| ⋮ | ⋮ | ⋮ |\n", |
| 1096 | + "| Z | U+005A | 90 |" |
960 | 1097 | ] |
961 | 1098 | }, |
962 | 1099 | { |
|
0 commit comments