hahahia

아스키코드 vs 유니코드(01. Windows에서의 유니코드(UNICODE)) 본문

Windows Programming/Windows::System

아스키코드 vs 유니코드(01. Windows에서의 유니코드(UNICODE))

hahahia 2012. 3. 2. 14:13
SBCS(Single Byte Character Set)
- 문자를 표한하는데 있어서 1byte만을 사용하는 방식.
- 대표적인 예로는 ASCII  Code

MBCS(Multi Byte Character Set)
- 한글은 2Byte, 영어는 1Byte
- 문자열의 종류에 따라 다른 크기를 가진다.
- 유니코드는 아님.

WBCS(Wide Byte Character Set)
- 모든 문자를 2Byte로 처리
- 유니코드(UNICODE)
- 안정적이므로 많이 사용한다.

/*     MBCS1.cpp    */

#include <stdio.h>
#include <string.h>

int main(void)
{
char str[] = "ABC한글";
int size = sizeof(str);
int len = strlen(str);

printf("배열의 크기 : %d\n", size); // 8
printf("문자열 길이 : %d\n", len); // 7

return 0;


배열의 크기 : ABC(3바이트) + 한글(4바이트) + NULL문자(1바이트) = 8
문자열 길이 : ABC(3바이트) + 한글(4바이트) = 7 

실제로 문자열 길이는 5이지만 출력 결과는 7이다.
이러한 부분에서 MBCS에서 문제가 생긴다.

WBCS 기반의 프로그래밍 

1. char을 대신하는 wchar_t
2. "ABC"(ASCII CODE)를 대신하는 L"ABC"(UNICODE)
3. strlen을 대신하는 wcslen(WBCS 기반의 문자열 조작 함수를 사용해야한다)


 


ex)

#include <stdio.h>


int wmain(int argc, wchar_t* argv[])

{

       for(int i = 1 ; i < argc; i++)

       {

                wprintf(L"%s", argv[i]);

       }

       return 0;

}


출처. 윈도우즈 프로그래밍 | 윤성우 저  | 한빛미디어 

Comments