::: 델파이 Tip&Trick :::

델파이 Tip&Trick 성격에 맞지 않는 광고,비방,질문의 글은 즉시 삭제하며
내용을 복사하여 사용할 경우 반드시 이곳(http://www.howto.pe.kr)을 출처로 명시하여 주세요


Category

  김영대(2004-10-22 18:09:30, Hit : 7708, Vote : 1257
 http://www.howto.pe.kr
 한글 한 음절을 초성,중성,종성 음소로 분해하기('김' => 'ㄱ'+'ㅣ'+'ㅁ')

(********************************************************************************
.작성자: 김영대 ( http://www.howto.pe.kr )
.참고: http://kiscos.net/~blackangel/Windows5.html

한글의 음절이란 초성+중성+종성(받침 있는 글자) 혹은 초성+중성(받침 없는 글자)으로
구성된 한글 한 글자를 말한다.
유니코드(Unicode)란 모든 언어를 표현할 수 있는 2바이트의 코드로 유니코드의 한글은
0xAC00 부터 시작하며 한글 음절의 갯수는 (초성 19)*(중성 21)*(종성 28)=11,172 이다.

한글 음절은 아래와 같은 공식으로 유니코드가 부여된다
  음절 유니코드
     = (0xAC00) + (초성 인덱스값* 0x024C) + (중성 인덱스값* 0x001C) + (종성 인덱스값)
     = (0xAC00) + (초성 인덱스값* 21*28) + (중성 인덱스값* 28) + (종성 인덱스값)

초성 19자, 중성 21자, 종성 28자(원래 27자 이지만 종성이 없는 경우까지 해서 28자)
이므로 각각의 인덱스 값과 문자는 아래와 같다. 종성의 첫번쨰 인덱스 문자는 공백
  초성 인덱스값: 0~18 (19개) 'ㄱㄲㄴㄷㄸㄹㅁㅂㅃㅅㅆㅇㅈㅉㅊㅋㅌㅍㅎ'
  중성 인덱스값: 0~20 (21개) 'ㅏㅐㅑㅒㅓㅔㅕㅖㅗㅘㅙㅚㅛㅜㅝㅞㅟㅠㅡㅢㅣ'
  종성 인덱스값: 0~27 (28개) ' ㄱㄲㄳㄴㄵㄶㄷㄹㄺㄻㄼㄽㄾㄿㅀㅁㅂㅄㅅㅆㅇㅈㅊㅋㅌㅍㅎ'

초성,중성,종성의 인덱스값을 계산하는 방법은 위 공식을 통하여 쉽게 만들수 있다.
  초성 인덱스값: (음절 유니코드 - 0xAC00) / (21*28)
  중성 인덱스값: (음절 유니코드 - 0xAC00) % (21*28) / 28
  종성 인덱스값: (음절 유니코드 - 0xAC00) % (21*28) % 28  {중간의 "% (21*28)"은 생략가능}

예제들면,
  '가' = (0xAC00) + (0*21*28) + (0*28) + (0) = 0xAC00
  '김' = (0xAC00) + (0*21*28) + (20*28) + (16) = 0xAE40
********************************************************************************)

unit Unit1;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls;

const
  MB_ERR_INVALID_CHARS = $00000008;

  // 초성 인덱스값에 대한 문자
  UChoseong : array [0..18] of WideString =
   ('ㄱ','ㄲ','ㄴ','ㄷ','ㄸ','ㄹ','ㅁ','ㅂ','ㅃ','ㅅ',
    'ㅆ','ㅇ','ㅈ','ㅉ','ㅊ','ㅋ','ㅌ','ㅍ','ㅎ');

  // 중성 인덱스값에 대한 문자
  UJungseong : array [0..20] of WideString =
   ('ㅏ','ㅐ','ㅑ','ㅒ','ㅓ','ㅔ','ㅕ','ㅖ','ㅗ','ㅘ',
    'ㅙ','ㅚ','ㅛ','ㅜ','ㅝ','ㅞ','ㅟ','ㅠ','ㅡ','ㅢ',
    'ㅣ');

  // 종성 인덱스값에 대한 문자
  UJongseong : array [0..27] of WideString =
   ('','ㄱ','ㄲ','ㄳ','ㄴ','ㄵ','ㄶ','ㄷ','ㄹ','ㄺ','ㄻ',
    'ㄼ','ㄽ','ㄾ','ㄿ','ㅀ','ㅁ','ㅂ','ㅄ','ㅅ','ㅆ',
    'ㅇ','ㅈ','ㅊ','ㅋ','ㅌ','ㅍ','ㅎ');

type
  TForm1 = class(TForm)
    Edit1: TEdit;
    Button1: TButton;
    Memo1: TMemo;
    Button2: TButton;
    procedure Button1Click(Sender: TObject);
    procedure FormCreate(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

function IsDigit(ch: Char): Boolean;
begin
  Result := ch in ['0'..'9'];
end;

procedure TForm1.Button1Click(Sender: TObject);
var
  i: integer;
  s1, s2: String;

  sSyllable, sChoseong, sJungseong, sJongseong: String;
  uSyllable: PWideChar;
  temp: WORD;
begin
  s1 := Edit1.text;

  i := 1;
  while i <= length(s1) do
  begin
    s2 := s1[i]+' = ';

    if IsCharAlphaNumeric(s1[i]) then
    begin
      s2 := s2 + '<영문 or 숫자>';

      if IsDigit(s1[i]) then
        s2 := s2 + '<숫자>'
      else if IsCharAlpha(s1[i]) then
      begin
        s2 := s2 + '<영문>';
        if IsCharLower(s1[i]) then
          s2 := s2 + '<소문자>'
        else if IsCharUpper(s1[i]) then
          s2 := s2 + '<대문자>'
      end;
    end
    // double byte character set(DBCS)의 lead byte이면 한글일 가능성이 있다
    // 아래 소스는 단음절이나 한문의 경우 정상동작을 하지 않지만
    // 약간만 분석해 보면 쉽게 수정할 수 있을것이다
    else if IsDBCSLeadByte(Byte(s1[i])) then
    begin
      // Convert sharename to Unicode
      sSyllable := Copy(s1, i, 2); // 문자열 음절
      s2 := sSyllable+' = <한글>';

      try
        // 유니코드 음절을 저장할 버퍼(double-byte)
        uSyllable := GlobalAllocPtr(GHND, (length(sSyllable)*2)+2);

        // 문자열 음절을 유니코드 음절로 변환
        MultiByteToWideChar(CP_ACP, MB_ERR_INVALID_CHARS,
                            pchar(sSyllable), length(sSyllable),
                            uSyllable, (length(sSyllable)*2)+2);

        s2 := s2 + Format('<유니코드 ''%x''>', [WORD(uSyllable^)]);

        // 초성,중성,초성의 인덱스값을 구해서 그것의 문자를 구한다
        temp := WORD(uSyllable^) - $AC00;
        sChoseong  := uChoseong[temp div (21*28)]; // 초성 음소
        sJungseong := uJungseong[temp mod (21*28) div 28]; // 중성 음소
        sJongseong := uJongseong[temp {mod (21*28)} mod 28]; // 종성 음소

        s2 := s2 + Format('<초성 ''%s''>', [sChoseong]);
        s2 := s2 + Format('<중성 ''%s''>', [sJungseong]);
        s2 := s2 + Format('<종성 ''%s''>', [sJongseong]);

      finally
        if uSyllable <> nil then
          GlobalFreePtr(uSyllable);
      end;
          
      Inc(i); // 2바이트 이므로...
    end
    else
    begin
      s2 := s2 + '<기타>'
    end;

    Memo1.Lines.Add(s2);

    Inc(i);
  end;  
end;

procedure TForm1.FormCreate(Sender: TObject);
begin
  Edit1.Text := '김영대2 http://www.HOWTO.pe.kr';
end;

end.





971   [윈도우즈 API] ShellExecute(Ex) 사용법 예제 12가지  김영대 2004/09/22 16800 1681
970   [시스템] 사용중인 USB 포트의 장치정보 구하기  김영대 2008/11/04 12372 1503
969   [시스템] 원도우즈 도메인 이름 구하기  김영대 2008/11/04 12305 1390
968   [윈도우즈 API] 디렉토리나 파일의 속성(변경/생성/사용한 날짜, 특성) 바꾸기  김영대 2004/12/08 9534 1367
967   [데이터베이스] DBGrid의 Column, Record 의 위치 저장/이동  김영대 2003/03/04 8821 1380
966   [시스템] 델파이로 DOS 프로그램(Console application) 만들기  김영대 2003/03/06 8659 2824
965   [네트웍/인터넷] IOCP(I/O Completion Port) class  김영대 2003/11/18 8439 795
964   [윈도우즈 API] URLDownloadToFile()를 사용한 파일 다운받기  김영대 2004/12/15 7853 1431
963   [윈도우즈 API] 다른 프로그램에 마우스/키보드 이벤트 발생시키기  김영대 2004/09/07 7786 1294
  [시스템] 한글 한 음절을 초성,중성,종성 음소로 분해하기('김' => 'ㄱ'+'ㅣ'+'ㅁ')  김영대 2004/10/22 7708 1257
961   [COM/OLE] 탐색기에서 파일을 선택하여 ActiveX(ActiveFortm)에 Drag&Drop 하기  김영대 2005/01/06 7689 1303
960   [윈도우즈 API] 실행 파일의 아이콘 바꾸기  김영대 2008/11/27 7682 1432
959   [네트웍/인터넷] FTP로 디렉토리 목록(ls -l) 구하기  김영대 2004/10/09 7658 1362
958   [네트웍/인터넷] 윈도우즈 소켓의 에러번호에 대한 설명  김영대 2003/03/05 7591 2641
957   [윈도우즈 API] 외부 프로그램 실행하기(ShellExecute) 정리  김영대 2003/03/05 7572 1413
956   [일반/컴포넌트] RichEdit 2.0 줄간격 조정  김영대 2005/02/11 7531 1312
955   [네트웍/인터넷] RFC: Request for Comments  김영대 2003/03/05 7530 1977
954   [네트웍/인터넷] HTTP의 다운받을 파일의 정보만 미리 읽어오기  김영대 2004/12/02 7529 1413
953   [시스템] 2기가 이상의 하드의 남은 용량 알아내기...  김영대 2003/03/06 7381 2071
952   [시스템] '응답없음' 프로세서를 감지하는 잼나는 방법  구창민 2003/03/14 7264 1202
951   [시스템] 시스템 타임이 변경되었는지를 알아내려면...  김영대 2003/03/05 7234 2001
950   [시스템] 시스템의 각종 정보  김영대 2003/03/06 7228 1250
949   [시스템] 마우스의 좌/우 기능설정과 버튼갯수 알기  김영대 2003/03/06 7198 1958
948   [시스템] 시스템 대기모드/화면 보호기/모니터 끄기 이벤트 감지하기  김영대 2005/07/21 7125 1539
947   [시스템] 인증서(certificate) 파일에서 직접 정보 읽어오기  김영대 2004/10/29 7070 1443
946   [네트웍/인터넷] Ethernet 랜카드의 MAC adress 구하기  김영대 2003/03/07 7070 1842
945   [윈도우즈 API] 작업표시줄의 시계 감추기/보이기  김영대 2003/03/27 7033 1921
944   [네트웍/인터넷] How to bring a network down - "Win Nuke"  김영대 2003/03/06 7019 1919
943   [네트웍/인터넷] List of raw FTP commands  김영대 2003/03/05 7013 1827
942   [시스템] 윈도우즈 등록정보의 보안에 있는 권한 설정 변경하기(NT/2000/XP)  김영대 2004/09/25 7008 1539
941   [네트웍/인터넷] NetMask 알아내기  김영대 2003/03/07 6996 1797
940   [일반/컴포넌트] 명령행 인자 받아오기  김영대 2003/03/05 6981 1821
939   [네트웍/인터넷] NT 네트워크 환경의 컴퓨터 리스트 구하기  김영대 2003/03/07 6778 1694
938   [네트웍/인터넷] 네트워크 공유 설정/공유 사용 권한/해제 하기 (Windows XP)  김영대 2004/11/09 6766 1352
937   [일반/컴포넌트] 문자가 영문/숫자/영숫자/한글 인지 검사하기  김영대 2004/08/31 6745 1473
936   [네트웍/인터넷] Ping 소스  김영대 2004/08/09 6711 1209
935   [일반/컴포넌트] Thread in a Timer  김영대 2003/04/07 6705 1066
934   [시스템] DOS 명령어 실행하고 실시간 결과 받아오기  김영대 2004/09/29 6693 1377
933   [일반/컴포넌트] 사업자 등록번호를 검사하는 법  김영대 2003/03/06 6685 1742
932   [네트웍/인터넷] RS232 통신  김영대 2003/03/07 6682 1801

1 [2][3][4][5][6][7][8][9][10]..[25] [다음 10개]
 

Copyright 1999-2019 Zeroboard / skin by zero