::: 델파이 Tip&Trick :::

델파이 Tip&Trick 성격에 맞지 않는 광고,비방,질문의 글은 즉시 삭제하며
내용을 복사하여 사용할 경우 반드시 이곳(http://www.howto.pe.kr)을 출처로 명시하여 주세요


Category

  김영대(2004-09-04 15:03:47, Hit : 4963, Vote : 1117
 http://www.howto.pe.kr
 두 문자열의 유사도 검사하기

unit Unit1;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls, Math;

type
  TForm1 = class(TForm)
    Edit1: TEdit;
    Edit2: TEdit;
    Button1: TButton;
    procedure Button1Click(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

// Levenshtein matching gives the number of steps (single character replacement or addition)
// needed to transform StringA into String B.
function CompareStrings_Levenshtein(const A, B: String; CaseSensitive: Boolean = False): Integer;
  function Minimum3(x, y, z: Integer): Integer;
  begin
    Result := Min(x, y);
    Result := Min(Result, z);
  end;
  function iff(bool: Boolean; x, y: Integer): Integer;
  begin
    if bool then
      Result := x
    else
      Result := y;
  end;

var
  D: array of array of Integer;
  n, m, i, j, Cost: Integer;
  AI, BJ: char;
  A1, B1: String;
begin
  n := Length(A);
  m := Length(B);
  if (n = 0) then
    Result := m
  else if m = 0 then
    Result := n
  else
  begin
    if CaseSensitive then
      A1 := A
    else
      A1 := UpperCase(A);

    if CaseSensitive then
      B1 := B
    else
      B1 := UpperCase(B);

    Setlength(D, n + 1, m + 1);
    for i := 0 to n do
      D[i, 0] := i;

    for j := 0 to m do
      D[0, j] := j;

    for i := 1 to n do
    begin
      AI := A1[i];

      for j := 1 to m do
      begin
        BJ := B1[j];

        Cost := iff(AI = BJ, 0, 1);
        D[i, j] := Minimum3(D[i - 1][j] + 1,
                            D[i][j - 1] + 1,
                            D[i - 1][j - 1] + Cost);
      end;
    end;
    Result := D[n, m];
  end;
end;

// Ratcliffe matching gives the percentage of possible character matches between StringA and
// StringB, based on the longest matching sequences and subsequences between the two strings
function CompareStrings_Ratcliff(const A, B: String; CaseSensitive: Boolean = False): Double;
var
  A1, B1: String;
  LenA, LenB: Integer;

  function CSR_Sub(StartA, EndA, StartB, EndB: Integer): Integer;
  var
    a, b, i, Matches, NewStartA, NewStartB: Integer;
  begin
    Result := 0;
    NewStartA := 0;
    NewStartB := 0;

    if (StartA > EndA) or (StartB > EndB) or (StartA <= 0) or (StartB <= 0) then
      Exit;

    for a := StartA to EndA do
    begin
      for B := StartB to EndB do
      begin
        Matches := 0;

        i := 0;

        while (a + i <= EndA) and (b + i <= EndB) and (A1[a + i] = B1[b + i]) do
        begin
          Inc(Matches);

          if Matches > Result then
          begin
            NewStartA := a;
            NewStartB := b;
            Result := Matches;
          end;

          Inc(i);
        end;
      end;
    end;

    if Result > 0 then
    begin
      Inc( Result, CSR_Sub(NewStartA + Result, EndA, NewStartB + Result, EndB) );
      Inc( Result, CSR_Sub(StartA, NewStartA - 1, StartB, NewStartB - 1) );
    end;
  end;

begin
  if CaseSensitive then
    A1 := A
  else
    A1 := UpperCase(A);

  if CaseSensitive then
    B1 := B
  else
    B1 := UpperCase(B);

  LenA := Length(A1);
  LenB := Length(B1);

  if A1 = B1 then
    Result := 100
  else if (LenA = 0) or (LenB = 0) then
    Result := 0
  else
    Result := CSR_Sub(1, LenA, 1, LenB) * 200 / (LenA + LenB);
end;

procedure TForm1.Button1Click(Sender: TObject);
begin
  ShowMessage(IntToStr(CompareStrings_Levenshtein(Edit1.Text, Edit2.Text, True))+'개의 틀린 부분이 있습니다');
  ShowMessage(FloatToStr(CompareStrings_Ratcliff(Edit1.Text, Edit2.Text, True))+'% 일치합니다');
end;

end.





571   [일반/컴포넌트] 레지스트리를 사용하는 사용자 함수 만들어 보기  구창민 2003/03/14 4594 1034
570   [윈도우즈 API] 레지스트리가 변경된 사실을 알리려면...  김영대 2003/03/06 4292 1153
569   [윈도우즈 API] 레지스트리(registry)를 바꾼후...  김영대 2003/03/05 4407 1186
568   [윈도우즈 API] 레지스트리 전체 검색하기  김영대 2003/03/07 3930 1079
567   [윈도우즈 API] 떠있는 모든 Microsoft Internet Explorer 죽이기  김영대 2003/03/29 4467 1262
566   [COM/OLE] 떠있는 모든 Microsoft Internet Explorer 의 html 불러오기  김영대 2003/03/30 5538 1358
565   [COM/OLE] 떠있는 모든 Internet Explorer 를 강제 Refresh 시키기  김영대 2004/09/20 4789 1228
564   [윈도우즈 API] 떠다니는 윈도우  김영대 2003/03/05 4335 1133
563   [시스템] 떠 있는 프로그램 죽이기...  김영대 2003/03/04 5609 1372
562   [시스템] 디스플레이 어댑터 목록 구하기  김영대 2004/08/11 4423 1173
561   [시스템] 디스크의 남은 용량 등등...  김영대 2003/03/05 4972 1348
560   [윈도우즈 API] 디스크 캐쉬의 파일을 디스크로 쓰기  김영대 2003/03/05 4017 1078
559   [시스템] 디스크 드라이브의 현재상태 얻기  김영대 2003/03/05 3443 966
558   [일반/컴포넌트] 디렉토리명 바꾸기/이동 하기  김영대 2003/03/07 4996 1513
557   [윈도우즈 API] 디렉토리나 파일의 속성(변경/생성/사용한 날짜, 특성) 바꾸기  김영대 2004/12/08 9872 1369
556   [일반/컴포넌트] 디렉토리 삭제루틴(하부디렉토리 몽땅)  김영대 2003/03/06 3466 952
555   [일반/컴포넌트] 디렉토리 복사루틴 (하부디렉토리 까지 몽땅)  김영대 2003/03/06 4518 1049
554   [일반/컴포넌트] 디렉토리 변동사항을 탐색기에 알리기  김영대 2003/03/07 5007 1532
553   [일반/컴포넌트] 디렉토리 검색하여 파일 찾기  김영대 2003/03/05 4912 1432
552   [시스템] 드라이브 포맷(Format) API 함수  김영대 2003/03/04 4706 1278
551   [일반/컴포넌트] 둥근 풍선도움말을 나타내주는 콤포넌트  김영대 2003/03/05 3001 731
550   [시스템] 두개의 파일이 완전히 동일한지 검사하기2  김영대 2003/03/07 3207 925
549   [시스템] 두개의 파일이 완전히 동일한지 검사하기(CRC32)  김영대 2003/03/05 4435 1047
548   [일반/컴포넌트] 두개의 StringGrid sync 마추기  김영대 2003/03/07 3523 966
547   [일반/컴포넌트] 두개의 RichEdit 사이에 내용 복사하기  김영대 2003/03/06 5359 1259
  [알고리즘] 두 문자열의 유사도 검사하기  김영대 2004/09/04 4963 1117
545   [일반/컴포넌트] 두 StringGrid 의 scroll 을 동기화 시키기  김영대 2003/03/07 4254 1027
544   [일반/컴포넌트] 동적으로 프로젝트의 Main form 바꾸기  김영대 2003/04/11 4644 1141
543   [데이터베이스] 동적으로 인덱스 만들기  김영대 2003/03/06 4163 1066
542   [일반/컴포넌트] 동적으로 생성한 TLabel 마우스로 이동시키기  김영대 2004/08/04 6261 1846
541   [일반/컴포넌트] 동적으로 메뉴(memu)에 Item 추가하기  김영대 2003/03/06 4660 1252
540   [데이터베이스] 동적으로 SELECT의 GROUP BY 문 만들기  김영대 2003/03/07 3948 886
539   [일반/컴포넌트] 동적으로 class의 instance 만들기  김영대 2003/03/06 3733 1045
538   [일반/컴포넌트] 도넛(Doughnut) 모양의 폼 만들기  김영대 2004/08/09 4303 1064
537   [윈도우즈 API] 도구모음 Bar는 어떻게 만드는지...  김영대 2003/03/04 4681 1325
536   [일반/컴포넌트] 델파이의 Object Inspector 모방  김영대 2003/03/06 3105 761
535   [윈도우즈 API] 델파이에서 시간을 기다리는 함수  김영대 2003/03/04 5798 1346
534   [일반/컴포넌트] 델파이안에 익스플로러 삽입  신훈재 2003/03/10 5757 1024
533   [시스템] 델파이로 DOS 프로그램(Console application) 만들기  김영대 2003/03/06 8747 2829
532   [일반/컴포넌트] 델파이 통합개발환경(IDE) 에 관한 몇가지 Tip  김영대 2003/03/04 5338 1431

[이전 10개] [1].. 11 [12][13][14][15][16][17][18][19][20]..[25] [다음 10개]
 

Copyright 1999-2019 Zeroboard / skin by zero