::: 델파이 Tip&Trick :::

델파이 Tip&Trick 성격에 맞지 않는 광고,비방,질문의 글은 즉시 삭제하며
내용을 복사하여 사용할 경우 반드시 이곳(http://www.howto.pe.kr)을 출처로 명시하여 주세요


Category

  김영대(2004-09-04 15:03:47, Hit : 5323, Vote : 1188
 http://www.howto.pe.kr
 두 문자열의 유사도 검사하기

unit Unit1;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, StdCtrls, Math;

type
  TForm1 = class(TForm)
    Edit1: TEdit;
    Edit2: TEdit;
    Button1: TButton;
    procedure Button1Click(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

// Levenshtein matching gives the number of steps (single character replacement or addition)
// needed to transform StringA into String B.
function CompareStrings_Levenshtein(const A, B: String; CaseSensitive: Boolean = False): Integer;
  function Minimum3(x, y, z: Integer): Integer;
  begin
    Result := Min(x, y);
    Result := Min(Result, z);
  end;
  function iff(bool: Boolean; x, y: Integer): Integer;
  begin
    if bool then
      Result := x
    else
      Result := y;
  end;

var
  D: array of array of Integer;
  n, m, i, j, Cost: Integer;
  AI, BJ: char;
  A1, B1: String;
begin
  n := Length(A);
  m := Length(B);
  if (n = 0) then
    Result := m
  else if m = 0 then
    Result := n
  else
  begin
    if CaseSensitive then
      A1 := A
    else
      A1 := UpperCase(A);

    if CaseSensitive then
      B1 := B
    else
      B1 := UpperCase(B);

    Setlength(D, n + 1, m + 1);
    for i := 0 to n do
      D[i, 0] := i;

    for j := 0 to m do
      D[0, j] := j;

    for i := 1 to n do
    begin
      AI := A1[i];

      for j := 1 to m do
      begin
        BJ := B1[j];

        Cost := iff(AI = BJ, 0, 1);
        D[i, j] := Minimum3(D[i - 1][j] + 1,
                            D[i][j - 1] + 1,
                            D[i - 1][j - 1] + Cost);
      end;
    end;
    Result := D[n, m];
  end;
end;

// Ratcliffe matching gives the percentage of possible character matches between StringA and
// StringB, based on the longest matching sequences and subsequences between the two strings
function CompareStrings_Ratcliff(const A, B: String; CaseSensitive: Boolean = False): Double;
var
  A1, B1: String;
  LenA, LenB: Integer;

  function CSR_Sub(StartA, EndA, StartB, EndB: Integer): Integer;
  var
    a, b, i, Matches, NewStartA, NewStartB: Integer;
  begin
    Result := 0;
    NewStartA := 0;
    NewStartB := 0;

    if (StartA > EndA) or (StartB > EndB) or (StartA <= 0) or (StartB <= 0) then
      Exit;

    for a := StartA to EndA do
    begin
      for B := StartB to EndB do
      begin
        Matches := 0;

        i := 0;

        while (a + i <= EndA) and (b + i <= EndB) and (A1[a + i] = B1[b + i]) do
        begin
          Inc(Matches);

          if Matches > Result then
          begin
            NewStartA := a;
            NewStartB := b;
            Result := Matches;
          end;

          Inc(i);
        end;
      end;
    end;

    if Result > 0 then
    begin
      Inc( Result, CSR_Sub(NewStartA + Result, EndA, NewStartB + Result, EndB) );
      Inc( Result, CSR_Sub(StartA, NewStartA - 1, StartB, NewStartB - 1) );
    end;
  end;

begin
  if CaseSensitive then
    A1 := A
  else
    A1 := UpperCase(A);

  if CaseSensitive then
    B1 := B
  else
    B1 := UpperCase(B);

  LenA := Length(A1);
  LenB := Length(B1);

  if A1 = B1 then
    Result := 100
  else if (LenA = 0) or (LenB = 0) then
    Result := 0
  else
    Result := CSR_Sub(1, LenA, 1, LenB) * 200 / (LenA + LenB);
end;

procedure TForm1.Button1Click(Sender: TObject);
begin
  ShowMessage(IntToStr(CompareStrings_Levenshtein(Edit1.Text, Edit2.Text, True))+'개의 틀린 부분이 있습니다');
  ShowMessage(FloatToStr(CompareStrings_Ratcliff(Edit1.Text, Edit2.Text, True))+'% 일치합니다');
end;

end.





291   [일반/컴포넌트] StringGrid 의 BeginUpdate/EndUpdate ?  김영대 2003/03/07 5660 1193
290   [윈도우즈 API] 어플리케이션의 중복실행 방지  김영대 2003/03/05 4863 1193
289   [일반/컴포넌트] TPanel 로 만든 힌트  김영대 2004/08/05 4681 1192
288   [시스템] Hint의 폰트 바꾸기  김영대 2003/03/05 4167 1191
287   [시스템] CPU speed 구하기 2  김영대 2003/03/07 4237 1190
286   [일반/컴포넌트] 문자열의 word 갯수 세기  김영대 2003/03/04 4424 1190
285   [일반/컴포넌트] TRichEdit 에 윗첨자, 아랫첨자 만들기  김영대 2003/03/07 4643 1189
284   [일반/컴포넌트] 문자열의 끝에서부터 검색하는 Pos() 함수  김영대 2003/03/07 5201 1189
283   [일반/컴포넌트] 하나의 프로시저,함수로 다른 함수,프로시저를 처리  김영대 2003/03/05 4089 1189
282   [윈도우즈 API] bitmap 인쇄하기  김영대 2003/03/05 4621 1189
281   [일반/컴포넌트] StringGrid의 모든 Cell 선택/해제하기  김영대 2004/09/25 4975 1188
  [알고리즘] 두 문자열의 유사도 검사하기  김영대 2004/09/04 5323 1188
279   [윈도우즈 API] 바로 직전에 active 되었던 윈도우와 콘트롤 구하기  김영대 2004/07/24 4737 1185
278   [시스템] PC에 설치된 드라이브 목록 구하기  김영대 2003/03/07 4864 1185
277   [윈도우즈 API] How to flush key buffer  김영대 2003/03/07 4516 1185
276   [데이터베이스] 몇가지 BDE 환경정보 구하기  김영대 2003/03/07 4505 1184
275   [일반/컴포넌트] ListBox의 화면에 보여지는 최상위 Item 번호  김영대 2003/03/07 4405 1184
274   [일반/컴포넌트] MS-OutLook 으로 메시지 보내기  김영대 2003/03/07 5240 1184
273   [COM/OLE] How to register an OCX  김영대 2003/03/06 5144 1184
272   [일반/컴포넌트] Memo의 입력행수 제한하기  김영대 2003/03/07 4217 1183
271   [일반/컴포넌트] 쓰레드를 이용한 복수 Query 동시에 열기  김영대 2003/03/05 6555 1183
270     [COM/OLE] [re] PDF ActiveX 사용하기  초보델피 2005/07/18 5430 1182
269   [일반/컴포넌트] TStringGrid 인쇄하기  김영대 2003/03/07 4866 1182
268   [시스템] 프린터에 escape 코드를 전달하는 방법  김영대 2003/03/06 4028 1182
267   [일반/컴포넌트] 베쥬(Bezier) 곡선 그리기2  김영대 2003/03/07 6180 1178
266   [일반/컴포넌트] ListView 의 컬럼별로 Sort (내림차순 포함)  김영대 2003/03/05 5550 1178
265   [알고리즘] 숫자를 KB, MB, GB 단위로 환산하기  김영대 2003/11/13 5155 1177
264   [일반/컴포넌트] ComboBox에 IE의 URL 입력창 같은 근접검색 두기  김영대 2003/03/31 4705 1176
263   [일반/컴포넌트] 부활절 달걀(easter egg) 문자열 입력받기  김영대 2003/03/07 4892 1175
262   [시스템] 일정시간 경과 후 윈도우즈 종료하기  김영대 2004/08/03 4849 1174
261   [일반/컴포넌트] 레지스트리를 사용하는 사용자 함수 만들어 보기  구창민 2003/03/14 5022 1174
260   [일반/컴포넌트] 수직 스크롤이 맨마지막으로 이동했는지 검사  김영대 2003/03/07 4013 1173
259   [윈도우즈 API] IE의 현재 url 가져오기  김영대 2003/03/07 4703 1173
258   [윈도우즈 API] 데스크탑 아이콘 전부 감추기/보이기  김영대 2003/03/07 4002 1170
257   [일반/컴포넌트] Memo의 커서를 특정 위치로 보낸후 scroll 시키기  김영대 2003/03/05 5199 1170
256   [윈도우즈 API] "문서" 메뉴에 파일을 등록하고 삭제하기  김영대 2003/03/05 4413 1169
255   [일반/컴포넌트] Variant 변수의 Type 알아내기  김영대 2003/03/05 4477 1169
254   [시스템] Thread 사용하기  김영대 2003/03/07 4308 1168
253   [일반/컴포넌트] 프로그램 종료시 도움말 화면 닫기  김영대 2003/03/05 4297 1168
252   [윈도우즈 API] 윈도우즈의 시스템 폴더들의 실제 디렉토리  김영대 2003/03/05 4351 1168

[이전 10개] [1]..[11][12][13][14][15][16][17] 18 [19][20]..[25] [다음 10개]
 

Copyright 1999-2023 Zeroboard / skin by zero