Accueil > > > DISTANCE DE JARO-WINKLER
DISTANCE DE JARO-WINKLER
Information sur la source
Description
La distance de Jaro-Winkler mesure la similarité entre deux chaînes de caractères. Cette fonction permet de renvoyer la valeur de la distance de Jaro-Winkler. Elle est normalement comprise entre 0 et 1 mais peut dépasser légèrement 1 dans le cas ou le paramètre p est modifié. (p est un coefficient qui permet de favoriser les chaînes avec un préfixe commun. Winkler propose pour valeur p = 0.1) voir : http://fr.wikipedia.org/wiki/Distance_de_Jaro-Win kler
Source
- function JaroWinkler(prmT1, prmT2: String;p:Double=0.1): Double;
- Var
- ecartMax,l1,l2,compteMatching,compteTransposition,longueurPrefix,i,j:integer;
- c1,c2,t1Matche,t2Matche:string;
- b1,b2:array of Boolean;
- distanceJaro:Double;
- label endfor,exitfor2;
- function TrouverMatches(prmTextInitial:string;b1:array of Boolean):string;
- var
- i:integer;
- res:string;
- begin
- // Calcule le nombre de caractères qui match
- for i := 1 to Length(prmTextInitial) do
- begin
- if b1[i] then//prmTextMatche[i]='_' then
- begin
- res:=res+prmTextInitial[i];
- end;
- end;
- TrouverMatches:=res;
- end;
- begin
- ecartMax:=round(Max(Length(prmT1), Length(prmT2))/2)-1;
- if ((prmT1='') or (prmT2='')) then
- begin
- JaroWinkler:=0;
- exit;
- end;
- compteMatching:=0;
- compteTransposition:=0;
- l1:=Length(prmT1);
- l2:=Length(prmT2);
- Setlength(b1,l1+1);
- Setlength(b2,l2+1);
- for i := 0 to l1 do
- begin
- b1[i]:=false;
- end;
- for i := 0 to l2 do
- begin
- b2[i]:=false;
- end;
-
- for i := 1 to l1 do
- begin
- c1:=prmT1[i];
- if (i<=l2) then
- c2:=prmT2[i]
- else
- c2:='';
- for j := Max(i-ecartMax,1) to Min(i+ecartMax,l2) do
- begin
- c2:=prmT2[j];
- if c1=c2 then //compteMatching avec transposition
- begin
- b1[i]:=true;
- b2[j]:=true;
- //Le caractère a été matché, il n'est plus disponible
- Inc(compteMatching);
- break;
- end;
- end;
- end;
- if (compteMatching=0) then
- begin
- JaroWinkler:=0;
- exit;
- end;
- //Dans les caractères matchés, compte ceux qui ne matchent pas exactement
- t1Matche:=TrouverMatches(prmT1,b1);
- t2Matche:=TrouverMatches(prmT2,b2);
- if t1Matche<>t2Matche then
- begin
- for i := 1 to length(t1Matche) do
- begin
- if t1Matche[i]<>t2Matche[i] then
- Inc(compteTransposition)
- end;
- end else begin
- compteTransposition:=0;
- end;
-
- distanceJaro:=1/3*((compteMatching/l1)+(compteMatching/l2)+((compteMatching-Int(compteTransposition/2))/compteMatching));
-
- //Calcule la distance Winkler
- //Calcule le prefix sur les 4 premiers car aux max
- longueurPrefix:=0;
- for i := 1 to min(4,min(l1,l2)) do
- begin
- c1:=prmT1[i];
- c2:=prmT2[i];
- if c1=c2 then
- inc(longueurPrefix)
- else
- break;
- end;
- //Valeur constante définie par l'algo
- JaroWinkler:=distanceJaro+(longueurPrefix*p*(1-distanceJaro));
- end;
function JaroWinkler(prmT1, prmT2: String;p:Double=0.1): Double;
Var
ecartMax,l1,l2,compteMatching,compteTransposition,longueurPrefix,i,j:integer;
c1,c2,t1Matche,t2Matche:string;
b1,b2:array of Boolean;
distanceJaro:Double;
label endfor,exitfor2;
function TrouverMatches(prmTextInitial:string;b1:array of Boolean):string;
var
i:integer;
res:string;
begin
// Calcule le nombre de caractères qui match
for i := 1 to Length(prmTextInitial) do
begin
if b1[i] then//prmTextMatche[i]='_' then
begin
res:=res+prmTextInitial[i];
end;
end;
TrouverMatches:=res;
end;
begin
ecartMax:=round(Max(Length(prmT1), Length(prmT2))/2)-1;
if ((prmT1='') or (prmT2='')) then
begin
JaroWinkler:=0;
exit;
end;
compteMatching:=0;
compteTransposition:=0;
l1:=Length(prmT1);
l2:=Length(prmT2);
Setlength(b1,l1+1);
Setlength(b2,l2+1);
for i := 0 to l1 do
begin
b1[i]:=false;
end;
for i := 0 to l2 do
begin
b2[i]:=false;
end;
for i := 1 to l1 do
begin
c1:=prmT1[i];
if (i<=l2) then
c2:=prmT2[i]
else
c2:='';
for j := Max(i-ecartMax,1) to Min(i+ecartMax,l2) do
begin
c2:=prmT2[j];
if c1=c2 then //compteMatching avec transposition
begin
b1[i]:=true;
b2[j]:=true;
//Le caractère a été matché, il n'est plus disponible
Inc(compteMatching);
break;
end;
end;
end;
if (compteMatching=0) then
begin
JaroWinkler:=0;
exit;
end;
//Dans les caractères matchés, compte ceux qui ne matchent pas exactement
t1Matche:=TrouverMatches(prmT1,b1);
t2Matche:=TrouverMatches(prmT2,b2);
if t1Matche<>t2Matche then
begin
for i := 1 to length(t1Matche) do
begin
if t1Matche[i]<>t2Matche[i] then
Inc(compteTransposition)
end;
end else begin
compteTransposition:=0;
end;
distanceJaro:=1/3*((compteMatching/l1)+(compteMatching/l2)+((compteMatching-Int(compteTransposition/2))/compteMatching));
//Calcule la distance Winkler
//Calcule le prefix sur les 4 premiers car aux max
longueurPrefix:=0;
for i := 1 to min(4,min(l1,l2)) do
begin
c1:=prmT1[i];
c2:=prmT2[i];
if c1=c2 then
inc(longueurPrefix)
else
break;
end;
//Valeur constante définie par l'algo
JaroWinkler:=distanceJaro+(longueurPrefix*p*(1-distanceJaro));
end;
Conclusion
cette source est juste un portage delphi d'une source vb trouvée sur le net.
Historique
- 29 août 2008 01:00:06 :
- -
- 29 août 2008 01:45:44 :
- Modifications proposées par John Dogget
- 29 août 2008 11:00:26 :
- -Correction des goto en break;
-Passage par array of boolean au lieu de string (un poil mieux pour la mémoire)
Sources du même auteur
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Actionner et arrêter une application sur un poste à distance [ par thierry ]
SalutMeme question j'ai essaye ICS sous CBUILDER avec l'exemple de Chat donné .Mon programme compare la chaine recu au nom du programmeà lancer sur le
Faire executer une appli a distance [ par slhuilli ]
Quelu'un saurait il s'il est possible a partir d'un poste (PC1) de faire executer et de terminer une tache sur un autre poste (PC2), sachant que ces d
problemes de timer et ntmstrm [ par crogger ]
Bonjour, je fais de la capture d ecran que je convertit en jpg, et que je transmet en stream avec le composant NMSTRM de fastnet pour recuperer a dist
Assistance a distance [ par SlunBreak ]
Bonjours, Je cherche le moyen d'inserer une fonction d'assistance à distance sur un programme utilisant les composants ClientSocket et ServerSocket. L
Compiler à distance [ par FleX2009 ]
Bonjour, j'aurai besoin de compiler à distance une DLL Delphi, c'est-à-dire faire une application qui compile automatiquement du code Delphi
Verifier le lancement d'un service à distance [ par abdouinf ]
Bonjour à tous,je suis en train de developper une application Client/Serveur avec TSocketConnection, j'ai un service qui tourne sur le serveur po
controle d'un pc à distance [ par templeofboom ]
bonjour je suis débutant en delphi et j'aimerais savoir si l'on peu peu prendre le controle d'une machine à distance lorsqu'on connait son a
acces a distance [ par exyacc ]
salut, je voudrais que mon prog delphi ajoute un acces a distance ds les connexions reseau avec un num de tel, login et pass. en fait , c'est p
projet controle a distance [ par bts_informatique ]
bonjour a tous je sius etudiant et jai un projet de fin d'etude j'ai cree une connection entre deux poste et mon probleme que cette connection e
a 900 kms de distance y a t il moyen de redemarrer un pc ? [ par patviro ]
|
Derniers Blogs
TECHDAYS PARIS 2010 : SHAREPOINT 2010 POUR LES DéVELOPPEURSTECHDAYS PARIS 2010 : SHAREPOINT 2010 POUR LES DéVELOPPEURS par ROMELARD Fabrice
Animé par: Laurent Cotton Le développement dans SharePoint 2010 passe par plusieurs axes qui seront évoqués dans cette session, mais plus particulièrement les développements simples lié au besoin Business Business Connectivity Services Ce BCS es...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2010 : PLEINIèRE DERNIER JOURTECHDAYS PARIS 2010 : PLEINIèRE DERNIER JOUR par ROMELARD Fabrice
Cette session est la dernière pleinière de ces 3 jours de TechDays Paris 2010. Généralement, cette troisième journée est plus axée sur l'avenir vu par Microsoft. Après un retour sur l'avenir vu par la Science Fiction ou par ...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice UNE JOLIE-HORLOGE ET PAS QU'UN PEU !UNE JOLIE-HORLOGE ET PAS QU'UN PEU ! par neodante
Pour les possesseurs d'iPhone, ça y est Bijin Tokei - qui se traduit littéralement en Français par " Jolie Horloge " - est arrivé et GRATUITEMENT s'il vous plaît ! Après la version Tokyo, Hokkaido, night club, racing, Gal, "pour les mademoiselles'", . voi...
Cliquez pour lire la suite de l'article par neodante TECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICESTECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICES par ROMELARD Fabrice
Animé par: Gaetan Bouveret et Julien Chomarat Business Connectivity Services (BCS) est dans SharePoint 2010 la version 2 de Business Data Catalog (BDC dans SharePoint 2007). Il s'agit de la solution permettant de visualiser des données provenan...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice [DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE[DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE par orion
Comme de nombreux geek, je suis un grand amateur de série TV et je rate régulièrement des épisodes de mes séries préférés. Une solution s'offre à vous avec ce merveilleux site : Tv Gorge - www.tvgorge.com Moteur de recherche à l'appui, vous pouvez ...
Cliquez pour lire la suite de l'article par orion
Forum
RE : SAVEDIALOGRE : SAVEDIALOG par JulioDelphi
Cliquez pour lire la suite par JulioDelphi
Logiciels
DB-MAIN (9.1.0)DB-MAIN (9.1.0)DB-MAIN is a data-modeling and data-architecture tool. It is designed to help developers and anal... Cliquez pour télécharger DB-MAIN Xilisoft DPG Convertisseur (5.1.37.0120)XILISOFT DPG CONVERTISSEUR (5.1.37.0120)Xilisoft DPG Convertisseur offre aux fans de Nintendo DS une bonne solution leur permettant de dé... Cliquez pour télécharger Xilisoft DPG Convertisseur GraphicsGale (2.01.01)GRAPHICSGALE (2.01.01)GraphicsGale est un logiciel de PixelArt avec de nombreuse fonctionnalités permettant de réalisé ... Cliquez pour télécharger GraphicsGale Architecte 3D (Platinum 2010)ARCHITECTE 3D (PLATINUM 2010)Architecte 3D Platinium vous permet de concevoir facilement les plans votre future maison, de l'é... Cliquez pour télécharger Architecte 3D TeamViewer 5 (TeamViewer 5)TEAMVIEWER 5 (TEAMVIEWER 5)Dépanner un ami,expliquer une manipulation devient un jeu d'enfant.
Prise en main d'un autre ord... Cliquez pour télécharger TeamViewer 5
|