Accueil > > > DISTANCE DE JARO-WINKLER
DISTANCE DE JARO-WINKLER
Information sur la source
Description
La distance de Jaro-Winkler mesure la similarité entre deux chaînes de caractères. Cette fonction permet de renvoyer la valeur de la distance de Jaro-Winkler. Elle est normalement comprise entre 0 et 1 mais peut dépasser légèrement 1 dans le cas ou le paramètre p est modifié. (p est un coefficient qui permet de favoriser les chaînes avec un préfixe commun. Winkler propose pour valeur p = 0.1) voir : http://fr.wikipedia.org/wiki/Distance_de_Jaro-Win kler
Source
- function JaroWinkler(prmT1, prmT2: String;p:Double=0.1): Double;
- Var
- ecartMax,l1,l2,compteMatching,compteTransposition,longueurPrefix,i,j:integer;
- c1,c2,t1Matche,t2Matche:string;
- b1,b2:array of Boolean;
- distanceJaro:Double;
- label endfor,exitfor2;
- function TrouverMatches(prmTextInitial:string;b1:array of Boolean):string;
- var
- i:integer;
- res:string;
- begin
- // Calcule le nombre de caractères qui match
- for i := 1 to Length(prmTextInitial) do
- begin
- if b1[i] then//prmTextMatche[i]='_' then
- begin
- res:=res+prmTextInitial[i];
- end;
- end;
- TrouverMatches:=res;
- end;
- begin
- ecartMax:=round(Max(Length(prmT1), Length(prmT2))/2)-1;
- if ((prmT1='') or (prmT2='')) then
- begin
- JaroWinkler:=0;
- exit;
- end;
- compteMatching:=0;
- compteTransposition:=0;
- l1:=Length(prmT1);
- l2:=Length(prmT2);
- Setlength(b1,l1+1);
- Setlength(b2,l2+1);
- for i := 0 to l1 do
- begin
- b1[i]:=false;
- end;
- for i := 0 to l2 do
- begin
- b2[i]:=false;
- end;
-
- for i := 1 to l1 do
- begin
- c1:=prmT1[i];
- if (i<=l2) then
- c2:=prmT2[i]
- else
- c2:='';
- for j := Max(i-ecartMax,1) to Min(i+ecartMax,l2) do
- begin
- c2:=prmT2[j];
- if c1=c2 then //compteMatching avec transposition
- begin
- b1[i]:=true;
- b2[j]:=true;
- //Le caractère a été matché, il n'est plus disponible
- Inc(compteMatching);
- break;
- end;
- end;
- end;
- if (compteMatching=0) then
- begin
- JaroWinkler:=0;
- exit;
- end;
- //Dans les caractères matchés, compte ceux qui ne matchent pas exactement
- t1Matche:=TrouverMatches(prmT1,b1);
- t2Matche:=TrouverMatches(prmT2,b2);
- if t1Matche<>t2Matche then
- begin
- for i := 1 to length(t1Matche) do
- begin
- if t1Matche[i]<>t2Matche[i] then
- Inc(compteTransposition)
- end;
- end else begin
- compteTransposition:=0;
- end;
-
- distanceJaro:=1/3*((compteMatching/l1)+(compteMatching/l2)+((compteMatching-Int(compteTransposition/2))/compteMatching));
-
- //Calcule la distance Winkler
- //Calcule le prefix sur les 4 premiers car aux max
- longueurPrefix:=0;
- for i := 1 to min(4,min(l1,l2)) do
- begin
- c1:=prmT1[i];
- c2:=prmT2[i];
- if c1=c2 then
- inc(longueurPrefix)
- else
- break;
- end;
- //Valeur constante définie par l'algo
- JaroWinkler:=distanceJaro+(longueurPrefix*p*(1-distanceJaro));
- end;
function JaroWinkler(prmT1, prmT2: String;p:Double=0.1): Double;
Var
ecartMax,l1,l2,compteMatching,compteTransposition,longueurPrefix,i,j:integer;
c1,c2,t1Matche,t2Matche:string;
b1,b2:array of Boolean;
distanceJaro:Double;
label endfor,exitfor2;
function TrouverMatches(prmTextInitial:string;b1:array of Boolean):string;
var
i:integer;
res:string;
begin
// Calcule le nombre de caractères qui match
for i := 1 to Length(prmTextInitial) do
begin
if b1[i] then//prmTextMatche[i]='_' then
begin
res:=res+prmTextInitial[i];
end;
end;
TrouverMatches:=res;
end;
begin
ecartMax:=round(Max(Length(prmT1), Length(prmT2))/2)-1;
if ((prmT1='') or (prmT2='')) then
begin
JaroWinkler:=0;
exit;
end;
compteMatching:=0;
compteTransposition:=0;
l1:=Length(prmT1);
l2:=Length(prmT2);
Setlength(b1,l1+1);
Setlength(b2,l2+1);
for i := 0 to l1 do
begin
b1[i]:=false;
end;
for i := 0 to l2 do
begin
b2[i]:=false;
end;
for i := 1 to l1 do
begin
c1:=prmT1[i];
if (i<=l2) then
c2:=prmT2[i]
else
c2:='';
for j := Max(i-ecartMax,1) to Min(i+ecartMax,l2) do
begin
c2:=prmT2[j];
if c1=c2 then //compteMatching avec transposition
begin
b1[i]:=true;
b2[j]:=true;
//Le caractère a été matché, il n'est plus disponible
Inc(compteMatching);
break;
end;
end;
end;
if (compteMatching=0) then
begin
JaroWinkler:=0;
exit;
end;
//Dans les caractères matchés, compte ceux qui ne matchent pas exactement
t1Matche:=TrouverMatches(prmT1,b1);
t2Matche:=TrouverMatches(prmT2,b2);
if t1Matche<>t2Matche then
begin
for i := 1 to length(t1Matche) do
begin
if t1Matche[i]<>t2Matche[i] then
Inc(compteTransposition)
end;
end else begin
compteTransposition:=0;
end;
distanceJaro:=1/3*((compteMatching/l1)+(compteMatching/l2)+((compteMatching-Int(compteTransposition/2))/compteMatching));
//Calcule la distance Winkler
//Calcule le prefix sur les 4 premiers car aux max
longueurPrefix:=0;
for i := 1 to min(4,min(l1,l2)) do
begin
c1:=prmT1[i];
c2:=prmT2[i];
if c1=c2 then
inc(longueurPrefix)
else
break;
end;
//Valeur constante définie par l'algo
JaroWinkler:=distanceJaro+(longueurPrefix*p*(1-distanceJaro));
end;
Conclusion
cette source est juste un portage delphi d'une source vb trouvée sur le net.
Historique
- 29 août 2008 01:00:06 :
- -
- 29 août 2008 01:45:44 :
- Modifications proposées par John Dogget
- 29 août 2008 11:00:26 :
- -Correction des goto en break;
-Passage par array of boolean au lieu de string (un poil mieux pour la mémoire)
Sources du même auteur
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Actionner et arrêter une application sur un poste à distance [ par thierry ]
SalutMeme question j'ai essaye ICS sous CBUILDER avec l'exemple de Chat donné .Mon programme compare la chaine recu au nom du programmeà lancer sur le
Faire executer une appli a distance [ par slhuilli ]
Quelu'un saurait il s'il est possible a partir d'un poste (PC1) de faire executer et de terminer une tache sur un autre poste (PC2), sachant que ces d
problemes de timer et ntmstrm [ par crogger ]
Bonjour, je fais de la capture d ecran que je convertit en jpg, et que je transmet en stream avec le composant NMSTRM de fastnet pour recuperer a dist
Assistance a distance [ par SlunBreak ]
Bonjours, Je cherche le moyen d'inserer une fonction d'assistance à distance sur un programme utilisant les composants ClientSocket et ServerSocket. L
Compiler à distance [ par FleX2009 ]
Bonjour, j'aurai besoin de compiler à distance une DLL Delphi, c'est-à-dire faire une application qui compile automatiquement du code Delphi
Verifier le lancement d'un service à distance [ par abdouinf ]
Bonjour à tous,je suis en train de developper une application Client/Serveur avec TSocketConnection, j'ai un service qui tourne sur le serveur po
controle d'un pc à distance [ par templeofboom ]
bonjour je suis débutant en delphi et j'aimerais savoir si l'on peu peu prendre le controle d'une machine à distance lorsqu'on connait son a
acces a distance [ par exyacc ]
salut, je voudrais que mon prog delphi ajoute un acces a distance ds les connexions reseau avec un num de tel, login et pass. en fait , c'est p
projet controle a distance [ par bts_informatique ]
bonjour a tous je sius etudiant et jai un projet de fin d'etude j'ai cree une connection entre deux poste et mon probleme que cette connection e
a 900 kms de distance y a t il moyen de redemarrer un pc ? [ par patviro ]
|
Derniers Blogs
TECHDAYS PARIS 2012 : COMMENT SHAREPOINT A SAUVé MES TECHDAYSTECHDAYS PARIS 2012 : COMMENT SHAREPOINT A SAUVé MES TECHDAYS par ROMELARD Fabrice
Speakers : Lionel Limozin et Alain Marty La session commence par une découverte de SharePoint à travers la mise en place d'un environnement SharePoint pour la gestion des Sessions animées par BeWise. Le besoin est très ba...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice PERSPECTIVE 3.0 POUR SILVERLIGHT 5.0PERSPECTIVE 3.0 POUR SILVERLIGHT 5.0 par odewit
Je viens de publier la version 3.0 de Perspective pour Silverlight, qui regroupe un portage sous Silverlight 5.0 des fonctionnalités de Perspective 2.0, le framework 3D de haut-niveau introduit récemment et de nouveaux exemples de code. En voici la li...
Cliquez pour lire la suite de l'article par odewit TECHDAYS PARIS 2012 : TOP 10 DES BEST PRACTICES POUR SQL SERVERTECHDAYS PARIS 2012 : TOP 10 DES BEST PRACTICES POUR SQL SERVER par ROMELARD Fabrice
Speaker : Nadia Ben El Kadi Configuration machine La session commence par la toute première question à se poser lors de la mise en place d'environnement SQL Server, la configuration des machines : Type de mac...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2012 : KINECT + OFFICE 365 UN BON GESTE POUR VOTRE SITECHDAYS PARIS 2012 : KINECT + OFFICE 365 UN BON GESTE POUR VOTRE SI par ROMELARD Fabrice
Speakers : Fabrice Barbin, Samuel Blanchard, Julien Lo Presti Titre Prometteur et attractif invitant à voir comment lier le composant ludique Kinect dans le cadre d'une structure IT classique, notamment au travers de la plat...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice TECHDAYS PARIS 2012 : PLEINIèRE DU PREMIER JOURTECHDAYS PARIS 2012 : PLEINIèRE DU PREMIER JOUR par ROMELARD Fabrice
KeyNotes du premier jour pour les développeurs. La session est principalement axée sur une des principales directions prise par Microsoft à travers tous ses nouveaux produits : Cloud privé ou public (Solution Azure) ...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Logiciels
Academy System (17.2.1.0)ACADEMY SYSTEM (17.2.1.0)Logiciel de gestion des établissements.
- élèves/étudiants (inscription, dossier, absence...)
-... Cliquez pour télécharger Academy System Easy-Planning (1.0.0.1)EASY-PLANNING (1.0.0.1)Basé sur les mêmes principes que MyPlanning, Easy-Planning permet de créer des plannings sous la ... Cliquez pour télécharger Easy-Planning COLLECTOR PLUS (3.00B)COLLECTOR PLUS (3.00B)COLLECTOR PLUS version 3.00B est un logiciel utilisant une base de données alimentée par :
- L... Cliquez pour télécharger COLLECTOR PLUS PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V7.4)PONAMEDIA TV DEVIENS HELLLOOO FLASH
LA TV SUR VOTRE ORDINATEUR.
Toute une plateforme Multi... Cliquez pour télécharger PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO LettresFaciles 2011 (8.0.0.1)LETTRESFACILES 2011 (8.0.0.1)LettresFaciles est un logiciel facilitant la création et la rédaction de lettres types.
Son inte... Cliquez pour télécharger LettresFaciles 2011
|