Martin Schneider
2006-04-06 07:16:45 UTC
Hallo!
Ich habe eine Access-Datenbank mit etwa 2.500 Datensätzen. Wenn ein
neuer Datensatz eingegeben wird, mache ich eine Ähnlichkeitssuche per
Levenshtein Distance über die vorhandenen Daten und biete die Top-Ten
als Auswahl an, um Dubletten zu vermeiden.
Leider ist diese Methode bei langen Strings sehr langsam. Gibt es hier
eine schnellere Alternative?
Danke für Eure Tips.
Gruß,
Martin
Ich habe eine Access-Datenbank mit etwa 2.500 Datensätzen. Wenn ein
neuer Datensatz eingegeben wird, mache ich eine Ähnlichkeitssuche per
Levenshtein Distance über die vorhandenen Daten und biete die Top-Ten
als Auswahl an, um Dubletten zu vermeiden.
Leider ist diese Methode bei langen Strings sehr langsam. Gibt es hier
eine schnellere Alternative?
Danke für Eure Tips.
Gruß,
Martin