Re: "Reinigung" einer grossen Datenbank
- From: piotr.pilarek@xxxxxxxx
- Date: Thu, 08 Nov 2007 23:56:52 -0800
Hallo Michael
On Nov 9, 8:31 am, "Michael v. Fondern" <spammeh...@xxxxxxxxxxx>
wrote:
Josef Poetzl:
Hallo!
piotr.pila...@xxxxxxxx schrieb:
Noch wegen dem SQL Server, ich habe eigentlich kein
Geschwindigkeitsproblem und kann die Grösse der "Kuchenstücke" selbst
wählen und dann nach Bearbeitung in die grosse DB zurückspielen. Mit
256 MB RAM würde der SQL Server sicher nicht besonders leistungsfähig.
Probiere es einmal.
Ich verwende öfters zum Testen ein uralt Notebook mit 256 MB RAM
(abzüglich RAM für Grafikchip) und das gibt immer noch brauchbare
Abfragezeiten (auch bei Auswertungen von einigen Mio DS).
Probiere es es nicht. Die ganzen Empfehlungen hier für einen SQL-Server
scheinen mir für deinen Anwendungsfall völlig "oversized". Wenn ich das
richtig sehe, hast du einzelne Access-Datenbanken mit jeweils nur einer
Tabelle, die nicht mehr Datensätze haben, als sich mir Access gut
verwalten lassen. Und ich glaube auch nicht, dass der phonetische
Vergleich dir hilft, du brauchst wahrscheinlich eh ein (z.B.
VB-)Programm, welches dir die Arbeit vereinfacht.
Wie sind denn deinen Programmierkenntnisse? Der Hinweis auf die
Levenshtein-Funktion wurde ja schon gegegeben, siehe auch
http://de.wikipedia.org/wiki/Levenshtein-Distanz
Ich würde dir ansonsten empfehlen, ein Programm zu schreiben, welches
Namen, deren Levenshtein-Distanz nicht allzu groß ist,
zusammengruppiert. Das passt bestimmt auch im Polnischen.
Grüße
- Michael -
Also erst mal Dank, ich glaube eigentlich auch, dass wir mit der
Server Geschichte zu weit gehen würden. Was ich wollte, war ein
einfaches Programm, mit dem wir alle (auch meine Kollegen) die
Adresslisten durchputzen, alle mit den gleichen Kriterien, und das am
besten zuhause. Wie gross die einzelnen Stücke sind, können wir uns
aussuchen.
Ich habe mir das Levensthein-Ding angeschaut, als ich den Code gesehen
habe, hat es mich natürlich beinahe umgeschlagen. Das versteh ich
offensichtlich nicht. Habe ein Beispiel mit einer Mde gefunden, ich
weiss nicht, ob ich diese "vergewaltigen" kann, mal sehen.
Es ist klar, dass das Problem sehr komplex ist, der Unterschied
zwischen einem "l" und einem polnischen "ł" ist in der Praxis meistens
sehr gering und bei älteren Daten aus den uralten EDV Anlagen waren
gar keine polnischne Sonderzeichen. Ein Teil der Listen wurde gescannt
und OCR aufbereitet, dabei sind bestimmte Sonderzeichen weggefallen
und auch unsinnige Ersatzzeichen eingesetzt worden.
Also man hat es nicht leicht....
Ich grüsse
Piotr
---
.
- Follow-Ups:
- Re: "Reinigung" einer grossen Datenbank
- From: Michael v. Fondern
- Re: "Reinigung" einer grossen Datenbank
- From: Oliver Straub
- Re: "Reinigung" einer grossen Datenbank
- From: Mark Doerbandt
- Re: "Reinigung" einer grossen Datenbank
- References:
- "Reinigung" einer grossen Datenbank
- From: piotr . pilarek
- Re: "Reinigung" einer grossen Datenbank
- From: Mark Doerbandt
- Re: "Reinigung" einer grossen Datenbank
- From: Sascha Trowitzsch
- Re: "Reinigung" einer grossen Datenbank
- From: Mark Doerbandt
- Re: "Reinigung" einer grossen Datenbank
- From: Michel Fouquet
- Re: "Reinigung" einer grossen Datenbank
- From: piotr . pilarek
- Re: "Reinigung" einer grossen Datenbank
- From: Michel Fouquet
- Re: "Reinigung" einer grossen Datenbank
- From: piotr . pilarek
- Re: "Reinigung" einer grossen Datenbank
- From: Josef Poetzl
- Re: "Reinigung" einer grossen Datenbank
- From: Michael v. Fondern
- "Reinigung" einer grossen Datenbank
- Prev by Date: Re: Steuerung von Word aus Access
- Next by Date: Re: Steuerung von Word aus Access
- Previous by thread: Re: "Reinigung" einer grossen Datenbank
- Next by thread: Re: "Reinigung" einer grossen Datenbank
- Index(es):
Relevant Pages
|