AS ConvertBox - Die Analyse
Wenn Sie bereits etwas durch unsere Website geblättert haben sind Ihnen sicherlich schon häufiger Begriffe wie wissens- und regelbasierte Analyse und Interpretation begegnet. Da diese Vorabanalyse die eigentliche Grundlage für eine hochqualitative, treffsichere und fehlertolerante Identifikation ist, erklären wir hier ausführlich, was wir darunter verstehen und wie wir diese Vorgabe umsetzen. Bedenken Sie, dass nur eine detailgenaue Analyse und Interpretation aller Adressbestandteile verhindert, dass „Äpfel mit Birnen“ verglichen werden. Wissens- und regelbasierte Analyse und Interpretation ist bei uns kein Marketingschlagwort sondern eine gelebte Philosophie.
Analyseaufbau
Das Besondere an unseren Basiskomponenten ist die vorgeschaltete, detailgenaue Analyse aller Bestandteile eines Namens, z. B. Firmeneigennamen (z. B. Oracle, Delta V, Microsoft, etc.), Firmenidentifikatoren (z. B. "Bank", "Versicherung", "EDV", "Service", etc.), Ortsangaben (z. B. "Düsseldorfer", "Köln", "Deutschland"), Rechtsformen (z. B. "GmbH", "AG", "GbR", etc.) und aller anderen Bestandteile, die in Firmennamen vorkommen können, auf Basis einer großen Wissens- und Regeldatenbank, die eine effiziente, performante, fehlertolerante Analyse gewährleistet. Das gleiche Verfahren funktioniert natürlich genauso auf Basis privatpersonenrelevanter Informationen (z. B. Vor- & Nachnamenslisten, Titel, Anrede, Präfix, Suffixe, Berufe, etc.). Die erwähnten Wissens- & Regeldatenbanken enthalten dabei EU-weites Wissen und werden insbesondere auch auf internationale Datenbestände optimiert.

Die Anlyse von Namen
Das Ergebnis der Analyse der Namensdaten ist eine Zeichenkette, in der alle Namensbestandteile mit ihrer Bedeutung in normalisierter Form abgelegt werden. Als Eingabeparameter wird lediglich der Originalname – d. h. die Aneinanderkettung aller Namenselemente aus dem Adressbestand – übergeben. Die Analyse identifiziert automatisch die Bestandteile von Personen- oder Firmennamen.
Beispiel 1
Eingabe : Herr Graf Dipl.-Ing. Hans-Josef von Thun und Hohenstein sr.
Ausgabe :
herr
Anrede
graf
Adelstitel
dipl ing
Akademischer Titel
hans-josef
Vorname
von
Präfix
thun und hohenstein
Nachname
sr
Suffix
Beispiel 2
Eingabe : T & A Systemgesell. f. DV-Integration mbH
Ausgabe :
ta
mögliches Akronym
system
Firmenwort
gesell
Teil der Gesellschaftsform GmbH
f
Abkürzung
DV
mögliches Akronym
integration
Firmenwort
mbh
Teil der Gesellschaftsform GmbH
Vorabanalyse der Namensbestandteile
Der Namensvergleich wird in einem mehrstufigen Verfahren durchgeführt und berücksichtigt u. a. ob zwei Privatpersonen, zwei Organisationen oder eine Privatperson mit einer Organisation verglichen werden. Dabei erkennt die AS MearchBox bei der Vorabanalyse mit einer extrem hohen Trefferwahrscheinlichkeit, ob es sich bei einem Datensatz um eine Organisation oder eine (bzw. mehrere) Privatperson(en) handelt. Diese Vorabanalyse versucht auch sofort alle Bestandteile eines Namens zu erkennen.
Bei Privatpersonen werden u. a. die folgenden, möglichen Bestandteile eines Namens erkannt:
Anrede bzw. Titulatur
„Herr“,„Frau“, „Eheleute“, „Familie“, etc.
Titel
„Prof. Dr.“, „Dipl.-Stat.“, „General“, etc.
Präfixe
„von den“, „van der“, „del“, etc.
Vornamen
„Hans-Peter“, „Erwin“, etc.
Initial
„HPB van den Bosch“ ==> „H.P.B. sind Initiale“
Nachnamen
auch zusammengehörende Nachnamen
Suffixe
z. B. „sr.“ oder „jun.“
Berufe
Bei Organisationen werden u. a. die folgenden möglichen Bestandteile eines Namens erkannt:
Firmeneigenname
z. B. „Address Solutions“, „Oracle“, „Microsoft“, etc.
Firmentätigkeitsworte
z. B. „Versicherung“, „Immobilien“, „Beratung“, „Software“, „Gartenbau“, „Lebensmittel“, etc.
Firmenwortsplittung
z. B. „Immobilienberatung“ ==> „Immobilie“, „Beratung“, „Kindertagesstätte“ ==> „Kind“, „Tag“, „Stätte“
Erkennung von Plural und Standardisierung auf Singular
Erkennung und Separierung der Gesellschaftsform
z. B. „Müller Beratungsges. f. Immobilien mbH und CoKG“ ==> „GmbH & Co.KG“, „Albert Einstein Stift.“ ==> „Stiftung“, etc.
Geografische Begriffe
z. B. „München“, „Asien“, „Gerolsteiner“, „Brabantse“, „New York“, etc.
privatpersonenrelevante Bestandteile, die auch in Organisationsnamen vorkommen können
Erkennung von Akronymen
z. B. „AIB Aachener Immobilienberatung“