AS OriginBox
Arbeitsweise der AS OriginBox
Die Arbeitsweise der AS OriginBox unterscheidet sich von anderen Verfahren, mit denen der sprachliche und kulturelle Hintergrund einer Person auf Basis des Namens identifiziert wird, im wesentlichen dadurch, dass der Vor- und Nachname und evtl. weitere Namenselemente zunächst analysiert, strukturiert und anschließend separat bestimmten Sprach- und/oder Kulturkreisen zugeordnet werden, um schließlich als Kombination aller Einzelinformationen ein Gesamtergebnis für die mögliche Zugehörigkeit zu generieren.
Herkömmliche Verfahren, die beispielswiese auf bestimmten Endungen von Namen basieren oder einfach in einem Namen insgesamt nach bestimmten Worten, Zeichenketten oder auch nach Namen aus einer definierten Vor-/Nachnamensliste suchen, können die Treffsicherheit der AS OriginBox nicht bieten.
Generell kann man die Arbeitsweise der AS OriginBox in drei Hauptschritte unterteilen. Zuerst wird ein eingegebener Name in eine korrekte Struktur überführt, so dass Vorname, Nachname, Präfix, etc. isoliert zur Verfügung stehen. Danach werden Zuordnungen des Vor- und Nachnamen zu möglichen Sprach- und Kulturkreisen separat ermittelt und schließlich wird aus der Kombination von Vor- und Nachname auf Basis eines Regelwerks das Sprach- und/oder Kulturkennzeichen für den Gesamtnamen bestimmt.
Der Vorgang ist in nachfolgender Grafik veranschaulicht, bei dem exemplarisch Namen aus dem türkischen Sprachraum identifiziert werden sollen.

Die AS OriginBox kann in Online-Prozessen und in Batch-Prozessen eingesetzt werden. Derzeit werden dabei folgende Sprach- und Kulturräume unterstützt:
Allgemeines
Bevor einzelne Sprach- und Kulturräume beschrieben werden, muss an dieser Stelle ausdrücklich betont werden, dass es bei der Ermittlung des Sprach- und Kulturrumes eines Namens nicht um die Ermittlung seiner ethnischen Herkunft geht. Besonders deutlich wird dies beispielsweise bei der Kategorie Ex-Jugoslawien: Hier wird nicht zwischen Slowenen, Mazedonieren, Kroaten, Bosniaken oder Serben unterschieden, da dies aus Datenschutzgründen bedenklich wäre. Zum anderen wäre eine solche Zuordnung aber auch im Sinne der eigentlichen Bestimmung überhaupt nicht förderlich, da in den Jahren des Bestehens Jugoslawiens längst eine erhebliche Vermischung all dieser Kreise stattgefunden hat. Aus diesem Grunde denken wir auch, dass der inzwischen etablierte Begriff des „Ethno-Marketings“ äußerst unglücklich und missverständlich getroffen wurde. Der durchaus positive Grundgedanke der hinter dieser Art des Marketings steht, nämlich die zielgerichtete Kommunikation mit einem bestimmten Sprach- und Kulturraum unter Berücksichtigung dessen ganz spezieller Bedürfnisse, wird hierbei oft durch den faden Beigeschmack des Wortes Ethno in den Hintergrund gerückt.
Osteuropäische Namen
Unter dem Begriff "Osteuropa" haben wir bei unserer AS OriginBox alle ehemaligen Staaten des Warschauer Pakts zusammengefasst, für die keine differenzierte Sprache und/oder Kultur identifiziert werden kann.
Insgesamt gesehen wird der wachsenden Bedeutung Osteuropas in künftigen Versionen der AS OriginBox mehr Bedeutung zugeordnet, so dass dann der Sprach- und Kulturraum detaillierter bestimmt werden kann. Erste Tests zeigen einen zu erwartenden Qualitätsstand wie z. B. bei den Türken (d. h. die einem osteuropäischen Land fälschlicherweise zugeordneten Namen erreichen die gleichen prozentualen Anteile). In dieser Gruppe fällt weiter auf, dass viele ziemlich eindeutig zu Osteuropa zu zählende Namen auf Grund eklatanter Schreibfehler und der unterschiedlichen Umsetzung der kyrillischen Schreibweisen zu nicht erkannten Nachnamen führten. Oft sind jedoch wegen der Problematik der Umsetzung der kyrillischen Schriftzeichen auch unterschiedliche Schreibweisen des gleichen Namens im Umlauf, z. B. "Woronin" oder "Voronin".
Die türkischen Namen
Unter dem Begriff „türkischstämmiger Name“ verstehen wir Namen aus dem türkischen Sprach- und Kulturraum, also natürlich auch die vielen kurdischen Namen. Es wird also keinerlei Eingrenzung auf die vielfältigen ethnischen Gruppen in der Türkei vorgenommen. Von den ca. 10,5-11% nicht deutschstämmigen Mitbürgern sind ca. 3,0% Türken. Somit ist diese Zielgruppe, auch auf Basis ihrer immer mehr wachsenden Kaufkraft (ca. 17 Milliarden Euro pro Jahr), eine beliebte Zielgruppe. Aus diesem Grunde haben wir der korrekten Identifizierung des türkisch/kuridischen Sprach- und Kulturraums besonderes Gewicht verliehen, was oft sehr schwer ist, da diese Namen für das ungeübte Auge oft große Ähnlichkeiten mit z. B. griechischen, arabischen und bosnischen Namen aufweisen. Geringfügige Änderungen der Schreibweisen bei den oft für Deutsche ungewohnten Namen führen leider häufig dazu, dass die tatsächliche, türkische Zugehörigkeit nicht mehr zu ermitteln ist. Beispielsweise gibt es im Türkischen viele Namen die auf "man" enden, z. B. "Özman", "Süleyman", etc., die oft mit zwei "n" am Ende geschrieben werden und dann nicht mehr zu erkennen sind. Insbesondere führen oft folgende Probleme dazu, dass die Identifizierung nicht möglich ist:
Dies sind nur einige der häufigsten Problemursachen. Ziel unserer Sprach- und Kulturraumbestimmung ist jedoch eine möglichst geringe Fehlerquote bei der Bestimmung, die im Normalfall <1% sein dürfte.
Arabische Namen
Die Klasse der arabischen Namen versteht sich mehr als eine Klasse der muslimischen Länder der arabischen aber auch der nordafrikanischen Welt. Hier ist besonders die korrekte Abgrenzung gegenüber den sehr ähnlichen aber dennoch unterschiedlichen Namen des türkischen und bosnischen Sprach- und Kulturraums wichtig.
Asiatische Namen
Zu der Gruppe der asiatischen Namen zählen in allererster Linie Chinesen, Vietnamesen, Koreaner (Süd- und Nordkorea) und Japaner.
Deutsche Namen
Beim Aufruf der AS OriginBox wird immer ein Landesparameter mit übergeben, der die vermutete bzw. erwartete Zugehörigkeit der Namen repräsentiert. Dies ist wichtig für Namen, die eigentlich typisch deutsch, englisch und französisch sein können, z.B. "Robert Martin". Hier ist sicherlich "Robert" ein deutscher, englischer und französischer Vorname, genauso ist "Martin" ein in Deutschland, Großbritannien und Frankreich (und auch noch in anderen Ländern) existierender Nachname. Wenn nun als Landesparameter Deutschland eingestellt wurde, wird als Sprach- und Kulturraum für diesen Namen "German" ermittelt, da dies der Erwartungshaltung entspricht. Selbstverständlich gehören auch österreichische und schweizerische Namen zu dieser Gruppe.

