Artikelpräsentation, DataNatuRe, Ecoinform

Schon seit einiger Zeit baut die DataNatuRe Genossenschaft an einer Produktdatenbank für den Bio- und Naturwarenhandel. Neben Daten aus unserem systemeigenen „Ökobox“-Pool und denen des Pioniers auf diesem Gebiet, Ecoinform, können unsere Shops nun auch Daten von dieser neuen Quelle darstellen (Januar 2018: Aktuell läuft diese Funktion im Test-Modus).

Im Online-Shop brauchen wir Beschreibungen, Bilder, genaue Herstellerangaben und Details zu den Inhaltstoffen. Dies ist wichtig für die Anzeige, aber auch zum Filtern und Organisieren der Informationen auf den Webseiten. Einiges davon ist aber auch im Warenwirtschaft-Backend wichtig. Wer schon mal neue Artikel im System angemeldet hat, weiß wie aufwändig dieser Prozess sein kann.

Möglichst einfach für den Verkäufer ist es natürlich, wenn diese Daten vollständig und gleichförmig vorliegen, denn dann kann das Einspielen automatisch erfolgen. Leider ist das aber nicht immer der Fall: warum ist das eigentlich so schwierig, gute Artikel-Informationen für den Online.Shop zu bekommen? Oder anders gefragt: warum ist es so schwierig eine einheitliche Datenbank aufzubauen?

Zum einen hat nicht jeder Hersteller die Kapazität um seine Produkte für alle Verkaufskanäle gut zu präsentieren. So soll ein Bild für den Druck meist hochauflösend und detailreich sein, während für eine Artikelliste im Online-Shop eher ein plakatives und wenig datenintensives kleineres Bild in Frage kommt.

Andererseits wird eine zentrale Datenbank von vielen Menschen auf verschiedenen Positionen verwendet. Die haben oft einen sehr spezifischen Blick auf die Daten haben: Buchhalter schauen z.B. eher auf die Preise statt die Bilder, Marketingleute wiederum haben den Text und das Bild im Blick, aber weniger die Inhaltsstoffe. Statistiker vergleichen Warengruppen und brauchen die Artikel in einer bestimmten Ordnung. Manche meinen es gut und Füllen die Felder für Beschreibung-lang, Beschreibung-mittel und Beschreibung-kurz aus, andere haben’s eilig und schreiben ein Sätzchen auch noch ins „-lang“ Feld.

Die Artikelinformation unterscheiden sich zudem je nach Warengruppe – d.h. es gibt andere Datenfelder bei einem Käse (z.B. Fettgehalt, Rinde oder Labart) als bei einem Wein (Trinktemperatur oder Dekantierzeit) . Und dann ist die Struktur und der Typ der Daten auch nicht gleich: Die Fettstufe kommt in Zahl % daher, aber beim Herkunftsland muss es eindeutige Angaben geben. Allergene kann es eines geben oder 10, Zertifizierer gibt es zwar meist einen, manchmal aber auch mehrere.

Diese Komplexität zeigt sich sogar bei dem doch recht jungen, mit modernen Mitteln und auf breiter Basis projektierten Datenbank von DataNatuRe. So bekommen wir für unser System zwar alle Informationen, aber die Aufbereitung ist nicht ganz einfach:

Aus der Vielzahl der Datenfelder (insgesamt weit über 1000) müssen die relevanten zur Filterung oder Anzeige im Online-Shop ausgewählt werden – und das obwohl die Warengruppen-Zuordnung in den einzelnen Shops i.d.R. nicht der Vorgabe des Datenlieferanten entspricht
Viele Zahlenwerte sind nicht homogen eingetragen und können nicht ohne weiteres, z.B. bei einer Filterung verglichen werden (100ml sind zwar 0.1l, aber das weiß ein Computer nicht so ohne weiteres)
Trotz viel Mühe bei den Eingabemasken habe ich schon Veganes gesehen, was explizit nicht vegetarisch ist, oder eine Hühnerbrühe die explizit kein Schweinefleisch beinhaltet (oh).
Es passiert oft, dass manche Artikel eine superausführliche Beschreibung haben, andere nicht – sofern diese Artikel z.B. im Shop nebeneinander stehen, fällt dies negativ auf – ganz abgesehen von Artikelnamen die sich um den Bildschirm herum wickeln.
Bilder sind leider typischerweise nicht Web-gerecht vorhanden – also optimiert für kleiner und große Bildschirme, für detail- oder Listendarstellung. Hier greifen dann automatisierte Bildverarbeitungsalfgorithmen, die mit sehr unterschiedlichen Ausgangsmaterial klar kommen müssen.

Nicht zuletzt gibt es eine Reihen von Zusatzinformationen, die ihrerseits Daten erfordern, die von weiteren Quellen hinzugefügt wird. So haben wir eigene Datenpools mit Informationen zu Herstellern, Verbänden oder Herkunftskennzeichen.

Um die Verwendung all dieser Informationsdetails möglichst einfach zu machen, gibt es im PCG das InfoPool-Modul. Damit können nicht nur Gruppen von Artikeln en-mass bearbeitet werden, auch kann man sich mit Hilfe einfacher Abhängigkeits-Regeln die Arbeit vereinfachen. Schliesslich müssen die Informationen stimmen, auch wenn der Hersteller z.B. die Rezeptur einer Creme mal ändert.

In den Shopeinstellungen können die verschiedenen Pools zugeschaltet werden. Für schnelle Resultate kann das System einfach fehlende Informationen von diesen Datenquellen hinzumischen, z.B. durch Zuordnung per GTIN. Zudem gibt es dort Statistiken über deren Verwendung und Abfragemöglichkeiten, die während der Dateneingabe und zur Kontrolle verwendet werden können.