Dieser Artikel untersucht, wie es XDMs innovativer Ansatz ermöglicht, komplexe synthetische Datensätze zu generieren, die sich nahtlos in bestehende Entwicklungsprozesse integrieren lassen. Entdecken Sie, wie dieses leistungsstarke Tool Ihre Testdatenstrategie revolutionieren kann, während es gleichzeitig die Softwarequalität, Sicherheit und Compliance verbessert.
(Intelligente) realistische Testdaten erzeugen
Die Generierung synthetischer Testdaten gewinnt zunehmend an Bedeutung – insbesondere dort, wo Datenschutzvorgaben oder fehlende Zugriffsmöglichkeiten den Einsatz produktiver Daten erschweren. Gleichzeitig bleibt die Nutzung produktiver Datenkopien ein bewährter und wertvoller Bestandteil vieler Teststrategien – vor allem, wenn es darum geht, reale Datenmuster oder komplexe Zusammenhänge präzise abzubilden.
Hier setzt XDM an: Durch den gezielten Einsatz von Künstlicher Intelligenz ermöglicht XDM die Erstellung hochwertiger synthetischer Daten, die echten Daten in Struktur und Inhalt sehr nahekommen – jedoch vollständig anonymisiert und frei von personenbezogenen Informationen sind. So entsteht eine flexible Kombination aus Datenschutz, Qualität und Effizienz im Testdatenmanagement.
Dabei zeichnet sich XDM durch seine Vielseitigkeit und Skalierbarkeit aus, um auch komplexere Datenbestände zu generieren. XDM erlaubt es, beliebige Datenstrukturen zu definieren und daraus automatisiert Testdatensätze zu generieren, die sich nahtlos in bestehende Entwicklungs- und Testprozesse integrieren lassen.
Besonders hervorzuheben ist die Möglichkeit, realistische Daten aus vorhandenen Mustern zu erzeugen oder gezielt seltene Szenarien zu simulieren. So können Unternehmen nicht nur den Datenschutz gewährleisten, sondern auch die Qualität und Sicherheit ihrer Software erheblich verbessern.
Lösung: KI-generierte synthetische Testdaten mit XDM
XDM setzt Künstliche Intelligenz ein, um synthetische, aber realistische Testdaten zu generieren. Der Prozess läuft in folgenden Schritten ab:
1. Definition der Datenstruktur
Initial wird das Datenmodell einer Anwendung hinterlegt. In diesem Beispiel nutzen wir eine einfache Anwendung zur Verwaltung von Angestellten und deren Abteilungen. Ein Angestellter besitzt bsp. die Attribute wie Vorname, Nachname, Geburtsdatum oder E-Mail-Adresse.
Ein Beispiel für die Definition eines Angestellten in XDM:
Das Hinterlegen des Datenmodells ist ein einmaliger Schritt. Sobald XDM den Aufbau kennt, kann dieses Modell unter anderem für die Generierung von Testdaten genutzt werden.
2. Entity Generator erstellen
Im nächsten Schritt werden Entity-Generatoren erstellt, die Datensätze für die definierten Entity-Typen generieren können. In unserem Beispiel ist es ein Entity-Generator zum Erzeugen von Angestellten-Instanzen. Traditionelle Ansätze erfordern oft eine aufwändige Programmierung, um die Daten zu generieren. Jedes Attribut muss manuell mit sinnvollen Daten gefüllt werden.
XDM löst dieses Problem mithilfe eines Large Language Model (LLM). Dies wird genutzt, um plausible Datensätze für einen Angestellten zu generieren.
Folgendes Beispiel zeigt, wie ein LLM in XDM genutzt werden kann, um einen realistischen Angestellten zu generieren:
Wenn bereits produktive Daten existieren, kann XDM Verteilungen und Abhängigkeiten analysieren und diese Statistiken können in die Generierung einfließen, um Wertebereiche und Zusammenhänge realitätsnah nachzubilden. Durch die Kombination von Attributbeschreibungen und KI-gestützter Generierung entstehen stimmige, plausible Daten.
3. File Scenario erstellen
Ein File Scenario steuert, in welcher Datenhaltungsform die generierten Daten erzeugt werden sollen. Für unser Beispiel wollen wir die Datensätze in CSV Form erzeugen.
4. Task erstellen und ausführen
Der letzte Schritt besteht darin ein Task-Objekt zu erstellen, der die notwendigen Bestandteile zusammensteckt. In unserem Beispiel erstellen wir einen Task, der den Entity Generator aufruft und die generierten Angestellten in ein CSV File schreibt.
Nach der Ausführung des Tasks werden die generierten Daten in einem CSV File gespeichert. Die generierten Daten für unser Beispiel sehen wie folgt aus:
Durch das Bereitstellen des fachlichen Kontexts lassen sich wertvolle Datensätze generieren. Implikationen, die von der zu testenden Software abhängen, können so berücksichtigt werden.
Customizations
Wenn die Daten zu externen Systemen passen müssen, oder die Eindeutigkeit von Schlüsselelementen gewährleistet werden muss, können die generierten Datensätze im jeweiligen Generator angepasst werden:
In obigem Beispiel wird ein Attribut-Generator für die Mitarbeiter-Nummer erstellt. Dieser Generator stellt sicher, dass aller erzeugten Mitarbeiter-Nummern größer 600.000 und die Werte eindeutig sind. Somit lassen sich leicht Anpassungen umsetzen, die ein LLM praktisch nicht umsetzen kann, da kein dauerhaftes Gedächtnis existiert, welche Werte bereits generiert wurden.
Fazit:
Mit XDM können Sie hochwertige, realitätsnahe und DSGVO-konforme Testdaten automatisiert generieren. Der Aufwand zur Implementierung der Generatoren ist durch die Nutzung von Künstlicher Intelligenz minimal.
Nutzen Sie die Vorteile Künstlicher Intelligenz, um Ihre Softwaretests zu optimieren und Entwicklungsprozesse effizienter zu gestalten.
Starten Sie jetzt – testen Sie XDM und revolutionieren Sie Ihre Testdatenstrategie!