Künstliche Intelligenz ohne Datenengpass: Synthetic Data wird zum Infrastrukturthema

Künstliche Intelligenz ohne Datenengpass: Synthetic Data wird zum Infrastrukturthema

Synthetisch erzeugte, datenschutzkonforme Trainingsdaten können den Engpass realer Daten auflösen. So entwickelt sich rund um „Synthetic Data“ ein eigenständiger Infrastrukturmarkt für KI-Anwendungen.

BildKünstliche Intelligenz lebt von Daten – und genau hier stoßen viele Unternehmen an Grenzen. In sensiblen Bereichen wie Gesundheit, Finanzdienstleistungen oder Mobilität ist reale Trainings- und Testdaten oft knapp, regulatorisch eingeschränkt oder teuer zu erzeugen. Synthetic Data, also künstlich generierte, statistisch realistische Datensätze, schickt sich an, diesen Engpass zu lösen. Für Investoren entsteht ein neues Infrastruktursegment zwischen Cloud, KI-Modellen und Fachanwendungen.

Der Markt für Synthetic-Data-Lösungen wächst rasant. Studien beziffern das globale Marktvolumen auf wenige hundert Millionen US-Dollar im Jahr 2024, prognostizieren aber ein Wachstum auf mehrere Milliarden US-Dollar bis zum Ende des Jahrzehnts – mit jährlichen Wachstumsraten von teils deutlich über 35 Prozent. Parallel dazu erwarten Analysten, dass bis 2028 ein Großteil der für KI genutzten Daten synthetisch sein wird; Schätzungen sprechen von bis zu 80 Prozent, ausgehend von rund 20 Prozent im Jahr 2024. „Wir sehen hier eine Art ,Datenwende‘: weg von der reinen Sammlung realer Informationen hin zu einer kombinierten Strategie aus realen und synthetischen Daten“, sagt Christian Hintz, Portfoliomanager des „AI Leaders“ (WKN: A2PF0M / ISIN: DE000A2PF0M4).

Synthetic Data adressiert mehrere strukturelle Probleme zugleich. Erstens schließt sie Lücken in Datensätzen, etwa bei seltenen Ereignissen in der Industrie, im Straßenverkehr oder im Zahlungsverkehr. Zweitens reduziert sie Abhängigkeiten von personenbezogenen Daten und senkt damit den Druck aus Datenschutzvorgaben wie der DSGVO. Drittens lassen sich Szenarien simulieren, die in der realen Welt nur schwer oder sehr teuer zu beobachten wären – von Ausnahmesituationen im Klinikbetrieb bis zu seltenen Störfällen in komplexen Produktionsanlagen. Moderne Generative-AI-Verfahren wie GANs und Diffusionsmodelle erzeugen dabei Tabellendaten, Bilder, Video- oder Sensordaten, die statistisch nah an der Realität liegen, ohne personenbezogene Informationen zu enthalten.

Für Investoren entsteht entlang dieser Wertschöpfungskette ein differenziertes Anlageuniversum. Eine Gruppe von Anbietern konzentriert sich auf generische Plattformen für Synthetic Data, die branchenübergreifend einsetzbar sind. Sie stellen Werkzeuge zur Verfügung, mit denen Unternehmen eigene synthetische Datensätze erstellen, Qualität und Datenschutz prüfen und die Daten in Trainingspipelines integrieren können. Der Markt für Synthetic-Data-Generierung wird bis 2030 auf ein Vielfaches seines heutigen Volumens geschätzt; zugleich ist die Teilkomponente „Synthetic Data“ im Markt für KI-Trainingsdatensätze der am schnellsten wachsende Bereich. Daneben entstehen spezialisierte Anbieter für bestimmte Domänen – etwa im Gesundheitswesen, in der Finanzbranche oder in der Automobilindustrie. Sie kombinieren Synthetic Data mit domänenspezifischem Fachwissen und bieten vorkonfigurierte Datenbibliotheken für typische Anwendungsfälle, von medizinischen Bilddatensätzen über Betrugserkennung bis hin zu autonomen Fahrszenarien. In vielen dieser Segmente ist reale Datenbeschaffung besonders anspruchsvoll, weil sie entweder stark reguliert, sicherheitskritisch oder schlicht selten ist. Synthetic Data schafft hier die Möglichkeit, Modelle robuster zu machen, ohne auf reale Vorfälle warten zu müssen.

Ein weiterer Baustein des Investment-Case liegt im Finanzierungstrend. Risikokapitalgeber haben in den vergangenen Jahren verstärkt in Synthetic-Data-Start-ups investiert; 2024 flossen Schätzungen zufolge mehrere hundert Millionen US-Dollar in eine noch überschaubare Zahl von Anbietern, Tendenz steigend. Für Christian Hintz und Tilmann Speck, die den „AI Leaders“ gemeinsam managen, ist das ein Hinweis auf die wachsende strategische Bedeutung des Themas: „Wo sich ein eigenständiges Ökosystem aus Infrastruktur, Tools und Spezialanbietern herausbildet, entsteht oft ein eigenständiges Anlagethema – vorausgesetzt, die Lösungen sind nicht nur technologisch interessant, sondern auch eng an reale Budgets der Anwender gekoppelt“, betont Christian Hintz.

Gleichzeitig ist Synthetic Data kein Selbstläufer. Fachleute weisen darauf hin, dass Qualität, Aussagekraft und Datenschutz nur dann gewährleistet sind, wenn die generierten Datensätze sorgfältig validiert werden. Hier setzt ein weiterer Teilmarkt an: Tools für die Messung von „Fidelity“, „Utility“ und „Privacy“ synthetischer Daten. Sie prüfen, wie nah die erzeugten Datensätze an der Realität liegen, wie gut Modelle damit trainiert werden können und wie gering das Risiko einer Re-Identifizierung ist. Solche Lösungen überschneiden sich teilweise mit dem entstehenden Markt für KI-Governance (etwa ISO-42001- und NIST-Frameworks) und machen Synthetic Data zu einem Thema, das technische, regulatorische und organisatorische Fragen verbindet. Aus Sicht der Fondsmanager ist Synthetic Data damit vor allem eines: ein Infrastrukturbaustein, der die Skalierung von KI erst möglich macht. „Ohne Daten bleibt jede Modellinnovation begrenzt“, fasst Speck zusammen. „Synthetic Data verändert deshalb nicht nur Training und Testen, sondern die Grundlogik der Datenverfügbarkeit. Für Investoren ist spannend, welche Anbieter es schaffen, aus dieser Technologie wiederkehrende, skalierbare Geschäftsmodelle zu bauen – vom generischen Plattformbetreiber bis zum spezialisierten Branchenpartner.“

Verantwortlicher für diese Pressemitteilung:

AI LEADERS
Herr Christian Hintz
Kronprinzstraße 17
70173 Stuttgart
Deutschland

fon ..: +49 (0) 711 63 22 42
web ..: https://ai-leaders.de
email : info@christianhintz.com

Über den Fonds „AI Leaders“

Der „AI Leaders“ (WKN: A2PF0M / ISIN: DE000A2PF0M4) ist ein ist ein global investierender Aktienfonds mit dem Fokus auf Anbieter und Anwender Künstlicher Intelligenz. Das Managementteam bestehend aus Christian Hintz, Tilmann Speck und Gerd Schäfer verwaltet ein Portfolio von bis zu 160 Werten von Herstellern und Anbietern von KI-Hardware und von KI-Software, Anwendern von KI-Hard- oder -Software für den eigenen Unternehmenszweck und Dienstleister im Bereich von KI. Bis 2030 erwarten Experten für die Künstliche Intelligenz einen Wertschöpfungsbeitrag zum weltweiten Bruttosozialprodukt in Höhe von 1,2 Prozent pro Jahr. Bei den bis zu 160 Portfoliounternehmen des „AI Leaders“ handelt es sich um Gesellschaften mit einer führenden Marktstellung. Das Portfoliomanagement-Team setzt den digitalen Investmentprozess ,TOPAS‘ des Wertpapierinstituts ELAN Capital-Partners GmbH ein. Dieser wurde für die zeitnahe Steuerung von Portfoliobausteinen konzipiert und balanciert Tag für Tag die Allokation des Portfolios, um den sich jeweils ändernden Marktbedingungen zu entsprechen. Damit können die Faktorprämien von Wachstumswerten eingenommen werden, während die Volatilität auf einem gesamtmarktüblichen Niveau gehalten wird. Weitere Informationen unter https://ai-leaders.de

Pressekontakt:

AI LEADERS
Herr Christian Hintz
Kronprinzstraße 17
70173 Stuttgart

fon ..: +49 (0) 711 63 22 42
web ..: https://ai-leaders.de
email : info@christianhintz.com