Seit dem Erfindung der Computer und insbesondere des Internets in den 1990er Jahren hat diese Technologie das Leben von uns allen vollkommen verändert. Eine der größten Innovationen, die uns im 21. Jahrhundert beschäftigt, ist der Einzug der so genannten künstlichen Intelligenz (KI) in unseren Alltag.
Im Rahmen der Entwicklung von Modellen für das Trading interessiert und insbesondere das Machine Learning, ein Teilgebiet der künstlichen Intelligenz. Machine Learning oder maschinelles Lernen ist eine der am meisten geförderten neuen Technologien. Maschinelles Lernen versucht Lösungswege abzubilden, die wir Menschen häufig intuitiv gehen, um ein Problem zu lösen. Oder anders ausgedrückt: mit Hilfe der künstlichen Intelligenz simulieren Computer die menschliche Intelligenz.
Wenn Sie sich zum Beispiel ein gebrauchtes iPhone kaufen wollen, dann werden sie Angebote durchstöbern mit der Frage im Hinterkopf: was ist denn ein guter Preis für ein das Modell, das ich mir gerne kaufen möchte. Sie stöbern, schauen sich Merkmale an wie Alter, Zustand oder Speicherausstattung. Nach einiger Zeit beginnen Sie ein Muster zu sehen: Der Preis für ein iPhone hängt von dem Alter ab und fällt jedes Jahr um 50 EUR. So können Sie einen Wert voraussagen, der auf den ihnen bekannten Daten beruht. Das nennt man eine Regression.
Nun kommen noch andere Preisänderungen für den Zustand oder die Speicherausstattung hinzu. Der Preis ändert sich auch, wenn gerade ein neues iPhone auf den Markt kommt. So ergeben sich zahlreiche Variablen, die man als Mensch nur schwer alle im Kopf behalten kann.
Hier kann maschinelles Lernen ansetzen. Wir füttern den Computer mit vorhandenen Daten und bitten die Maschine alle Muster im Zusammenhang mit dem Preis zu finden. Genau solche Berechnungen kann ein Rechner wesentlich effektiver anstellen als ein Mensch. Und genau das ist ein Paradebeispiel für die Anwendung künstlicher Intelligenz.
Künstliche Intelligenz ist, ganz einfach gesagt, die Vorhersage von Ergebnissen basierend auf eingehenden Daten. Genau diese Anwendung spielt auch für das Trading eine wichtige Rolle.
Künstliche Intelligenz wird zunehmend beim Trading eingesetzt
Künstliche Intelligenz wird bereits in vielen Bereichen eingesetzt. Sei es bei der Spamerkennung von E-Mails, Sder pracherkennung bei Alexa und Siri oder auch selbstfahrende Autos.
Die künstliche Intelligenz hält Einzug in immer mehr Lebensbereiche. Auch Beim Trading wird der Anteil der Handelssysteme, die auf künstlicher Intelligenz beruhen, zunehmen größer. Der Vorteil ist, dass die Märkte mit größerer Genauigkeit analysiert werden können. Mit Hilfe künstlicher Intelligenz wird es für Trader und Börsenunternehmen zunehmend einfacher, an den Märkten höhere Renditen zu erzielen und Handelsrisiken zu mindern.
Welche Rolle spielen Daten bei künstlicher Intelligenz?
Eine enorme Bedeutung kommen bei der künstlichen Intelligenz den zugrundeliegenden Daten zu. Man unterscheidet zwischen automatisch bezogenen Daten (wie etwa Kursdaten) und manuell bezogenen Daten. Manuell bezogene Daten sind von Datenanalysten für den Einsatz vorbereitet und enthalten deutlich weniger Fehler.
Welche Rolle spielen die Variablen bei der künstlichen Intelligenz?
Variablen werden auch als Parameter oder Merkmale bezeichnet. Das kann das Alter eines Geräts sein, der Zustand, das Geschlecht eines Benutzers, der Aktienkurs oder auch das Vorkommen bestimmter Worte in Texten.
Welche Rolle spielen Algorithmen bei der künstlichen Intelligenz?
Im maschinellen Lernen gibt bei jeder Ausgangslage eine Vielzahl von Ansätzen, ein Problem zu lösen. Bei jedem unterschiedlichen Ansatz erhalten wir eine andere Leistung, Präzision und auch Verarbeitungsgeschwindigkeit des finalen Modells. Wobei die Qualität der Daten immer noch am höchsten zu bewerten ist.
Im maschinellen Lernen gibt es ein geflügeltes Wort: „Shit in – shit out“. Wenn das Modell auf der Grundlage schlechter Datenqualität Berechnungen durchführt, ist es nicht möglich, dass der Algorithmus erstklassige Analyseergebnisse ausspuckt. Es ist also enorm wichtig, auf die Qualität und die Aussagekraft der Daten zu achten.
Klassisches Maschinenlernen als Teilgebiet der künstlichen Intelligenz
Klassisches Machine Learning wird häufig in überwachtes und unüberwachtes Lernen gegliedert.
Supervised Learning oder überwachtes Lernen
Beim Überwachten Lernen geht es primär darum Muster zu lernen. Um diese Muster zu erkennen, wird die Beziehung zwischen bereits bekannten Ergebnissen und Variablen untersucht. Zunächst erhält die Maschine Trainingsdaten von einem Superviser.
Diese Beispieldaten bestehen aus unterschiedlichen Merkmalen, zum Beispiel Fotos. Auf einigen Fotos sind Katzen, auf anderen Hunde zu sehen. Der Superviser hat diese Daten bereits beschriftet bzw. markiert. Der Computer nutzt diese beschrifteten Fotos um zu lernen.
Anschließend können dann mit dem Algorithmus Muster aufgespürt werden, die in den Daten vorhanden sind. Es wird ein Modell entwickelt und versetzt die Algorithmen damit in die Lage, mit den gleichen Regeln Muster in neuen, nicht markierten Datensätzen aufzuspüren. In der Praxis wird diese Methode häufig eingesetzt.
Bezogen auf das Trading bedeutet das: Sobald das Modell Trainingsdaten und Testdaten erfolgreich durchlaufen hat, kann es mit einer Handelsplattform verbunden werden, so dass man mit dem Papertrading starten kann. Erst nachdem der Ansatz auch beim Papertrading erfolgreich handelt, empfehlen wir einen Handel mit Echtgeld.
Es gibt zwei primäre Ansätze des überwachten maschinellen Lernens: Klassifizierung und Regression. Bei der Klassifizierung wird die Kategorie eines Objektes versucht vorherzusagen. Bei der Regression wird versucht, einen bestimmten Datenpunkt auf einer numerischen Achse vorherzusagen.
Unsupervised Learning oder unüberwachtes Lernen
Beim unsupervised Learning sind nicht alle Trainingsdaten klassifiziert. Ziel ist es auch hier, versteckte Muster zu erkennen und Kennzeichnungen zu vergeben.
Ein Beispiel für unüberwachtes Lernen ist der „k-Means“-Algorithmus, der gefundene Datenpunkte gruppiert (Cluster-Techniken). Häufig können mit diesem Ansatz Muster in Datensätzen erkannt werden, von denen man vorher nichts ahnte.
So kommt unüberwachtes Lernen häufig in der Identifizierung betrügerischer Aktivitäten zum Einsatz (wie zum Beispiel Insiderhandel beim Trading).
Künstliche Intelligenz: Klassifikation
Bei der Klassifikation lernt die Maschine Dinge zu sortieren: Das hier sind Katzenbilder, das andere sind Bilder von Hunden. Damit eine Maschine die Klassifikation schneller lernen kann, wird ein Supervisor eingesetzt, der die Daten am Anfang mit Merkmalen versieht. Basierend auf diesen Merkmalen lernt der Rechner dann die einzelne Elemente Gruppen zuzuordnen.
Die Klassifikation häufig bei der Spracherkennung (Alexa, Siri), der Spam-Filterung, bei der Suche nach ähnlichen Dokumenten, in der Erkennung von handschriftlichen Zeichen und Zahlen sowie der Betrugserkennung eingesetzt.
Eine beliebte Methode der klassischen Klassifizierung sind die Support Vector Machines (SVM). Hier wird versucht, zwei Gruppen möglichst deutlich voneinander zu trennen. Gehört ein Element weder zur einen noch zur anderen Gruppe, ist es auffällig. Damit lässt sich sehr gut verdächtiges Verhalten von Tradern an Aktienmärkten, also Insiderhandel, erkennen. Das Verfahren wird auch erfolgreich in der Medizin eingesetzt, etwa beim Erkennen von Anomalien in der Krebsdiagnostik.
Bei weniger komplexen Daten wie Text, Zahlen und Tabellen kann hier der klassische Ansatz gewählt werden. Die Modelle sind dann kleiner, lernen schneller und arbeiten klarer. Um Fotos, Videos oder andere große und komplizierte Datensätze zu berechnen, empfiehlt sich eher der Einsatz von neuronalen Netzen.
Künstliche Intelligenz: Regression
Die Regression ist eine Klassifizierung, bei der eine Zahl auf einer numerischen Achse vorhergesagt werden soll. Der Computer versucht dabei die durchschnittlichen Datenpunkte mittels einer Linie darzustellen.
Häufig eingesetzte Algorithmen sind lineare und polynome Regression. Wenn die Maschine eine gerade Linie durch die durchschnittlichen Datenpunkte zeichnen kann, spricht man von einer linearen Regression. Erscheint die Linie durch die Datenpunkte gekrümmt, spricht man von einer polynomen Regression. Diese Verfahren werden verwendet für die Prognose von Kursdaten, medizinische Diagnose und Nachfrage-bzw. Umsatzanalysen.
Künstliche Intelligenz: Clustering
Clustering ist eine Methode der Klassifizierung ohne vordefinierte Klassen. Sie unterteilt Objekte basierend auf ähnlichen Merkmalen, wobei der Algorithmus den besten Weg auswählt. Die Elemente, die ähnliche Merkmale haben, werden jeweils in einer Klasse zusammengefasst.
Das Clustering wird häufig verwendet für eine Marktsegmentierung, zum Beispiel nach Kundentypen, zur Bildkompression, der Analyse und Kennzeichnung neuer Daten oder der Erkennung von Verhalten abweichend der Norm.
Ein gutes Beispiel für das Clustering ist das Sortieren von Bildern nach Personen in Computer-Fotobibliotheken. Hier wird versucht, gemeinsame Gesichtsmerkmale zu finden.
Was ist klassischer algorithmischer Handel?
Der algorithmische Handel stützt sich auf Computerprogramme, die Algorithmen ausführen, um einige oder alle Elemente einer Handelsstrategie zu automatisieren. Algorithmen sind eine Abfolge von Schritten oder Regeln, mit denen ein vorher definiertes Ziel erreicht werden soll. Sie erleichtern die Optimierung während des gesamten Anlageprozesses. Die Regeln können zahlreiche Formen annehmen: von der Ideengenerierung über die Handelsausführung bis hin zum Risikomanagement.
Was ist der Unterschied zum maschinellen Lernen?
Beim maschinellen Lernen als Teilbereich der künstlichen Intelligenz handelt es sich um Algorithmen, die Regeln oder Muster aus Daten lernen. Die Aufgabe des Lernens ist die Minimierung von Vorhersagefehlern.
Algorithmen der künstlichen Intelligenz können Informationen aus Daten extrahieren, um wichtige Handelsentscheidungen zu unterstützen oder zu automatisieren. Zur Vorbereitung dieser Handelsentscheidungen gehören die Beobachtung des Marktes und die Analyse von Daten. Die Ziele sind:
- Erwartungen über den Kursverlauf des Marktes postulieren
- Kauf- oder Verkaufsaufträgen auszuführen um attraktive Renditen im Verhältnis zum Risiko zu erzielen
- Eine erfolgreiche Verwaltung des daraus resultierenden Portfolios
Das Ziel des aktiven Investitionsmanagements darin, Alpha zu generieren. Dies ist erreicht, wenn die Portfoliorenditen über der zur Bewertung verwendeten Benchmark liegen.
Um Alpha zu generieren sind bessere Informationen im Vergleich zu anderen anderen Marktteilnehmern erforderlich. Das kann der Zugang zu besseren Daten sein oder die Möglichkeit, diese Daten besser zu verarbeiten. Genau an diesem Punkt setzt die künstliche Intelligenz in Form von maschinellem Lernen an.
Mit künstlicher Intelligenz ist es möglich, unterschiedliche Datenquellen effizienter zu nutzen als der Mensch. Es werden damit genauere Prognosen erzielt, was wiederum die Qualität von Handelsentscheidungen verbessert.
Das Trading hat sich in den letzten Jahrzehnten dramatisch verändert: Vom Börsenparkett hin über den elektronischen Handel bis hin zur Anwendung künstlicher Intelligenz bei Handelsentscheidungen.
Dabei nimmt der algorithmische Handel und der Einsatz künstlicher Intelligenz eine immer größere Stellung ein.
Institutionelle Anleger suchen seit langem nach Alpha durch Informationsvorsprung und die Fähigkeit, neue, bisher noch nicht entdeckte Zusammenhänge aufzudecken. Dazu wurden in der Vergangenheit häufig Marktforschungsstudien (zum Beispiel Umfragen bei Käufern oder Wählern) genutzt.
Der Informationsvorteil von künstlicher Intelligenz besteht darin, große Datenmengen sammeln und in Echtzeit auswerten zu können. Künstliche Intelligenz profitiert davon, dass sich die Menge an digitalen Daten in den letzten Jahren exponentiell erhöht hat und sich die Rechengeschwindigkeit beim maschinellen Lernen dramatisch verbessert hat.
Hochwertige Datenquellen als Basis für Berechnungen künstlicher Intelligenz
Künstliche Intelligenz bzw. das maschinelle Lernen basiert auf großen und komplexen Datensätzen. Je mehr Daten in hoher Qualität und je mehr Datenquellen zur Verfügung stehen, desto besser können die Modelle Prognosen für das zukünftige Marktgeschehen erstellen. Um qualitativ hochwertige Daten von Daten minderer Qualität unterscheiden zu können, müssen die Daten bewertet werden. Des Weiteren müssen diese Daten schnell zur Verfügung stehen. Idealerweise werden solche Daten daher auf Cloud-basierten Systemen bereitgehalten.
Die Bedeutung von Backtests bei Handelsansätzen auf der Basis künstlicher Intelligenz
Um eine Anlageidee gut in eine algorithmische Strategie zu transformieren, ist es notwendig, fundierte Backtests auf der Basis eines wissenschaftlichen Ansatzes durchzuführen. Ziel dabei ist, die Idee aufgrund ihrer Leistung in Out-of-Sample Szenarien abzulehnen.
Die Kreuzvalidierung einer algorithmische Strategie mit synthetischen Daten ist eine Schlüsseltechnik für das Machine Learning, um zuverlässige Out-of-Sample-Ergebnisse zu erzeugen. Dazu sollte sie mit geeigneten Methoden zur Korrektur von Mehrfachtests kombiniert werden.
Nach Möglichkeit sollten Verzerrungen vorausschauend vermieden werden. Da Kursdaten einen Zeitreihencharakter besitzen ist es daher erforderlich, den Standardansatz anzupassen.
Wie wird künstliche Intelligenz für das Trading genutzt?
Künstliche Intelligenz bzw. Machine Learning generiert Signale aus Kursdaten, Fundamentaldaten und alternativen Daten. Es gibt verschiedene Formen der Anwendung:
- Mustererkennung in Datensätzen
- Erkennen von Merkmalen
- Gewinnen neuer Erkenntnisse
- Entwicklung von neuen Handelsideen
- Verbinden einzelner Signale zu neuen Strategien
- Erprobung und Bewertung von Strategien
- Verbesserung von Strategien mit Hilfe von Reinforcement Learning