Robeco: Einsatz von maschinellem Lernen für Renditen von Schwellenländeraktien

Robeco: Einsatz von maschinellem Lernen für Renditen von Schwellenländeraktien
Rendite

Machine Learning-Algorithmen und -Modelle haben großes Potenzial bei Anlagen in Aktien aus Schwellenländern, sagt Quant Research-Experte Laurens Swinkels.

06.12.2023 | 08:49 Uhr

Machine Learning-Algorithmen erfreuen sich bei Wissenschaftlern und Praktikern zunehmender Beliebtheit, während sie herauszufinden versuchen, ob sie höhere Renditen ermöglichen. Das Quant-Team von Robeco hat vor diesem Hintergrund untersucht, was die Anwendung solcher Algorithmen für Aktienanlagen in Schwellenländern bedeuten würde.1 Die Ergebnisse waren ebenso nützlich wie die Modelle des Machine Learnings selbst.

Wir fanden heraus, dass sie sich durch die Erkennung von finanziell relevanten, nicht-linearen Beziehungen zwischen Unternehmensmerkmalen auszeichnen. Diese Leistung wäre für menschliche Research-Experten eine Herausforderung. Wir haben auch festgestellt, dass die Nutzung von „Ensembling“ oder der „Weisheit der Masse“ bei Machine Learning-Modellen die erwarteten Renditen nach Abzug der Handelskosten für Aktienanleger um bis zu 2%-Punkte pro Jahr erhöhen kann.

Die Ergebnisse stammen aus der Analyse von mehr als 15.000 Einzelaktien aus 32 Ländern im Zeitraum zwischen 1990 und 2021. Wir haben für die Studie 36 Standardmerkmale verwendet, die sowohl für entwickelte als auch für aufstrebende Länder gelten können. Verzichtet haben wir auf die Einführung neuer Merkmale, um den Mehrwert hervorzuheben, den Machine Learning-Techniken bringen können. Dadurch wurde sichergestellt, dass die erzielte zusätzliche Wertentwicklung nicht lediglich auf neue Daten zurückzuführen ist, sondern auf bekannte Faktoren wie Low-risk, Valuation, Momentum und Quality.

Anschließend wurden verschiedene Algorithmen zur Vorhersage der relativen Aktienrenditen im Vergleich zum Marktindex des jeweiligen Landes auf Grundlage dieser Faktoren eingesetzt. Bei der am wenigsten komplexen Methode wird davon ausgegangen, dass jedes der Unternehmensmerkmale eine lineare Beziehung zur Outperformance der Aktien aufweist.
Drei Machine Learning-Methoden wurden verwendet, um eine Verbesserung gegenüber einer einfachen linearen Regression zu erzielen.

  • Elastic Net. Diese Methode zielt darauf ab, die Anzahl der Merkmale (in unserem Fall 36) zu reduzieren, indem diejenigen mit der geringsten oder keiner Prognosefähigkeit ausgesondert werden. Sie minimiert auch das mögliche Rauschen in einer Probe, welches die Prognosefähigkeit beim Einsatz außerhalb der Probe beeinträchtigen könnte. Mit dieser Methode lassen sich keine datenbedingten nicht-linearen Beziehungen oder Interaktionseffekte feststellen.
  • Baumbasierte Verfahren. Random Forests und Gradient-boosted Regression Trees folgen der Idee, die zugrundeliegenden Daten sequentiell in Gruppen von Firmenmerkmalen zu unterteilen – und so einen Baum „wachsen“ zu lassen. Jedes Mal, wenn die Daten separiert werden, werden neue Zweige erstellt. Bei jeder neuen Verzweigung wird das Merkmal ausgewählt, das die größte Trennung in der Datenbank erzeugt. Dabei wächst der Baum so hoch, wie es der Researcher zulässt, in einem Blatt endend.
  • Neuronale Netze. Hierbei handelt es sich um flexible Modelle, die mehrere Ebenen miteinander verbinden. Sie bestehen aus einer Eingabeebene mit Firmenmerkmalen und mindestens einer versteckten Ebene aus Aktivierungsfunktionen. Eine Ausgabeebene aggregiert die Ergebnisse der verborgenen Ebenen zu einer Ertragsprognose. Verwendet ein Modell mehr als eine verborgene Ebene – unser Modell nutzt bis zu fünf – wird es manchmal als „Deep-Learning“-Modell bezeichnet.

Mit 1990 bis 2001 als Initialisierungszeitraum haben wir Daten aus der ersten Hälfte für das Training und aus der zweiten Hälfte für die Validierung verwendet. Wir trainierten die Modelle auf unserem gesamten Satz von Aktienrenditen der Schwellenländer. Auf die Entwicklung länderspezifischer Modelle verzichteten wir, da einiges darauf hindeutet, dass dies zu einer Überanpassung führen könnte, was die Prognosefähigkeit außerhalb der Stichprobe verringert.

Anschließend können wir jede der 36 Variablen nach ihrer Bedeutung aufreihen. Dabei evaluieren wir die negativen Auswirkungen auf die Prognoseleistung, wenn die Variable weggelassen wird und der Rest des Modells unverändert bleibt. Wir haben festgestellt, dass die Modelle ähnliche Entscheidungen hinsichtlich der einflussreichsten Merkmale treffen. Die drei wichtigsten sind der Kurs zum 52-Wochen-Hoch, die aktienspezifische Volatilität und die Umsatzhäufigkeit.

Momentum und Short-term Reversal sind ebenfalls unter den Top 15, ebenso wie das Kurs-Gewinn-Verhältnis und die Profitabilität. Dies sind wertvolle Informationen. Die Erkennung von Interaktionseffekten zwischen jeder der 36 Variablen wäre für einen menschlichen Forscher unglaublich zeitaufwendig und schwierig. Dagegen ist ein maschinelles Lernmodell imstande, diese Beziehungen schnell und systematisch zu finden.

Mehr lesen


Die Informationen auf der nachfolgenden Website der Robeco Deutschland, Zweigniederlassung der Robeco Institutional Asset Management B.V., richten sich ausschließlich an professionelle Kunden im Sinne von § 31a Abs. 2 Wertpapierhandelsgesetz (WpHG) wie beispielsweise Versicherungen, Banken und Sparkassen. Die auf dieser Website dargestellten Informationen sind NICHT für Privatanleger bestimmt und entsprechen nicht den für Privatanleger maßgeblichen gesetzlichen Bestimmungen.

Diesen Beitrag teilen: