Dabei kommen i.d.R. künstliche neuronale Netzwerke zum Einsatz, die eine Auswertung großer Mengen komplexer und ungenauer Eingangsdaten ermöglichen. Typische Anwendungsszenarien sind die Bild- und Spracherkennung, semantische Textanalyse, Voraussage von zeitlichen Entwicklungen, Bildung von Handlungsstrategien und vieles mehr. Besonders aufsehenerregende Meilensteine: DeepBlue schlägt den Schachweltmeister (bereits 1997), Watson gewinnt Jeopardy (2011) und AlphaGo dominiert das Go-Spiel (2016).
Wenn Sie sich für die Hintergründe interessieren: Eine kurze aber gut gemachte Einführung in neuronale Netzwerke und ihre gegenwärtigen Fähigkeiten finden Sie bei Heise (Netzgespinste).
Beispiellösung
In diesem Artikel zeige ich anhand eines einfachen Beispiels, wie Sie ein neuronales Netz erstellen und in SQL Server einsetzen können. Dazu benutze ich Daten aus dem frei verfügbaren Paket MASS (Modern Applied Statistics with S); es handelt sich um Gewebebiopsie-Daten, die aus der Untersuchung des Tumorgewebes von Brustkrebspatientinnen gewonnen wurden. Das fertiggestellte neuronale Netz soll in der Lage sein, anhand neuer Beobachtungen die Diagnose gutartig (engl.: benign) oder bösartig (engl.: malignant) zu stellen.
Als Entwicklungsumgebung kommt Microsoft R Client kombiniert mit RStudio zum Einsatz. Microsoft R Client enthält mit MicrosoftML die wesentliche Komponente für lernfähige Algorithmen. Das Gesamtsystem basiert damit auf dem Framework R, das sich für statistische Berechnungen allgemein durchgesetzt hat.
Als Datenbank-Server kommt aktuell ausschließlich der SQL Server 2017 (oder die vNext genannte Vorversion) in Frage, der erstmalig R-Skripte unterstützt.
Einen ausführlichen Artikel zum Thema habe ich in der dotnetpro 10/2017 veröffentlicht.