Training & Inferenz

Bevor eine Pipeline Vorhersagen liefern kann, muss sie zunächst auf historischen Prozessdaten trainiert werden – das Modell lernt dabei den Zusammenhang zwischen Inputs und Zielwerten. Anschließend läuft die Pipeline im Live-Betrieb und wendet das trainierte Modell auf neue einlaufende Daten an (Inferenz).

Je nach Ziel stehen drei Betriebsmodi zur Verfügung, über die dieser Prozess gesteuert wird.

Betriebsmodi einer Pipeline

Der gewünschte Betriebsmodus wird in der Pipeline-Übersicht gestartet.

Simulation starten: In einer Simulation werden historische Daten verwendet, um die Performance der Vorhersage zu simulieren. Die Anzahl der Zeilen auf denen simuliert kann unter „Trigger" → „Details anzeigen" eingestellt werden. Die Outputs werden dabei nicht befüllt – die Simulationsergebnisse werden stattdessen unten im rechten Bildschirmbereich angezeigt.
Pipeline starten: Die Pipeline startet mit historischen Daten das Training und wechselt dann in den Live Modus.
Mit historischen Daten starten: Die Pipeline startet mit historischen Daten und generiert für diese Outputs.

Hinweis: Die Optionen „Mit historischen Daten starten" und „Simulation starten" greifen beide auf den selben Datenblock zu (einzustellen unter „Trigger" → „Details anzeigen"). Die Simulation läuft schneller durch, als die Option "Mit historischen Daten starten".

Anwendungsfälle der Betriebsmodi

Betriebsmodi	„Simulation starten"	„Pipeline starten"	„Mit historischen Daten starten"
Fragestellung	Kann mein Prozess modelliert werden?	Ich möchte meinen Prozess in Echtzeit modellieren.	Wie funktioniert der Datenfluss?
Datensatz	Maximale Zeilen für Simulation	Maximale Zeilen für Initialisierung + Echtzeit Daten	Maximale Zeilen für Simulation

Trainingseinstellungen

Das Modell kann sich nach einer definierten Anzahl an Zeilen neu trainieren (anpassen) oder eine neue Architektursuche vornehmen (größere Anpassung). Dies kann über folgende Werte eingestellt werden:

Intervall Training: Anzahl der Zeilen, nach denen ein Neutraining durchgeführt wird.
Intervall Architektursuche: Anzahl der Zeilen, nach denen eine Architekturanpassung durchgeführt wird.
Datensatzgröße: Anzahl der Zeilen, auf die das Modell sich trainieren darf.

Cookie	Dauer	Beschreibung
_lfa	2 years	This cookie is set by the provider Leadfeeder to identify the IP address of devices visiting the website, in order to retarget multiple users routing from the same IP address.
cookielawinfo-checkbox-analytics	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Analytics" category .
cookielawinfo-checkbox-necessary	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Necessary" category .
CookieLawInfoConsent	1 year	Records the default button state of the corresponding category & the status of CCPA. It works only in coordination with the primary cookie.

Cookie	Dauer	Beschreibung
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_ga_2CV75J9632	2 years	This cookie is installed by Google Analytics.
_gat_gtag_UA_129368161_1	1 minute	Set by Google to distinguish users.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.