Zum Inhalt springen
K
EU AI Act: Nicht Hochrisiko Q3

Trainingseffektivitäts-Agent

Schulungswirksamkeit messen - vom Feedback bis zum Geschäftsergebnis.

Misst die Wirksamkeit von Schulungen auf mehreren Ebenen: Zufriedenheit, Wissenstransfer, Verhaltensänderung und Geschäftsauswirkung.

Prozess analysieren lassen
Airbus Volkswagen Shell Renault Evonik Vattenfall Philips KPMG

Evaluierungsstufe per Regeln, Feedback-Erkennung per KI, Wirksamkeits-Auswertung

Der Agent legt Evaluierungsstufe regelbasiert nach Schulungstyp fest (Kirkpatrick 1 bis 4), extrahiert Feedback- und Wissenstransfer-Daten per KI aus Umfragen und Assessments und korreliert Verhaltensänderung mit Performance-Daten - strategische Learning-Entscheidungen bleiben Human-in-the-Loop.

Ergebnis: Laut ATD werden in 75 Prozent der Unternehmen Schulungen nur auf Stufe 1 (Zufriedenheit) evaluiert, obwohl 10 bis 20 Prozent des Trainingsbudgets regelmäßig in nachweislich wirkungslose Formate fließen.

20% Regelwerk
60% KI-Agent
20% Mensch

Die Architektur macht aus Schulungs-Budget ein auditierbares Investment mit messbarem Lernertrag:

800 Euro pro Kopf, 20 Prozent erreichen den Arbeitsplatz

Laut IW-Weiterbildungserhebung 2023 investierten deutsche Unternehmen durchschnittlich 1.347 Euro pro Mitarbeiter und Jahr in Weiterbildung (46 Milliarden Euro gesamtwirtschaftlich). Gleichzeitig erreichen nur 10 bis 20 Prozent des Gelernten tatsächlich den Arbeitsplatz. Zwischen diesen beiden Zahlen liegt kein Qualitätsproblem. Es liegt ein Messproblem. Wer nicht weiß, was nach der Schulung passiert, kann nicht steuern, ob die Investition wirkt.

Die Evaluierungslücke ist gut dokumentiert: 95 Prozent aller L&D-Organisationen können ihre Lerndaten nicht mit Geschäftsergebnissen verknüpfen. ROI-Messungen finden bei nur 5 bis 8 Prozent aller Schulungsprogramme statt. Dazwischen liegen die Ebenen, auf die es ankommt - Wissenstransfer, Verhaltensänderung, Geschäftswirkung - und genau dort misst fast niemand.

Warum Zufriedenheit nichts über Wirksamkeit sagt

Nach jeder Schulung füllen Teilnehmende einen Feedback-Bogen aus. War der Referent gut? War das Catering in Ordnung? Würden Sie die Schulung weiterempfehlen? Diese sogenannten Smiley-Sheets sind nahezu universell verbreitet und nahezu universell wertlos für die Frage, die L&D eigentlich beantworten muss: Hat diese Schulung das Verhalten am Arbeitsplatz verändert?

Das Kirkpatrick-Modell beschreibt seit 1959 vier Evaluierungsebenen: Zufriedenheit, Wissen, Verhalten, Geschäftsergebnis. Die Ebenen sind keine Theorie. Sie sind der Industriestandard. Und trotzdem bleiben drei der vier Ebenen in den meisten Organisationen unbesetzt.

Ebene         Was gemessen wird              Wer es typischerweise misst
────────────  ─────────────────────────────  ────────────────────────────
Zufriedenheit Feedback-Bögen nach Schulung   Fast alle Organisationen
Wissen        Tests, Praxisaufgaben          Wenige, meist bei Compliance
Verhalten     Verhaltensänderung am Platz    Kaum jemand systematisch
Ergebnis      Korrelation mit Business-KPIs  5-8 Prozent aller Programme

Der Grund ist nicht Desinteresse. Der Grund ist strukturell. Jede Ebene erfordert eine andere Methode, einen anderen Zeitpunkt und einen anderen Verantwortlichen. Zufriedenheit lässt sich am Tag der Schulung erheben. Wissenstransfer braucht einen definierten Abstand - zwei bis vier Wochen - und ein Testformat. Verhaltensänderung zeigt sich erst nach 60 bis 90 Tagen und braucht die Beobachtung der Führungskraft. Geschäftswirkung erfordert die Verknüpfung von Schulungsdaten mit Performance-Kennzahlen, die in einem völlig anderen System liegen.

Kein L&D-Team mit drei Personalentwicklern für 1.500 Mitarbeitende kann das manuell leisten. Also bleibt es beim Smiley-Sheet.

Das Transferproblem ist ein Timing-Problem

Hermann Ebbinghaus hat in den 1880er Jahren dokumentiert, was jede Personalentwicklung instinktiv weiß: Innerhalb von 24 Stunden vergessen Menschen durchschnittlich 70 Prozent neuer Informationen. Nach einer Woche sind es 90 Prozent. Die Vergessenskurve ist keine Schwäche einzelner Teilnehmender. Sie ist eine neurologische Konstante.

Die Konsequenz für Schulungswirksamkeit ist radikal. Wenn die erste Wissensüberprüfung drei Monate nach der Schulung stattfindet - weil vorher niemand daran denkt oder die Kapazität fehlt - misst sie nicht Wissenstransfer. Sie misst die Vergessenskurve. Und wenn die Verhaltensbeobachtung nie stattfindet, weil die Führungskraft kein strukturiertes Feedback-Format hat, bleibt die entscheidende Frage offen: Hat der Mitarbeitende das Gelernte in den Arbeitsalltag übernommen oder nicht?

Das Transferproblem ist kein pädagogisches Problem. Es ist ein Architekturproblem. Wer nach welcher Methode zu welchem Zeitpunkt misst - diese Zuständigkeiten sind in den meisten Organisationen nicht definiert. Deshalb passiert es nicht.

Gestaffelte Messung als Architektur

Der Decision Layer löst das nicht durch ein besseres Tool, sondern durch eine andere Entscheidungsarchitektur. Jede Evaluierungsebene wird als eigenständiger Prozessschritt behandelt - mit definiertem Zeitpunkt, definierter Methode und definiertem Verantwortlichen.

Tag 0              Woche 2-4          Monat 2-3          Quartal+
Schulung endet     Wissenscheck       Verhaltens-FB      Korrelation
                                                         mit KPIs
┌──────────┐     ┌──────────┐      ┌──────────┐      ┌──────────┐
│ Feedback │     │ Test oder│      │ Führungs-│      │ Teilnahme│
│ automa-  │────▶│ Praxis-  │─────▶│ kraft    │─────▶│ vs. Per- │
│ tisiert  │     │ aufgabe  │      │ bewertet │      │ formance │
│ erfassen │     │ auswerten│      │ Verhalten│      │ abgleich │
└──────────┘     └──────────┘      └──────────┘      └──────────┘
     A                A                  H                 A

A = Agent/Automatisierung     H = Mensch entscheidet

Die Zufriedenheitserfassung am Tag der Schulung läuft vollautomatisch. Der Agent aggregiert Feedback-Bögen, identifiziert Ausreißer und erzeugt einen Bericht. Kein Mensch muss Freitext-Antworten lesen, um zu erkennen, dass ein Referent systematisch schlecht bewertet wird.

Der Wissenscheck nach zwei bis vier Wochen folgt einem Regelwerk: Schulungstyp bestimmt Prüfformat. Ein Compliance-Training hat einen Multiple-Choice-Test. Eine Führungskräfteentwicklung hat eine Reflexionsaufgabe. Ein technisches Training hat eine Praxisübung. Der Agent triggert den richtigen Check zum richtigen Zeitpunkt und wertet die Ergebnisse aus.

Die Verhaltensbeobachtung nach 60 bis 90 Tagen bleibt beim Menschen. Hier kommt die Führungskraft ins Spiel - nicht mit einem aufwendigen Assessment, sondern mit drei bis fünf gezielten Fragen: Wendet der Mitarbeitende die neuen Methoden an? In welchen Situationen? Was hat sich verändert? Der Agent stellt die Fragen zur richtigen Zeit, sammelt die Antworten ein und ordnet sie dem Schulungsprogramm zu.

Die ROI-Berechnung auf Programmebene ist Korrelationsanalyse, keine Kausalitätsbehauptung. Der Agent verknüpft Schulungsteilnahme mit Performance-Kennzahlen - Fehlerquoten, Kundenzufriedenheit, Produktivitätsentwicklung - und zeigt Zusammenhänge. Ob ein Zusammenhang kausal ist, interpretiert ein Mensch mit Kontextwissen. Denn wenn die Fehlerquote im Lager nach einem Sicherheitstraining sinkt, kann das am Training liegen - oder daran, dass gleichzeitig ein neues Regalsystem eingeführt wurde.

Was das für Budget-Gespräche verändert

Wenn eine L&D-Leitung vor der Geschäftsführung steht und das Budget für nächstes Jahr verteidigen muss, entscheidet die Datengrundlage über die Verhandlungsposition. Mit Smiley-Sheets sieht das Gespräch so aus: Die Teilnehmenden waren zufrieden. Wir glauben, dass die Schulungen sinnvoll waren. Bitte kürzen Sie uns nicht.

Mit gestaffelter Evaluierung sieht es anders aus: Das Führungskräfte-Programm zeigt nach 90 Tagen messbare Verhaltensänderung bei 72 Prozent der Teilnehmenden. Die Korrelation zwischen Teilnahme und Kundenzufriedenheit im Vertrieb liegt bei 0,4. Das Compliance-Training hat eine Wissensretention von 85 Prozent nach vier Wochen. Die Grundlagenschulung SAP zeigt keinen messbaren Effekt auf die Bearbeitungszeiten - hier brauchen wir ein anderes Format.

Das ist keine Budgetverteidigung mehr. Das ist eine Investitionsentscheidung auf Basis von Evidenz.

Der Unterschied liegt nicht in der Genauigkeit der Zahlen. Er liegt in der Fähigkeit, zwischen Schulungen zu unterscheiden, die wirken, und Schulungen, die beschäftigen. Organisationen, die diesen Reifegrad erreichen, verschieben ihr Budget nicht nach Gießkanne, sondern nach Wirksamkeit. Und sie können gegenüber dem Betriebsrat transparent machen, wie Evaluierungsdaten verwendet werden - aggregiert, auf Programmebene, ohne Rückschlüsse auf einzelne Teilnehmende.

Micro-Decision-Tabelle

Wer entscheidet bei diesem Agent?

5 Entscheidungsschritte, aufgeteilt nach Decider

20%(1/5)
Regelwerk
deterministisch
60%(3/5)
KI-Agent
modellbasiert mit Confidence
20%(1/5)
Mensch
explizit zugewiesen
Mensch
Regelwerk
KI-Agent
Jede Zeile ist eine Entscheidung. Aufklappen zeigt die Entscheidungsakte und ob man anfechten kann.
Evaluierungsstufe festlegen Auf welchen Ebenen wird die Schulung evaluiert? Regelwerk

Regelwerk nach Schulungstyp, Budget und strategischer Bedeutung

Entscheidungsakte

Regel-ID und Versionsnummer
Eingabedaten die zur Anwendung führten
Berechnungsergebnis und angewandte Formel

Anfechtbar: Ja - Regelanwendung prüfbar. Einspruch bei fehlerhafter Datenbasis oder falscher Regelversion.

Zufriedenheit messen Wie zufrieden waren die Teilnehmer? KI-Agent

Automatische Auswertung der Feedback-Bögen

Entscheidungsakte

Modell-Version und Confidence Score
Eingabedaten und Klassifikationsergebnis
Entscheidungsgrund (Erklärbarkeit)
Audit Trail mit vollständiger Nachvollziehbarkeit

Anfechtbar: Ja - vollständig dokumentiert, durch Menschen überprüfbar, Einspruch über formalen Prozess.

Wissenstransfer prüfen Wurde das Gelernte verstanden? KI-Agent

Auswertung von Tests oder Praxisaufgaben nach definiertem Intervall

Entscheidungsakte

Modell-Version und Confidence Score
Eingabedaten und Klassifikationsergebnis
Entscheidungsgrund (Erklärbarkeit)
Audit Trail mit vollständiger Nachvollziehbarkeit

Anfechtbar: Ja - vollständig dokumentiert, durch Menschen überprüfbar, Einspruch über formalen Prozess.

Verhaltensänderung erfassen Hat sich das Arbeitsverhalten verändert? Mensch

Führungskraft-Feedback nach 60-90 Tagen

Entscheidungsakte

Entscheider-ID und Rolle
Begründung der Entscheidung
Zeitstempel und Kontext

Anfechtbar: Ja - über Vorgesetzten, Betriebsrat oder formalen Einspruch.

ROI berechnen Welchen messbaren Impact hat die Schulung? KI-Agent

Korrelationsanalyse: Teilnahme vs. Performance-Kennzahlen

Entscheidungsakte

Modell-Version und Confidence Score
Eingabedaten und Klassifikationsergebnis
Entscheidungsgrund (Erklärbarkeit)
Audit Trail mit vollständiger Nachvollziehbarkeit

Anfechtbar: Ja - vollständig dokumentiert, durch Menschen überprüfbar, Einspruch über formalen Prozess.

Entscheidungsakte und Anfechtbarkeit

Jede Entscheidung, die dieser Agent trifft oder vorbereitet, wird in einer vollständigen Entscheidungsakte dokumentiert. Betroffene Mitarbeitende können jede einzelne Entscheidung einsehen, nachvollziehen und anfechten.

Welche Regel in welcher Version wurde angewandt?
Welche Daten lagen der Entscheidung zugrunde?
Wer (Mensch, Regelwerk oder KI) hat entschieden - und warum?
Wie kann die betroffene Person Einspruch einlegen?
So setzt der Decision Layer das architektonisch um →

Passt dieser Agent zu Ihrem Prozess?

Wir analysieren Ihren konkreten HR-Prozess und zeigen, wie dieser Agent in Ihre Systemlandschaft passt. 30 Minuten, keine Vorbereitung nötig.

Prozess analysieren lassen

Governance-Hinweise

EU AI Act: Nicht Hochrisiko
Kein Hochrisiko-System nach EU AI Act - Messung und Analyse ohne Entscheidung über Arbeitsverhältnisse. DSGVO: Evaluierungsdaten werden aggregiert ausgewertet. Individuelle Testergebnisse werden nicht an Dritte weitergegeben. Betriebsrat: Informationsrecht über das Evaluierungskonzept. Empfehlung: Transparenz gegenüber Teilnehmenden über Evaluierungszweck und Datenverwendung.

Bewertung

Agent Readiness 54-61%
Governance-Komplexität 31-38%
Economic Impact 44-51%
Leuchtturm-Wirkung 48-55%
Implementation Complexity 38-45%
Transaktionsvolumen Quartalsweise

Voraussetzungen

  • Learning Management System mit Evaluierungsfunktion
  • Definierte Evaluierungsstandards nach Schulungstyp
  • Performance-Daten für ROI-Berechnung
  • Führungskraft-Feedback-Prozess

Infrastruktur-Beitrag

Die ROI-Berechnungs-Engine wird vom Strategic-HR-Analytics-Agent wiederverwendet. Die mehrstufige Evaluierungslogik (zeitgestaffelte Messung auf verschiedenen Ebenen) bildet die Grundlage für alle Agenten, die Wirksamkeit von HR-Maßnahmen messen. Baut Decision Logging und Audit Trail auf, die im Decision Layer für Nachvollziehbarkeit und Anfechtbarkeit jeder Entscheidung benötigt werden.

Was diese Erstbewertung enthält: 9 Slides für Ihr Führungsteam

Personalisiert mit Ihren Zahlen. Generiert in 2 Minuten direkt im Browser. Kein Upload, kein Login.

  1. 1

    Titelfolie - Prozessname, Entscheidungspunkte, Automatisierungspotenzial

  2. 2

    Executive Summary - FTE-Freisetzung, Kosten pro Vorgang vorher/nachher, Break-Even-Datum, Kosten des Wartens

  3. 3

    Ausgangslage - Transaktionsvolumen, Fehlerkosten, Wachstumsszenario mit FTE-Vergleich

  4. 4

    Lösungsarchitektur - Mensch - Regelwerk - KI-Agent mit konkreten Entscheidungspunkten

  5. 5

    Governance - EU AI Act, Betriebsrat (§87 BetrVG), Audit Trail - mit Ampelstatus

  6. 6

    Risikoanalyse - 5 Risiken mit Eintrittswahrscheinlichkeit, Auswirkung und Gegenmaßnahme

  7. 7

    Roadmap - 3-Phasen-Plan mit konkreten Kalenderdaten und Go/No-Go

  8. 8

    Business Case - 3-Szenarien-Vergleich (Nichtstun/Neueinstellung/Automatisierung) plus 3×3-Sensitivitätsmatrix

  9. 9

    Diskussionsvorschlag - Konkrete nächste Schritte mit Zeitplan und Verantwortlichkeiten

Enthält: 3-Szenarien-Vergleich

Nichtstun vs. Neueinstellung vs. Automatisierung - mit Ihrem Gehaltsniveau, Ihrer Fehlerquote und Ihrem Wachstumsplan. Die eine Slide, die Ihr CFO als erstes sehen will.

Berechnungsmethodik anzeigen

Stundensatz: Jahresgehalt (Ihre Eingabe) × 1,3 AG-Anteil ÷ 1.720 Jahresarbeitsstunden

Einsparung: Vorgänge × 12 × Automatisierungsrate × Minuten/Vorgang × Stundensatz × Economic Factor

Qualitäts-ROI: Fehlerreduktion × Vorgänge × 12 × EUR 260/Fehler (APQC Open Standards Benchmarking)

FTE: Eingesparte Stunden ÷ 1.720 Jahresarbeitsstunden

Break-Even: Benchmark-Investition ÷ monatliche Gesamteinsparung (Effizienz + Qualität)

Neueinstellung: Jahresgehalt × 1,3 + EUR 12.000 Recruiting pro FTE

Alle Daten bleiben in Ihrem Browser. Nichts wird an Server übertragen.

Trainingseffektivitäts-Agent

Erstbewertung für Ihr Führungsteam

In 2 Minuten eine fundierte Erstbewertung - mit Ihren Zahlen, Ihrem Risikoprofil und Branchenbenchmarks. Kein Anbieter-Logo, kein Vendor-Pitch.

30K120K
1%15%

Alle Daten bleiben in Ihrem Browser. Nichts wird übertragen.

Häufige Fragen

Werden individuelle Testergebnisse an die Führungskraft weitergegeben?

Nein. Testergebnisse werden aggregiert ausgewertet. Die Führungskraft erhält nur die Bitte um Verhaltens-Feedback nach 60-90 Tagen. Individuelle Leistungsdaten aus Schulungen fließen nicht in Performance-Reviews ein.

Wie wird der ROI einer Schulung berechnet?

Der Agent korreliert Schulungsteilnahme mit Performance-Kennzahlen (z.B. Fehlerquoten, Kundenzufriedenheit, Produktivität). Korrelation ist nicht Kausalität - der Agent zeigt Zusammenhänge und Plausibilitäten, keine gesicherten Ursache-Wirkungs-Ketten.

Was passiert als Nächstes?

1

30 Minuten

Erstgespräch

Wir analysieren Ihren Prozess und identifizieren den optimalen Startpunkt.

2

1 Woche

Discover

Mapping Ihrer Entscheidungslogik. Regelwerke dokumentiert, Decision Layer designt.

3

3-4 Wochen

Build

Produktiver Agent in Ihrer Infrastruktur. Governance, Audit Trail, prüfungsfähig ab Tag 1.

4

12-18 Monate

Eigenständig

Voller Zugang zu Quellcode, Prompts und Regelversionen. Kein Vendor Lock-in.

Diesen Agent implementieren?

Wir bewerten Ihre Prozesslandschaft und zeigen, wie dieser Agent in Ihre Infrastruktur passt.