A/B-Testing in Wett-Apps: Was man testen sollte
Zwei Teams, zwei fast gleiche Wett-Apps. Beide schieben “Heute beliebt” nach oben. In App A steigt Add‑to‑Slip um 9 %. In App B fällt Live‑Wetten um 6 %. Warum? App A zeigt Top‑Spiele vor Anpfiff. App B drückt Live‑Events nach unten. Der Kontext kippt das Ergebnis. Das ist die Kernidee: Nicht “eine beste Lösung”, sondern “beste Lösung für diesen Moment, für diese Nutzergruppe”. Diese Seite zeigt, was in Wett‑Apps wirklich Sinn macht zu testen. Sie setzt auf klare Schritte, echte Risiken, faire Metriken, einfache Sprache. Sie ist für Produkt, Data, CRM und UX gedacht. Ziel: schneller lernen, sauber messen, verantwortungsvoll wachsen.
Exkurs: Vor jedem Test – Verantwortung, Einwilligung, Fairness
Ohne Einwilligung kein sauberes Tracking. Ohne sauberes Tracking kein Test. Prüfen Sie, ob Ihre Einwilligung zur Messung klar, frei und granular ist. Gute Leitlinien bietet der EU‑Beirat für Datenschutz. Siehe EDPB‑Leitlinien zur Einwilligung. Halten Sie Logik in der App einfach: Opt‑in ist aktiv, Opt‑out ist leicht. Erklären Sie, warum Sie messen und wie lange Sie Daten speichern.
Responsible Gambling steht über Wachstum. Bieten Sie Limits, Reality Checks, Hilfe. Starten Sie keine Tests, die Nutzer zu riskanten Einsätzen drängen. Keine dunklen Muster. Nennen Sie Kosten, Latenz, Regeln offen. Dokumentieren Sie Risiken pro Test. Wenn Zweifel da sind: nicht ausrollen. Spielen Sie verantwortungsvoll. Hilfe in DE: BZgA – Check dein Spiel.
Werkbank: Setup, das Tests aushält
Ohne sauberes Setup frisst ein Test Zeit und bringt doch Lärm. Bauen Sie Feature‑Flags und Remote Config. Schalten Sie Varianten ohne Release. Loggen Sie Server‑Events, nicht nur Client‑Events. Prüfen Sie Events auf Reihenfolge, Duplikate, Timeouts. Für mobile Rollouts hilft Firebase. Siehe Firebase A/B Testing Docs.
Planen Sie Power vor dem Start. Wie klein darf der Effekt sein, den Sie sehen wollen (MDE)? Wie groß muss die Stichprobe sein? Nutzen Sie verlässliche Rechner, zum Beispiel den Sample‑Size‑Rechner von Evan Miller. Setzen Sie SRM‑Alarme (Sample Ratio Mismatch). Eine simple tägliche Prüfung spart Wochen.
Definieren Sie Primär‑Metrik und Wächter‑Metriken. Denken Sie in Ereignissen, nicht nur in Sessions. Prüfen Sie Kohorten: neu vs. Bestand, Pre‑Match vs. Live, High‑Risk vs. Low‑Risk. Für das Verständnis von Produkt‑Metriken lohnt ein Blick auf Amplitude zu Experimentmetriken.
Testen entlang des Funnels
Ordnen Sie Ideen an drei Stellen: vor dem Wettschein, im Wettschein, nach der Platzierung (plus Re‑Engagement). So stoßen Sie nicht überall zugleich an. Und Sie messen näher am Ziel.
| Pre‑Slip | Schneller zu “Heute live” vs. Add‑to‑Slip | Oben platzierte “Heute live” Liste erhöht Add‑to‑Slip | A: Standard-Liga zuerst; B: “Heute live” oben | Add‑to‑Slip; Time‑to‑Slip; Bounce‑Rate | Neu, Fußball; Pre‑Match vs. Live | Übergewicht Live; Stress durch FOMO | +3–5 % Add‑to‑Slip | n≈50k Nutzer, Power 0,8, MDE 3 % |
| Im Wettschein | Klarheit vs. Platzierungsrate | Transparente Gebühren/Latenz senken Abbruch | A: nur Icon; B: Hinweisblock über Button | Platzierungsrate; Abbruch im Schein; Zeit im Schein | Live‑Wetter; High‑Value | Mehr Friktion; wahrgenommene Langsamkeit | +2–4 % Platzierungsrate | n≈35k Scheine, Power 0,8, MDE 2,5 % |
| Post‑Bet | Schutz vs. ARPU‑Wächter | Sanfter Nudge erhöht Limit‑Setzung | A: kein Nudge; B: Nudge nach X Wetten | Limit‑Adoption; ARPU als Wächter; Churn | Hohe Einsätze; Nacht‑Zeiten | Über-Friktion; Abwanderung | +10–15 % Limit‑Adoption | n≈10k Nutzer, Power 0,8, MDE 8 % |
| Re‑Engagement | Wertvolle Rückkehr vs. Spam | Weniger, klarere Pushes erhöhen Long‑Term‑Open | A: 5 Push/Woche; B: 2 Push mit Nutzen | Open‑Rate D+7; Session‑Qualität; Opt‑out‑Rate | Bestand; Sport‑Favoriten | Push‑Müdigkeit; stille Opt‑outs | +5–8 % Open D+7 | n≈60k Geräte, Power 0,8, MDE 3–4 % |
Sechs Testfelder mit echtem Hebel
1) Onboarding & KYC: Reibung senken, Klarheit erhöhen
Viele brechen in den ersten drei Screens ab. Machen Sie die ersten Schritte kurz. Zeigen Sie früh, was kommt: Registrierung, Alter, KYC, Einzahlwege. Testen Sie Social‑Login vs. E‑Mail, aber bleiben Sie KYC‑konform. Testen Sie “Dokumente jetzt” vs. “Dokumente später” mit klarer Frist. Messen Sie: Abschluss Onboarding, Time‑to‑KYC, Aktivierung D+1. Wächter: Support‑Tickets, Fehlversuche Upload. Risiko: Nutzer vertagen KYC zu lange. Lösung: sanfte Reminder, feste Fristen, keine harten Walls ohne Vorwarnung.
2) Einzahlung & Limits: Vertrauen trotz SCA
Einzahler brauchen Tempo und Sicherheit. In der EU gilt starke Kundenauthentifizierung (SCA). Erklären Sie den Schritt. Vermeiden Sie Brüche. Testen Sie Reihenfolge: Betrag → Methode → SCA vs. Methode → Betrag → SCA. Testen Sie Logos, Bank‑Namen, Hilfetexte. Bauen Sie Limits gut sichtbar ein. Verlinken Sie Regeln und Gebühren. Lesen Sie zur Pflicht die PSD2/Strong Customer Authentication. Messen: Deposit‑Success, Zeit bis Erfolg, Abbrüche pro Schritt. Wächter: Chargebacks, Fehlversuche, Ticket‑Volumen. Risiko: zu viel Friktion; zu wenig Aufklärung. Kleine Micro‑Kopien helfen mehr als bunte Banner.
3) Quoten & Navigation: Finden schlägt Suchen
Viele wollen nur schnell den nächsten Tipp. Klare Wege gewinnen. Testen Sie Start‑Tabs: “Heute”, “Live”, “Favoriten”. Prüfen Sie Darstellung: Dezimal vs. Bruch. Testen Sie Bet Builder: oben vs. im Spiel. Achten Sie auf saubere Informationsarchitektur. Gute Muster für Mobile sind hier erklärt: NN/g zu Mobile‑Navigation. Messen: Time‑to‑Slip, Add‑to‑Slip, Nutzung Suche. Wächter: Fehl‑Taps, Scroll‑Tiefe. Risiko: Überfrachtete Homes; verwirrte Neulinge. Nutzen Sie Tooltips sparsam, aber präzise.
4) Live‑Wetten: Klarheit bei Tempo
Live ist schnell. Fehler kosten Vertrauen. Testen Sie Auto‑Update an/aus, Update‑Takt, klare Latenz‑Hinweise im Schein. Testen Sie Priorisierung: oben nur Spiele mit hohem Interesse. Testen Sie Cash‑Out Platzierung: sichtbar, aber nicht drängend. Messen: Platzierungsrate live, Abbruch bei Quote‑Change, Cash‑Out Nutzung. Wächter: Falsch‑Taps, Support‑Tickets “Wette hängt”. Risiko: UI springt; Nutzer klicken daneben. Bauen Sie stabile Touch‑Zonen. Kommunizieren Sie jede Änderung offen.
5) Responsible Gambling UX: Schutz zuerst
Limits schützen. Reality Checks helfen. Platzieren Sie sie nicht als Pflicht‑Hürde, sondern als normale Wahl. Testen Sie Zeitpunkt: beim ersten Deposit vs. nach dritten Schein. Testen Sie Form: Schieberegler vs. feste Stufen. Testen Sie Text: einfach, klar, ohne Druck. Gute Leitlinien finden Sie bei der UK‑Behörde: Responsible‑Gambling‑Hinweise der UKGC. Messen: Limit‑Adoption, Senkung hoher Einsätze, Support‑Last. Wächter: Churn, negatives Feedback. Ziel ist Schutz, nicht Verstecken.
6) Retention & Re‑Engagement: Weniger, dafür nützlich
Push kann nerven. Oder helfen. Testen Sie weniger Pushs mit klarem Nutzen: Startzeit, Ergebnis, Cash‑Out Hinweis, Boost mit Regeln. Zeigen Sie Gründe im Text. Testen Sie Quiet Hours. Testen Sie In‑App Inbox als ruhige Alternative. Messen: Open D+7, Klicks, Session‑Qualität. Wächter: Opt‑out, Deinstall. Risiko: Spam. Da hilft Segment: nur Fans eines Teams, nur bei gesetzter Quote, nie nachts. Vertrauen wächst leise, nicht laut.
Statistik, aber praktisch
Planen Sie vor dem Start. Definieren Sie MDE (Minimal Detectable Effect), Power, Signifikanz. Bleiben Sie bei einem Testplan. Kein “Peeking” im Stundentakt. Sonst steigt das Fehlalarm‑Risiko. Gute Quellen zu typischen Fehlern im Experiment finden Sie bei Ronny Kohavi: Kohavi über Experimentfehler.
Nutzen Sie Varianzreduktion, wenn möglich. CUPED oder Stratifizierung kann Dauer senken. Lesen Sie mehr dazu bei Microsoft Research: Microsoft Experimentation Research. Prüfen Sie SRM täglich. Wenn das Verhältnis A/B stark abweicht, stoppen Sie. Überwachen Sie Bots, App‑Crashes, Zahlungs‑Störungen. Dokumentieren Sie Annahmen, Filter, Metriken. Später danken Sie sich.
App‑Store‑Experimente vs. In‑App‑Tests
Beides ist nützlich, doch Ziele sind anders. Im Store messen Sie Klick auf Install, Conversion im Listing, Bilder, Texte. Dafür hat Google Play eigene Tests: Store‑Listing‑Experimente bei Google Play. Bei Apple gibt es das auch: Apple Product Page Optimization. In der App messen Sie Verhalten nach dem Install: Add‑to‑Slip, Deposit, Limits, Retention. Mischen Sie Signale nicht. Ein Icon‑Test im Store sagt nichts über Cash‑Out in‑App. Koppeln Sie aber Learnings: Sprache, Bilder, Versprechen.
Feldnotizen: Drei Mikro‑Szenarien
Szenario 1 – Schneller Schein, weniger Sprünge: Hypothese: Fixe Quote‑Karten mit größerem Touch‑Ziel senken Fehl‑Taps. Test: Standard vs. große Karten. Metrik: Add‑to‑Slip, Fehl‑Tap‑Rate. Ergebnis: +3,2 % Add‑to‑Slip, −18 % Fehl‑Taps. Lernpunkt: Weniger Elemente, klarer Rand, ruhiges Live‑Update.
Szenario 2 – SCA erklärt, Angst sinkt: Hypothese: Kurzer Text vor SCA senkt Abbruch. Test: ohne Text vs. 2‑Zeilen‑Erklärung. Metrik: Deposit‑Success, Zeit. Ergebnis: +4,5 % Success, +3 s Dauer. Lernpunkt: Kleine Reibung lohnt, wenn Vertrauen steigt.
Szenario 3 – Limit‑Nudge mit Timing: Hypothese: Nudge nach dritter Wette wirkt besser als beim ersten Login. Test: sofort vs. nach dritter Wette. Metrik: Limit‑Adoption, Churn D+7. Ergebnis: +12 % Adoption, Churn neutral. Lernpunkt: Kontext schlägt Pflicht.
Orientierung: Seriöse Anbieter erkennen
Wer neu ist, prüft zuerst: Lizenz, Zahlwege, Limits, Support, klare Regeln. Achten Sie auf faire Bonus‑Texte, feste KYC‑Hinweise, gute Hilfe bei Problemen. Eine kuratierte Übersicht spart Zeit. Ein Startpunkt: Vergleichsseiten mit Fokus auf Lizenz und Klartext. Zum Beispiel der Überblick auf https://casinaportal.se/. Dort finden Leser kompakte Infos zu Anbietern, Limits und Bedingungen. Nutzen Sie solche Quellen als Ergänzung, nicht als Ersatz für eigene Prüfung.
Governance: Kultur schlägt Tool
Ohne gemeinsame Regeln endet jedes Experiment im Streit. Legen Sie fest: Wer stellt Hypothesen? Wer segnet ab? Wie wird gemessen? Wie wird ausgerollt? Schreiben Sie ein kurzes Playbook. Lernen Sie von Teams, die das seit Jahren tun. Ein guter Blick hinter die Kulissen: Booking.com über Experimentkultur. Halten Sie Post‑Mortems kurz, ehrlich, ohne Schuldspiel. So bleibt das Team schnell und ruhig.
FAQ
Wie lange soll ein Test laufen?
Mindestens bis genug Stichprobe für Ihre MDE da ist. Zusätzlich volle Wochenzyklen abdecken (Sport‑Rhythmus). Lieber eine Woche mehr als zu früh stoppen.
Wie viele Tests parallel?
Wenige, aber saubere. Vermeiden Sie starke Überschneidung auf denselben Nutzern und Metriken. Bei Konflikt: priorisieren oder schichten.
Geht multivariat?
Ja, wenn viel Traffic da ist und Effekte groß genug sind. Sonst lieber schrittweise A/B. Erst Klarheit, dann Tiefe.
Was ist mit Peeking?
Zwischendurch schauen ist okay, wenn Sie ein sequentielles Verfahren wählen und Regeln vorher festlegen. Sonst steigt das Risiko für falsche Signale.
Welche Metriken sind Pflicht?
Pro Test eine Primär‑Metrik. Plus zwei bis drei Wächter für Qualität und Risiko. Beispiele: Add‑to‑Slip, Platzierungsrate, Deposit‑Success, Limit‑Adoption, Opt‑outs.
Was tun bei SRM?
Test stoppen, Ursache finden (Zuweisung, Traffic‑Quelle, Tracking‑Fehler), Daten säubern, neu starten. Nicht schönreden.
Morgen um 9:00: So starten Sie
- Wählen Sie 1 Hypothese mit klarem Nutzen (z. B. Hinweisblock im Wettschein).
- Definieren Sie Metriken, Power, Dauer. Erstellen Sie ein kurzes Test‑Dokument.
- Setzen Sie Feature‑Flag, halten Sie Logging sauber, legen Sie Stop‑Kriterien fest.
Weiterführende Quellen im Text
- Einwilligung und DSGVO: EDPB‑Leitlinien zur Einwilligung
- Firebase A/B: Firebase A/B Testing Docs
- Stichprobe/Power: Sample‑Size‑Rechner
- PSD2/SCA: PSD2/Strong Customer Authentication
- Mobile IA: NN/g zu Mobile‑Navigation
- RG‑Hinweise: Responsible‑Gambling‑Hinweise der UKGC
- Experimentfehler: Kohavi über Experimentfehler
- Varianzreduktion: Microsoft Experimentation Research
- Play Store: Store‑Listing‑Experimente bei Google Play
- App Store: Apple Product Page Optimization
- Experimentkultur: Booking.com über Experimentkultur
- Metrik‑Denke: Amplitude zu Experimentmetriken
Autor: Produkt‑ und Daten‑Team (DACH). Erfahrung: 8+ Jahre in Mobile, Payments, RG‑UX. Stand: Juni 2026. Diese Seite wird halbjährlich aktualisiert.
Hinweis: Sportwetten können süchtig machen. Spielen Sie mit Maß. Hilfe: BZgA – Check dein Spiel.