TL;DR: Ein sauberes N=1-Experiment hat eine Variable, 2–4 Wochen Baseline, eine Intervention mit biologisch angemessener Dauer (2 Wochen für Schlaf, 12 Wochen für Vitamin D), einen Washout bei reversiblen Interventionen und standardisierte Messungen. Ohne Baseline und Washout misst du Placebo und Rauschen. Ohne lange Phasen misst du Anpassung statt Effekt.
Dieser Artikel ersetzt keine ärztliche Beratung — bei Experimenten mit Medikamenten, Peptiden oder Hormonen hole dir vorher ärztliche Begleitung.
Was N=1 wirklich bedeutet
N=1 heißt: Du bist gleichzeitig Studienleiter, Studienteilnehmer und Datenanalyst. Eine einzelne Person, eine konkrete Frage, ein strukturierter Versuch. Die Methode ist das Fundament der modernen Biohacker-Community — von Cortisol-Experimenten über CGM-Diäten bis zu Schlafprotokollen. Sie ist aber auch methodisch anspruchsvoller als viele denken.
Das Ziel ist nicht, allgemeingültige Aussagen zu treffen. Das Ziel ist, die persönliche Wirkung einer Intervention bei dir verlässlich zu bewerten. Eine große Studie zeigt dir den Durchschnittseffekt über 1.000 Menschen. Dein N=1 zeigt dir, ob du zu den Respondern gehörst.
Ein konkretes Beispiel: Eine Meta-Analyse zeigt, dass Magnesium-Glycinat die Einschlafzeit im Schnitt um 7 Minuten verkürzt. Dein N=1-Experiment kann zeigen, dass es bei dir 22 Minuten sind — oder gar nichts. Beide Informationen brauchst du, um eine Entscheidung zu treffen. Ohne Methodik landest du bei “ich glaube, es wirkt”, und das ist keine Grundlage für dauerhafte Supplementierung.
Warum Einzelfälle täuschen
Bevor du ein Experiment planst, musst du die sechs klassischen Fehlerquellen kennen. Jede von ihnen kann einen nicht existenten Effekt vortäuschen.
Regression zur Mitte. Wenn du ein Experiment startest, weil du dich gerade schlecht fühlst, bewegt sich dein Zustand mit hoher Wahrscheinlichkeit Richtung Durchschnitt — unabhängig von deiner Intervention. Genau das wird dann dem Supplement zugeschrieben.
Placebo-Effekt. In Schmerz-, Schlaf- und Stimmungsforschung erklären Placebos 20 bis 40 Prozent des gemessenen Effekts. Das gilt auch für dich. Die Erwartung, dass etwas wirkt, produziert messbare biologische Veränderungen.
Confirmation Bias. Du achtest stärker auf Daten, die deine Hypothese stützen. Eine gute Schlafnacht nach Magnesium-Einnahme wird notiert. Die schlechte Nacht zwei Tage später wird vergessen oder auf “zu viel Kaffee” geschoben.
Novelty-Effekt. Alles Neue verändert kurzfristig Verhalten und Aufmerksamkeit. Eine neue Abendroutine wirkt die ersten zwei Wochen, danach verschwindet der Effekt — egal was du eingenommen hast.
Confounder. Jahreszeit, Training, Schlafqualität, beruflicher Stress, Alkohol, Urlaub, Menstruationszyklus. Jede dieser Variablen kann deine Messgrößen stärker beeinflussen als deine Intervention.
Messrauschen. Wearables haben typische Abweichungen von 5 bis 15 Prozent. Blutdruck schwankt tagesabhängig um 10 bis 20 mmHg. Blutzucker-Messungen variieren nach Tageszeit, Mahlzeit und Schlaf. Einzelmessungen sind fast immer irreführend.
Für tiefere Methodik zur Datenqualität lies den Guide zu Wearable-Datenqualität.
Grundprinzipien für verlässliche N=1-Studien
Fünf Prinzipien machen aus einem Selbstversuch ein Experiment, das dir eine echte Antwort liefert.
1. Eine Variable gleichzeitig
Starte nicht drei neue Supplements parallel. Starte nicht gleichzeitig ein neues Trainingsprogramm und ein neues Supplement. Wechsel nicht alle drei Tage die Dosis. Jede Änderung braucht eine komplette Phase, bevor die nächste startet. Das ist langsam, aber es ist die einzige Methode, die kausale Aussagen erlaubt.
2. Baseline-Phase (2–4 Wochen)
Vor jedem Experiment musst du deinen Ist-Zustand erfassen. Subjektive Messgrößen (Schlafqualität 1–10, Energie 1–10) und objektive (HRV, Schlafdauer, Gewicht, Blutwerte). Mindestens 14 Datenpunkte, besser 21. Ohne Baseline weißt du nicht, was sich eigentlich verändert hat. Für den Start hilft dir die Biomarker-Baseline-Checkliste.
3. Interventions-Phase mit biologisch sinnvoller Dauer
Die häufigste Fehlerquelle: zu kurze Phasen. Biologische Systeme brauchen Zeit zur Anpassung. Ein Überblick:
| Intervention | Mindestdauer |
|---|---|
| Schlaf-Protokolle (Cutoff, Dunkelheit) | 2–4 Wochen |
| Magnesium auf Schlaf | 3–4 Wochen |
| HRV-Änderungen | 6–8 Wochen |
| Ferritin / Eisen-Supplementierung | 8–12 Wochen |
| Krafttraining-Effekte | 12 Wochen |
| Vitamin-D-Serumspiegel | 12 Wochen bis Plateau |
| Blutfette (LDL, Triglyceride) | 8–12 Wochen |
| Ashwagandha auf Cortisol | 6–8 Wochen |
Wenn du nach 10 Tagen einen “Effekt” siehst, ist das fast immer Placebo oder Rauschen.
4. Washout-Phase (bei reversiblen Interventionen)
Nach der Intervention kommt 2 bis 4 Wochen ohne Intervention. Du beobachtest, ob deine Messgrößen zur Baseline zurückkehren. Wenn ja, hast du einen starken Hinweis, dass der Effekt tatsächlich der Intervention zuzuschreiben war. Wenn nicht, hat sich entweder etwas anderes geändert, oder der Effekt ist nicht reversibel (z. B. Trainingsanpassung).
5. Standardisierte Messung
Gleiche Uhrzeit, gleiche Bedingungen, gleiches Protokoll. Konkret:
- HRV: morgens direkt nach dem Aufwachen, 5 Minuten im Liegen, vor dem Wasser trinken
- Blutdruck: 7-Tage-Mittelwert aus je zwei Messungen morgens und abends
- Gewicht: morgens nüchtern nach Toilette, gleiche Waage
- Blutzucker (CGM): immer nüchterner Morgenwert als Vergleich
- Bluttests: gleiches Labor, gleiches Abnahme-Protokoll (siehe Blutabnahme-Protokoll)
Design-Patterns für N=1
Drei Designs decken 90 Prozent aller sinnvollen Selbstversuche ab.
A) ABA-Design (Baseline → Intervention → Washout). Das einfachste Pattern. Zeigt, ob die Messgröße reversibel auf die Intervention reagiert. Pro Phase 4 bis 12 Wochen. Geeignet für erste Tests eines Supplements oder einer Lifestyle-Änderung.
B) ABAB-Design (mehrfach abwechselnd). Der Goldstandard für N=1. Du wiederholst den Zyklus einmal und reduzierst damit das Risiko, dass ein Confounder den Effekt erklärt. Wenn die Messgröße in beiden B-Phasen steigt und in beiden A-Phasen sinkt, ist das starke Evidenz. Dauer: 16 bis 48 Wochen gesamt.
C) Multiple-Crossover mit verblindeter Sequenz. Dein Partner oder Apotheker packt identische Kapseln, manche mit Wirkstoff, manche mit Stärke. Du kennst die Reihenfolge nicht. Das eliminiert Placebo-Effekte, ist aber organisatorisch aufwändig. Nur sinnvoll, wenn du ein Supplement über Monate nehmen willst und eine subjektive Messgröße zentral ist.
Vier konkrete Beispiel-Experimente
Beispiel 1: Magnesium für Schlafqualität
- Messgrößen: Sleep Score (Wearable), Tiefschlaf-Minuten, Einschlafzeit, subjektive Erholung (1–10)
- Baseline: 2 Wochen ohne Änderung
- Intervention: 4 Wochen 400 mg Magnesium-Glycinat, 60 Minuten vor dem Schlafen
- Washout: 2 Wochen ohne Magnesium
- Auswertung: Mittelwert ± Standardabweichung pro Phase, Vergleich B vs. A1 und A2
Beispiel 2: Kaffee-Cutoff
- Messgrößen: Einschlafzeit, nächtliche HRV, Wake After Sleep Onset (WASO)
- Hypothese: Letzter Kaffee um 14 Uhr verbessert HRV gegenüber 18 Uhr
- Design: 3 Wochen 14-Uhr-Cutoff, 3 Wochen 18-Uhr-Cutoff, Wiederholung in umgekehrter Reihenfolge
- Auswertung: HRV-Mittelwert pro Bedingung, Differenz als Effektgröße
Beispiel 3: Ashwagandha und Cortisol
- Messgrößen: Serum-Cortisol morgens (Labor), Speichel-Tagesprofil (4 Messpunkte), subjektiver Stress (1–10)
- Baseline: Blutabnahme + Speichel-Profil Woche 0
- Intervention: 8 Wochen 600 mg KSM-66 Ashwagandha
- Re-Test: Blutabnahme + Speichel-Profil Woche 8
- Optional: Washout 4 Wochen, dann erneut Messung
Beispiel 4: CGM-Experiment mit Mahlzeitenreihenfolge
- Messgrößen: Glukose-Peak, Time in Range (70–140 mg/dl), Area Under Curve 2h postprandial
- Hypothese: Gemüse → Protein → Kohlenhydrate senkt den Glukose-Peak gegenüber umgekehrter Reihenfolge
- Design: Gleiche Mahlzeit an 7 Tagen in Reihenfolge A, 7 Tagen in Reihenfolge B
- Auswertung: Mittelwert Glukose-Peak A vs. B, Standardabweichung
Dieses Beispiel zeigt: N=1 muss nicht immer Wochen dauern. Für Kurzzeit-Outcomes wie postprandiale Glukose reicht ein Tagesvergleich. Mehr zur Methodik findest du im Insight-Sprint-Leitfaden.
Statistische Auswertung
Du brauchst keinen Statistik-Doktortitel, um ein N=1 auszuwerten. Vier Werkzeuge reichen für fast alle Fälle.
1. Mittelwert und Standardabweichung pro Phase. Berechne für jede Phase (A1, B1, A2, B2) den Durchschnitt deiner Messgröße und die Standardabweichung. Eine Differenz zwischen zwei Phasen gilt als bedeutsam, wenn sie größer ist als die doppelte Standardabweichung der Baseline.
2. Visuelle Inspektion. Zeichne eine Laufgrafik mit allen Datenpunkten, markiere die Phasengrenzen. Oft siehst du Trends mit dem Auge, bevor die Statistik greift. Ein Sprung in der B-Phase und ein Rückgang in A2 ist visuell überzeugend.
3. Rangkorrelation nach Spearman. Zeigt Trends innerhalb einer Phase. Steigt deine HRV in Woche 1 bis 4 der B-Phase kontinuierlich, ergibt das eine positive Korrelation zwischen Zeit und Messgröße.
4. t-Test bei ausreichend Datenpunkten. Wenn du über 30 Messungen pro Phase hast (typisch bei täglichen Wearable-Daten), kannst du einen gepaarten t-Test rechnen. p-Werte unter 0,05 sind ein Hinweis, aber bei N=1-Kontext kein strenger Beweis.
Wichtig: Signifikante Statistik erfordert viele Datenpunkte. Oft reicht eine saubere Grafik plus Mittelwertvergleich. Übertreibe die Statistik nicht.
Häufige Fehler
Sechs Fehler sehen wir bei fast allen Einsteigern.
- Zu kurze Interventionsphase. 10 Tage Vitamin D und Schlussfolgerung ziehen — das Serum ist noch nicht mal bei der Hälfte des Plateaus.
- Mehrere Änderungen gleichzeitig. Neuer Supplement-Stack plus neue Trainingsroutine plus neue Schlafzeiten. Keine Aussage möglich.
- Einzelmessung statt Wochen-Mittelwert. Ein HRV-Wert sagt nichts. Der 7-Tage-Mittelwert sagt viel.
- Kein Washout. Ohne Washout kannst du Placebo und Novelty nicht ausschließen.
- Subjektive Outcomes ohne Verblindung. Wenn du weißt, dass du jetzt das teure Peptid nimmst, wirst du dich besser fühlen. Fast garantiert.
- Social-Media-Hype als “Evidenz”. Ein Instagram-Post mit Vorher-Nachher-Foto ersetzt kein Experiment. Viele N=1 aus Communities sind schlecht dokumentiert und publication-biased.
Für die Iteration von Supplement-Stacks lies den Guide zur Supplement-Stack-Iteration.
Dokumentation
Die beste Methodik ist wertlos ohne saubere Dokumentation. Ein Logbuch gehört zu jedem N=1.
Erfasse täglich:
- Datum und Uhrzeit der Intervention (z. B. Einnahmezeitpunkt)
- Dosis in mg oder IU
- Nebenwirkungen (GI-Beschwerden, Kopfschmerzen, Hautveränderungen)
- Kontextvariablen: Schlafdauer, Trainingsintensität (1–10), Stress (1–10), Alkohol (Einheiten)
- Besondere Ereignisse (Krankheit, Reise, besonderer Stress)
Exportierbare Daten sind Pflicht. CSV-Export aus deinem Tracking-Tool erlaubt dir später eine saubere Analyse in Spreadsheets oder Statistik-Software. lab2go unterstützt diesen Export für alle Biomarker, Supplement-Logs und Wearable-Daten. Für Langzeit-Biomarker-Tracking hilft dir der Guide zum langfristigen Biomarker-Tracking.
Ethik und Sicherheit
Nicht jedes Experiment ist harmlos. Vier Regeln schützen dich vor unnötigem Risiko.
Keine Risiko-Experimente ohne ärztliche Begleitung. Off-Label-Medikamente, Peptide, injizierbare Substanzen, Hormonprotokolle (TRT, SERMs) gehören in ärztliche Hand. Auch wenn du sie online bekommen kannst.
Stop-Kriterien vor Start definieren. Bei welchem Wert oder Symptom brichst du ab? Beispiel: Leberwerte über dem Zweifachen der Norm, Blutdruck über 160/100, Ruheherzfrequenz über 80 bpm, anhaltende Kopfschmerzen über 3 Tage.
Baseline-Blutwerte vor pharmakologischen Experimenten. Leberwerte, Nierenwerte, großes Blutbild, CRP, Hormonstatus. Ohne diese Basis weißt du nicht, ob eine später auffällige Laborwertänderung schon vorher bestand.
Re-Test-Intervalle einhalten. Bei Interventionen mit Risikoprofil alle 4 bis 8 Wochen Kontrolle, nicht erst am Ende.
Community und Evidenz-Aggregation
Einzelne N=1 sind Anekdoten. Viele N=1 mit sauberer Methodik können zu Quasi-Evidenz werden. Plattformen wie Reddit (r/Nootropics, r/Supplements), Examine.com und die Quantified-Self-Bewegung sammeln solche Daten.
Zwei Warnungen: Publikationsbias existiert auch in Self-Experimenten. Wer veröffentlicht gerne, dass Ashwagandha bei ihm nichts gebracht hat? Positive Ergebnisse werden häufiger geteilt. Zweitens: Social-Media-Hype ersetzt keine wissenschaftliche Einordnung. PubMed und Examine.com bleiben die besseren Referenzen für Dosierung und erwartbare Effekte.
Dein eigenes sauberes N=1 ist wertvoll, besonders wenn du es mit Null-Ergebnissen teilst. Das erzieht die Community zu besserer Methodik.
lab2go als N=1-Plattform
Für ein sauberes N=1 brauchst du vier Komponenten: Biomarker-Trends, Supplement-Log, Wearable-Integration, Korrelationen. lab2go deckt diese vier ab.
- Biomarker-Trends: Jeder Bluttest wird im Zeitverlauf gespeichert. Du siehst sofort, ob dein Vitamin D in der B-Phase wirklich das Plateau erreicht hat.
- Supplement-Log: Dosis, Zeitpunkt, Produkt pro Tag. Export als CSV.
- Wearable-Integration: HRV, Schlaf, Ruheherzfrequenz, Trainingsintensität automatisch synchronisiert.
- Korrelationen sichtbar machen: Kreuzvergleiche zwischen Supplement-Einnahme und Biomarker-Trend als Visualisierung.
Schau dir die Features oder die Pläne und Preise an, wenn du deine Self-Experiments strukturiert abbilden willst.
Fazit: Drei Schritte zum ersten sauberen N=1
- Wähle eine Frage. Nicht drei. Ein Supplement, eine Lifestyle-Variable, eine konkrete Messgröße.
- Plane drei Phasen. Baseline 2–4 Wochen, Intervention mit biologisch sinnvoller Dauer, Washout 2–4 Wochen. Schreibe vor Start auf, was du messen willst und welches Ergebnis du als Treffer wertest.
- Dokumentiere täglich. Datum, Dosis, Kontext. CSV-Export am Ende. Mittelwerte pro Phase vergleichen.
Starte heute mit der Biomarker-Baseline-Checkliste und plane dein erstes Experiment in lab2go.
Dieser Artikel ersetzt keine ärztliche Beratung. Bei pharmakologischen oder invasiven Interventionen konsultiere immer einen Arzt. Self-Experimenting ergänzt die Medizin — es ersetzt sie nicht.
FAQ zum Artikel
- Wie lange muss ein N=1-Experiment mindestens dauern?
- Das hängt vom Biomarker ab. Vitamin-D-Serumspiegel braucht 12 Wochen bis zum Plateau. Ferritin reagiert in 8 bis 12 Wochen, HRV-Änderungen in 6 bis 8 Wochen, Schlaf-Interventionen in 2 bis 4 Wochen. Rechne pro Phase mindestens so lange wie die halbe biologische Anpassungszeit. Kürzere Experimente produzieren fast immer Rauschen statt Signal.
- Reicht es, nur eine Supplement-Dosis einzunehmen und sich besser zu fühlen?
- Nein. Placebo-Effekte erklären 20 bis 40 Prozent der subjektiven Besserung in vielen Kontexten. Dazu kommen Novelty-Effekt, Confirmation Bias und Regression zur Mitte. Ohne Baseline, definierten Messgrößen und einer Washout-Phase kannst du nicht entscheiden, ob das Supplement oder deine Erwartung gewirkt hat. Eine einzige Messung ist kein Experiment.
- Was ist ein ABA-Design?
- ABA steht für Baseline (A) → Intervention (B) → Washout zurück zur Baseline (A). Jede Phase dauert 4 bis 12 Wochen, abhängig vom Biomarker. Wenn deine Messgröße in der B-Phase deutlich vom Baseline-Niveau abweicht und in der zweiten A-Phase wieder zurückgeht, ist das ein starkes Indiz für einen echten Effekt. Das ABAB-Design wiederholt diesen Zyklus und reduziert Confounder-Risiken zusätzlich.
- Wie viele Messpunkte brauche ich für eine sinnvolle Auswertung?
- Für tägliche Messgrößen wie HRV oder Schlaf brauchst du pro Phase mindestens 14 Datenpunkte, besser 21 bis 28. Für Wochen-Biomarker wie Nüchternglukose oder Blutdruck reichen 7 bis 14 Messungen pro Phase. Für Serum-Biomarker genügt oft eine Messung pro Phase, aber die Phasen müssen dann lang genug sein. Einzelmessungen sind nie aussagekräftig. Nutze immer den Wochen-Mittelwert.
- Brauche ich Placebo-Kapseln für ein ernsthaftes Experiment?
- Für die meisten N=1-Experimente reicht ein sauberes ABAB-Design ohne Verblindung. Bei subjektiven Outcomes (Energie, Stimmung, Erholung) ist Verblindung aber wertvoll. Ein Partner oder Apotheker kann identische Kapseln packen, manche mit Wirkstoff, manche mit Stärke. Du weißt erst nach Abschluss, welche Phase Verum oder Placebo war. So eliminierst du Erwartungseffekte bei subjektiven Messgrößen.
- Kann ich mehrere Supplements parallel testen, um Zeit zu sparen?
- Nein. Sobald du zwei Variablen gleichzeitig änderst, lässt sich der Effekt nicht mehr zuordnen. Wenn dein Schlaf nach 4 Wochen mit Magnesium und Glycin besser ist, weißt du nicht, welches der beiden gewirkt hat oder ob beide. Stack-Tests haben ihren Platz, aber sie beantworten eine andere Frage. Für saubere Kausalität gilt: eine Variable pro Experiment.
- Wie dokumentiere ich Kontextvariablen richtig?
- Tägliches Logbuch mit Datum, Dosis, Uhrzeit der Einnahme, Schlafdauer, Trainingsintensität, Alkohol, Stress und besonderen Ereignissen. In lab2go kannst du diese Variablen strukturiert erfassen und später als Filter nutzen. Wichtig ist Konsistenz: jeden Tag dieselben Felder ausfüllen, auch wenn nichts Besonderes war. Lücken zerstören die Auswertbarkeit.
- Welche Statistik brauche ich zur Auswertung?
- Für die meisten N=1-Experimente reicht ein Vergleich der Mittelwerte plus Standardabweichung pro Phase. Eine Differenz, die größer als die doppelte Standardabweichung ist, gilt als bedeutsam. Rangkorrelation nach Spearman zeigt Trends innerhalb einer Phase. Ein t-Test braucht über 30 Datenpunkte pro Phase und ist bei Wearable-Daten meist möglich. Für viele Fragen genügt eine saubere Laufgrafik.
- Welche Experimente sollte ich nicht ohne ärztliche Begleitung machen?
- Alle Off-Label-Medikamente (z. B. GLP-1-Agonisten, Metformin zu Anti-Aging-Zwecken), Peptide, injizierbare Substanzen, Hormonprotokolle (TRT, SERMs), hochdosierte pharmakologische Wirkstoffe und Interventionen mit bekannten Risiken wie Leberbelastung. Definiere vor Start klare Stop-Kriterien: welcher Wert, welches Symptom führt zum sofortigen Abbruch? Baseline-Blutbild ist bei allen pharmakologischen Experimenten Pflicht.
- Was mache ich mit Null-Ergebnissen?
- Dokumentieren und akzeptieren. Null-Ergebnisse sind genauso wertvoll wie Treffer. Sie sparen dir Geld und Zeit. In der Biohacker-Community werden Null-Ergebnisse selten geteilt, das verzerrt die wahrgenommene Evidenz. Wenn dein 8-Wochen-Experiment mit Ashwagandha keinen Cortisol-Abfall zeigt, ist das ein echtes Ergebnis. Veröffentliche es im Supplement-Log von lab2go oder in Quantified-Self-Communities.
Diskussion
Community-Kommentare kommen bald. Bis dahin freuen wir uns über Feedback und Fragen via E-Mail.
E-Mail anzeigen