Wenn Sie Daten in Ihrem System oder Prozess erfasst haben, müssen Sie als Nächstes bestimmen, welche Art von Wahrscheinlichkeitsverteilung vorhanden ist. Die Arten der Wahrscheinlichkeitsverteilungen sind: diskrete Uniform, Bernoulli, Binomial, negatives Binomial, Poisson, geometrisch, kontinuierlich, normal (Glockenkurve), Exponential-, Gamma- und Betaverteilungen. Wenn Sie nur wenige aus der Liste der Möglichkeiten eingrenzen, wird die Bestimmung des nächstgelegenen R-Quadrats viel schneller.
Artikel, die Sie benötigen
-
Grafiksoftware
-
Berechnungsmittel für den R-Quadratwert (Best-Fit-Analyse)
Zeichnen Sie die Daten für eine visuelle Darstellung des Datentyps.
Um zu bestimmen, welche Datenverteilung vorhanden ist - und damit der Gleichungstyp, mit dem die Daten modelliert werden sollen -, besteht der erste Schritt darin, das auszuschließen, was es nicht kann. • Wenn der Datensatz Spitzen aufweist, kann es sich nicht um eine diskrete Gleichverteilung handeln. • Wenn die Daten mehr als eine Spitze haben, handelt es sich nicht um Poisson oder Binomial. • Wenn es eine einzige Kurve, keine sekundären Peaks und eine langsame Neigung auf jeder Seite hat, kann es sich um Poisson oder eine Gammaverteilung handeln. Es kann jedoch keine diskrete Gleichverteilung sein. • Wenn die Daten gleichmäßig verteilt sind und keine Schräglage nach einer Seite besteht, kann eine Gamma- oder Weibull-Verteilung sicher ausgeschlossen werden. • Wenn die Funktion eine gleichmäßige Verteilung oder eine Spitze in der Mitte der grafischen Ergebnisse aufweist, handelt es sich nicht um eine geometrische oder exponentielle Verteilung. • Wenn das Auftreten eines Faktors mit einer Umgebungsvariablen variiert, handelt es sich wahrscheinlich nicht um eine Poisson-Verteilung.
Nachdem der Wahrscheinlichkeitsverteilungstyp eingegrenzt wurde, führen Sie eine R-Quadrat-Analyse aller möglichen Wahrscheinlichkeitsverteilungen durch. Der Wert mit dem höchsten R-Quadratwert ist höchstwahrscheinlich richtig.
Beseitigen Sie einen Ausreißer-Datenpunkt. Berechnen Sie dann R quadriert neu. Wenn der gleiche Wahrscheinlichkeitsverteilungstyp als engste Übereinstimmung auftritt, besteht die hohe Sicherheit, dass dies die richtige Wahrscheinlichkeitsverteilung ist, die für den Datensatz verwendet werden soll.
Tipps
-
Wenn die Daten mehrere Peaks zeigen, die eine breite Streuung aufweisen, ist es möglich, dass zwei separate Prozesse ablaufen oder das Produkt gemischt wird. Sammeln Sie die Daten und analysieren Sie sie erneut.
Warnung
Überprüfen Sie die erzeugten Gleichungen anhand späterer Datensätze, um zu bestätigen, dass sie für den Datensatz noch genau sind. Es ist möglich, dass Umweltfaktoren und Prozessabweichungen aktuelle Gleichungen und Modelle falsch gemacht haben.