Mathematische Herleitung zur Beurteilung von Verfahrenskenndaten

Bei quantitativen analytischen Verfahren wird ein Signal- oder Messwert \({\hat{y}}_i\)  einem Konzentrationswert \({\hat{y}}_i\) zugeordnet. Zumeist besteht innerhalb eines bestimmten Arbeitsbereichs eine direkte Proportionalität, sodass mit Hilfe einer linearen Kalibrierfunktion (Kalibriergerade), aus Proben bekannter Konzentration, aus dem Signalwert ein Konzentrationswert berechnet werden kann. Die lineare Kalibrierfunktion wird dann mittels linearer Regression (Methode kleinster Quadrate) ermittelt. Dabei wird eine Ausgleichsgerade genauso gelegt, dass die Abhängigkeit des Signalwertes \({\hat{y}}_i\) am geringsten fehlerbehaftet ist. Die entsprechende Geradengleichung lautet:

\[y=mx+b\]

Ist die Steigung m und der Ordinatenabschnitt b der Geradengleichung bekannt, kann von jedem Signalwert \({\hat{y}}_i\) der dazugehörige Konzentrationswert \({\hat{x}}_i\) berechnet werden:

\[{\hat{x}}_i\mathrm{=}\frac{{\hat{y}}_i\mathrm{-}\mathrm{b\ }}{m}\]

Durch Analyse der Kalibrierproben werden aus den x/y Wertepaaren die Steigung und der Ordinatenabschnitt \(b\) bestimmt. Der Vereinfachung halber werden vorerst die folgenden Quadratsummen eingeführt werden:

\[Q_{xx}=\sum^N_{i=1}{x^2_i\mathrm{-}\frac{{\left(\sum^N_{i=1}{x_i}\right)}^2}{N}\mathrm{\ }}\]

\[Q_{yy}=\sum^N_{i=1}{y^2_i\mathrm{-}\frac{{\left(\sum^N_{i=1}{y_i}\right)}^2}{N}\mathrm{\ }}\]

\[Q_{xy}=\sum^N_{i=1}{x_i\cdot y_i-\frac{\sum^N_{i=1}{x_i\cdot \sum^N_{i=1}{y_i}}}{N}}\]

Die Steigung der Regressionsgeraden lässt sich dann wie folgt berechnen:

\[m=\frac{Q_{xy}}{Q_{xx}}\]

Die Steigung \(m\) ist dabei ein Maß für die Empfindlichkeit der Methode. Der Ordinatenabschnitt \(b\) läßt sich folgendermaßen berechnen:

\[b=\overline{y}-m\cdot \overline{x}\]

Dabei sind \(\overline{y}\) und \(\overline{x}\) die arithmetischen Mittel (Schwerpunkt der Regressionsgeraden) der Gehalte aller Kalibrierproben.

\[\overline{x}=\frac{\sum^N_{i=1}{x_i}}{N}\ und\ \overline{y}=\frac{\sum^N_{i=1}{y_i}}{N}\]

 

Präzision und Güte

Da eine Kalibrierfunktion nur eine Abschätzung und folglich einer Reststandardabweichung \(s_y\) unterworfen ist, streuen die Signalwerte \(y_i\) in y-Richtung. Diese Residuen (auch Restfehler) sind die Differenzen in y-Richtung zwischen den Messpunkten \({(\hat{x}}_i;{\ \hat{y}}_i)\) und dem zugehörigen Punkt auf der Regressionsgeraden \((x_i;\ m\cdot x_i+b)\), also \(y_i-(m\cdot x_i+b)\). Die Reststandardabweichung \(s_y\) wird daher folgendermaßen berechnet:

\[s_y=\sqrt{\frac{\sum^N_{i=1}{{[y_i-(m\cdot x_i+b)]}^2}}{N-2}}=\sqrt{\frac{Q_{yy}-\frac{Q^2_{xy}}{Q_{xx}}}{N-2}}\]

Je größer die Reststandardabweichung ist, desto mehr streuen die Residuen. Im Idealfall \(s_y=0\) liegen alle Wertepaare auf der Regressionsgeraden. Für die Standardabweichung \(s_m\) der Steigung der Regressionsgeraden gilt:

\[s_m=\frac{s_y}{\sqrt{Q_{xx}}}\]

Die Standardabweichung \(s_b\) des Ordinatenabschnitts der Regressionsgeraden wird berechnet nach:

\[s_b=s_y\cdot \sqrt{\frac{\sum^N_{i=1}{x^2_i}}{N\cdot Q_{xx}}}\]

üblicherweise wird die Reststandardabweichung \(s_y\) und die Empfindlichkeit \(m\) zu einem gütebestimmenden Kennwert, der Verfahrensstandardabweichung \(s_{x0}\) zusammengefasst:

\[s_{x0}=\frac{s_y}{m}\]

Entsprechend verringert sich die Verfahrensstandardabweichung bei höherer Empfindlichkeit und gleicher Reststandardabweichung. Weiterhin wird die relative Verfahrensstandardabweichung \(V_{xo}\) als Kenngröße verwendet, wobei die Verfahrensstandardabweichung \(s_{x0}\) auf die Mitte des Konzentrationsbereiches \(\overline{x}\) bezogen wird:

\[V_{x0}=\frac{s_{x0}\cdot 100\%}{\overline{x}}\]

Die Güte der Anpassung der Regressionsgeraden wird durch den Korrelationskoeffizienten \(r\) oder dem Bestimmungsmaß \(r^2\) beschrieben. Der Korrelationskoeffizient ist eine Indexzahl im Wertebereich -1 und +1, wobei positive und negative Werte für eine steigende oder fallende Gerade stehen. Die Berechnung des Korrelationskoeffizienten erfolgt gemäß:

\[r=\frac{\sum^N_{i=1}{[(x_i-\overline{x})\cdot (y_i-\overline{y})]}}{\sqrt{\sum^N_{i=1}{{(x_i-\overline{x})}^2\cdot \sum^N_{i=1}{{(y_i-\overline{y})}^2}}}}\]

Ein Zahlenwert von 1 steht für eine optimale und 0 für keine Korrelation. Das Bestimmungsmaß \(r^2\) sollte bevorzugt verwendet werden, da es einerseits nur positive Werte annimmt, andererseits aber auch ,,schärfer“ als der Korrelationskoeffizient \(r\) ist (z.B. ergibt sich für r = 0.95 für r\({}^{2}\)=0.9025). Da die Korrelation bzw. das Bestimmungsmaß keine Rückschlüsse über die Tauglichkeit einer linearen Anpassung zulassen wird die Qualität des Ansatzes über eine Residualanalyse durchgeführt. Dabei werden die Residuen durch die Standardabweichung dividiert. Man erhält schließlich die normierten Residuen:

\[u_i=\frac{y_i-(m\cdot x_i+b)}{s_y}\]

Ist der lineare Ansatz korrekt gewählt worden, so sollten die normierten Größen \(u_i\) normalverteilt sein. Als optischer Test dient eine Auftragung der normierten Größen \(u_i\) in Abhängigkeit der Laufzahl \(i\), wobei die Residuen in etwa gleicher Zahl über und unter der Nulllinie verteilt sein sollten.

 

Probenauswertung und Prognoseintervall

Nach erfolgter Kalibrierung wird die ermittelte lineare Kalibrierfunktion verwendet, um aus dem gemessenen Signalwert \({\hat{y}}_i\) den Konzentrationswert \({\hat{x}}_i\) der untersuchten Probe zu berechnen:

\[{\hat{x}}_i=\frac{{\hat{y}}_i-b}{m}\]

Dabei ist zu beachten, dass der wahre Wert \(\mu\) des Analyten in der Probe nicht bekannt ist und nur durch das Analyseverfahren abgeschätzt werden kann. Der Gesamtfehler besteht dabei aus der Summe aller möglichen Fehlerquellen des Verfahrens. Aus dem Fehlerfortpflanzungsgesetz erfolgt, dass die ,,wahre” Kalibriergerade zwischen zwei Hyperbelästen, auch Prognose- oder Vertrauensbänder genannt, liegt. Diese werden für eine Kalibration mit \(N\) Kalibrierproben (bei Einfachbestimmungen) bzw. \(N\) Kalibriermessungen (bei gleicher Anzahl von \(N_K\) Parallelanalysen an jeder Kalibrierprobe) und \(\hat{N}\) Parallelbestimmungen pro Analysenprobe wie folgt berechnet:

\[y_{u,0}=(m\cdot x+b)\pm s_y\cdot t_{f,\alpha }\cdot \sqrt{\frac{1}{N}+\frac{1}{\hat{N}}+\frac{{(x-\overline{x})}^2}{Q_{xx}}}\]

Der Wert von \(t_{f,\alpha }\) bringt die statistische Sicherheit in die Gleichung ein und stellt das Quantil der Studentschen t-Verteilung für den Fehler 1. Art dar (\(\alpha \)-Fehler, hier für die zweiseitige Fragestellung). Diese hängt von der Anzahl der Freiheitsgrade \(f=N-2\) und dem Signifikanzniveau \(\alpha\) (Wahrscheinlichkeit für den Fehler 1. Art) ab. Ein üblicher Wert ist \(\alpha =0.05\) und entspricht einer Wahrscheinlichkeit für einen Fehler von 5%, oder anders ausgedrückt, einer statistischen Sicherheit von 95%. Daraus ergibt sich für einen Signalwert von \({\hat{y}}_i\) der aus der Kalibrierung berechnete Konzentrationswert \({\hat{x}}_i\) (Erwartungswert) sowie ein unterer Grenzwert \({\hat{x}}_u\) (Schnittpunkt der Horizontalen in Höhe von \({\hat{y}}_i\) mit dem unteren Prognoseband). Der sogenannte Vertrauensbereich VB (auch Prognoseintervall genannt) wird dann folgendermaßen bestimmt:

\[VB={\hat{x}}_o-{\hat{x}}_i={\hat{x}}_i-{\hat{x}}_u\]

Der ,,wahre” Analysenwert befindet sich dann mit der gewählten Sciherheit in Intervall \({\hat{x}}_i\pm VB\). Die Größen von \({\hat{x}}_u\) und \({\hat{x}}_o\) können wie folgt berechnet werden:

\[{\hat{x}}_{o,u}=\frac{{\hat{y}}_i-b}{m}\pm \frac{s_y\cdot t_{f,\alpha }}{m}\cdot \sqrt{\frac{1}{N}+\frac{1}{\hat{N}}+\frac{{({\hat{y}}_i-\overline{y})}^2}{m^2\cdot Q_{xx}}}\]

 

Nachweis-, Erfassungs- und Bestimmungsgrenzen

Bei der Kalibriergeradenmethode nach DIN 32645 wird der kritische Wert \(y_k\) des Signalwertes aus dem Ordinatenabschnitt \(b\) der Kalibriergeraden, sowie der Breite \(\Delta b\) des einseitigen Prognoseintervalls für den Ordinatenabschnitt der Kalibriergeraden ermittelt nach:

\[y_k=b+\Delta b\]

Für die breite des Prognoseintervalls gilt bei \(\hat{N}\) Bestimmungen an der Analysenprobe und bei \(N\) Kalibrierproben (bei Einfachbestimmung) bzw. \(N\) Kalibriermessungen (bei gleicher Anzahl von \(N_K\) Parallelanalysen an jeder Kalibrierprobe):

\[\Delta b=s_y\cdot t_{f,\alpha }\cdot \sqrt{\frac{1}{\hat{N}}+\frac{1}{N}+\frac{{\overline{x}}^2}{Q_{xx}}}\]

Der Faktor \(t_{f,\alpha }\) dient zur Berücksichtigung der statistischen Sicherheit. Daraus ergibt sich für den kritischen Wert:

\[y_k=b+s_y\cdot t_{f,\alpha }\cdot \sqrt{\frac{1}{\hat{N}}+\frac{1}{N}+\frac{{\overline{x}}^2}{Q_{xx}}}\]

Aus dem ermittelten kritischen Wert \(y_k\) kann die Nachweisgrenze \(x_{NG}\) berechnet werden, indem \(y_k\) in die Kalibrierfunktion \(y=mx+b\) eingesetzt wird und nach \(x\) aufgelöst wird:

\[x_{NG}=\frac{s_y}{m}\cdot t_{f,\alpha }\cdot \sqrt{\frac{1}{\hat{N}}+\frac{1}{N}+\frac{{\overline{x}}^2}{Q_{xx}}}\]

Die Erfassungsgrenze läßt sich dann wie folgt berechnen:

\[x_{EG}=x_{NG}+\frac{s_y}{m}\cdot t_{f,\beta }\cdot \sqrt{\frac{1}{\hat{N}}+\frac{1}{N}+\frac{{\overline{x}}^2}{Q_{xx}}}\]

Zur Charakterisierung der Bestimmungsgrenze wird die relative Ergebnisunsicherheit \(\frac{1}{k}\) (\(k>1\) frei wählbar, \(k=3\) üblicherweise empfohlen) berücksichtigt, die definiert ist als:

\[\frac{1}{k}=\frac{\Delta x_{BG}}{x_{BG}}\]

Für die Breite \(\Delta x_{BG}\) des zweiseitigen Prognoseintervalls der Bestimmungsgrenze (zweiseitige Fragestellung) und \(f=N-2\) Freiheitsgrade gilt:

\[\Delta x_{BG}=\frac{s_y}{m}{\cdot t}_{f,\alpha }\cdot \sqrt{\frac{1}{\hat{N}}+\frac{1}{N}+\frac{{\left(x-\overline{x}\right)}^2}{Q_{xx}}}\]

Daraus lässt sich für die Bestimmungsgrenze die folgende Iterationsvorschrift ableiten:

\[x_{BG}=k\cdot \frac{s_y}{m}{\cdot t}_{f,\alpha }\cdot \sqrt{\frac{1}{\hat{N}}+\frac{1}{N}+\frac{{\left(x_{BG}-\overline{x}\right)}^2}{Q_{xx}}}\]

Man erhält eine gute Näherung für die Bestimmungsgrenze, wenn unter der Wurzel \(x_{BG}\) durch \(k\cdot x_{NG}\) ersetzt wird:

\[x_{BG}=k\cdot \frac{s_y}{m}{\cdot t}_{f,\frac{\alpha}{2}}\cdot \sqrt{\frac{1}{\hat{N}}+\frac{1}{N}+\frac{{\left(k\cdot x_{NG}-\overline{x}\right)}^2}{Q_{xx}}}\]

 

Wiederholbarkeit

Für \(\hat{N}\) Einzelbestimmungen an der Analysenprobe wird zunächst der Mittelwert der Gehaltsgröße \({\hat{x}}_{mittel}\) der Einzelbestimmungen und die Standardabweichung \(s\) der Stichprobe (der ermittelten Konzentrationswerte \({\hat{x}}_i)\) berechnet werden. Diese wird bestimmt nach:

\[{\hat{x}}_{mittel}=\frac{\sum^{\hat{N}}_{i=1}{({\hat{x}}_i-{\hat{x}}_{mittel})}}{\hat{N}-1}\]

Danach erfolgt die Ermittlung der Spannweite \(R\), die die Differenz zwischen dem größten und dem kleinsten bestimmten Konzentrationswert darstellt, und für die gelten sollte:

\[R\le r\]

Die kritische Wiederholdifferenz \(r\) ergibt sich aus der Stansardabweichung \(s\) in Abhängigkeit vom Signifikanzniveau:

\[r=2.3\cdot s\left(90\%\right),\ r=2.8\cdot s\left(95\%\right)\ und\]

\[\ r=3.65\cdot s\left(99\%\right)\]

 

Richtigkeit

Die Richtigkeit lässt sich ohne Referenzproben anhand der Wiederfindungsrate WFR beurteilen. Bei diesem Test wird eine reale Probe dem Analysenverfahren unterworfen und aus dem Signalwert mit Hilfe der Kalibrierfunktion der Konzentrationswert \(x_o\) (Konzentration der Urprobe) ermittelt. Dann wird die Urprobe mit etwa der gleichen Konzentration um den Betrag \(\Delta x\) aufgestockt. Diese so aufgestockte Probe wird analysiert und aus dem Signalwert der entsprechende Konzentrationswert \(x_a\) ermittelt. Die Wiederfindungsrate läßt sich aus den beiden Analysen folgendermaßen berechnen:

\[WFR\%=\frac{x_A-x_0}{\Delta x}\cdot 100\%\]

Erfahrungsgemäß werden in der Praxis Wiederfindungsraten-Abweichungen von \(\pm 8\%\) akzeptiert.

 

Angabe von Analysenergebnissen

Nach Ermittlung der Grenzen des Analysenverfahrens wird das Ergebnis einer Analyse nach den in folgender Tabelle getroffenen Festlegungen (DIN 32645) angegeben:

 

Ergebnis Angabe Zusatzangabe
\(x\ge x_{BG}\) Gehalt Konfidenzintervall
\(x_{NG} \le x<x_{BG}\) nachgewiesen nicht bestimmbar, Bestimmungsgrenze \(x_{BG}\)
\(x<x_{NG}\) nicht nachgewiesen Höchstgehalt \(x_{EG}\)