Die unantastbare Stiftung Warentest?

Der Anti-Schadsoftwaretest in der April-Ausgabe der „Test“ (Stiftung Warentest) rief nicht nur die Hersteller der Programme auf den Plan, sondern entsetzte auch viele Experten und sogar jene, die eigentlich nur Anwender sind, aufgrund des Tests aber an der StiWa zweifeln. Das Rauschen im Blätterwald verkommt teils zu einem Orkan der Entrüstung – Zeitenwende? Das bleibt zu bezweifeln, denn Anlässe gab es in der Vergangenheit schon genug, das „System StiWa“ aber bleibt bestehen, auch dank höchstrichterlichen Entscheidungen und dem Einfluss der deutschen Industrie.

Es fing vor 50 Jahren alles so schön an: Adenauer fordert 1962 ein neutrales Warentestinstitut,  1964 wird dieses eingerichtet, weitere zwei Jahre später erscheint die erste Ausgabe („Der Test“), seit 1968 gibt es klare Noten zu lesen, den Leser freut es, er fühlt sich gut informiert, die Auflage geht in die Hunderttausende. Die DIN 66054 gibt unzählige, klare Vorgaben, wie was getestet werden muss, die Fahne der Nachvollziehbarkeit und Vergleichbarkeit wird ganz hoch gehalten. Man kann von einer Erfolgsgeschichte sprechen, einer für den Kunden, für den Verbraucher, einer gegen die Industrie und den Konsumwahn.  Doch das Heute schaut leider nicht mehr ganz so rosig aus, von den hehren Zielen ist nicht mehr viel übrig geblieben, was nicht an Personalien oder dem Leser liegt, nicht an Heftpreisen, sondern am System, dem System StiWa.

Rückbetrachtet könnte man das Jahr 1985 als Knackpunkt bezeichnen, denn damals wurde die Geschäftsordnung für Fachbeiräte verabschiedet und im Zuge einer Finanzierungsreform eine Festbetragsfinanzierung eingerichtet, wodurch eine höhere wirtschaftliche Verantwortung von Nöten wurde und ebenso ein Mehr an Flexibilität.  An eine Zufälligkeit beider prinzipiell nicht miteinander verbundener Aspekte muss man sicherlich nicht glauben, kann es aber. Es geht hier um Millionenbeträge (rund 5,6 Millionen Euro pro Jahr vom Staate, genauer vom Bundesverbraucherschutzministerium), denn das Testen ist nicht billig, wahrlich nicht. Die StiWa testet auch nicht im eigenen Hause mit fest eingestellten Experten in Testlaboren,  sondern gibt Tests in Auftrag, bei verschiedenen Prüfinstituten deutschlandweit. Welche dies sind, wird schlich und einfach verheimlicht. Zum Schutze der PI keine schlechte Idee, für die Transparenz hingegen nicht, denn wenn ein Test fragen aufwirft, kann kein Tester, kein Ingenieur befragt werden. Der in vielen Verlagen existierende „redaktionelle Puffer“ ist bei der StiWa also extrem stark ausgeprägt, ein kritisierter Hersteller steht somit vor verschlossenen Informationstüren. Man kann den PI auch keinen Vorwurf machen, man sollte ihnen auch keine Herstellerabhängigkeit unterstellen, auch wenn dies schwer fällt, denn es sind privatwirtschaftliche Unternehmen. Wie hoch ist die Wahrscheinlichkeit, dass die Leistung eines PIs von einem Hersteller X in Anpruch genommen wird, wenn das PI zuvor ein Produkt des Herstellers X mit Ausreichend oder Mangelhaft versehen hätte? Ein PI würde sich selbst die Kunden wegnehmen, sich somit der wirtschaftlichen Basis berauben. Also ist der Puffer durchaus sinnvoll und nicht gefährlich, wenn auch, das wurde mir aus Insider-Quellen der Branche berichtet, nicht alle Informationstüren hermetisch dicht sind. Tatsächlich haben die Hersteller auch gar kein großes Problem mit den PI, denn wenn diese sich an die DIN-Normen halten, bekommt der Hersteller ja sinnvolle Werte, die für eine Verbesserung des Produktes sorgen können. Das Problem der Hersteller liegt beim Scharnier zwischen PI und Leser – also der StiWa selbst.

Im aktuellen Fall des Anti-Schadsoftwaretests reagierten die Hersteller „verstimmt„, die StiWa reagierte mit einer Stellungnahme, die für Insider aus einer riesigen Portion Hohn besteht, vor allem drei kleine, rechtfertigende Sätze sorgen für Unruhe: „Die Anbieter kannten das Prüfprogramm sehr wohl. Die Stiftung Warentest arbeitet transparent. Für jede Untersuchung lädt sie Vertreter von Herstellern, Verbraucherschützer und unabhängige Sachverständige zu einem sogenannten Fachbeirat.“
Was ist hieran nun kritisch zu sehen? Eigentlich nichts, denn die Vorgehensweise der Bildung eines Fachbeirats ist an sich eine schlaue Lösung, eine über die klassischen Grenzen einer Testredaktion hinweggehend. In der  aktuell gültigen Fassung (9. überarbeitete Auflage, Juni 2009) des „BDI-Leitfaden für die Sachverständigen der Industrie bei der Stiftung Warentest “ wird deutlich gemacht, dass die Fachbereitäte beim „Untersuchungsvorhaben beraten“ sollen,  es geht um Wertmerkmale und Prüfverfahren, Gewichtung und Bewertung. Dies ist doppelt schwammig, denn Hersteller haben unterschiedliche Interessen, da ihre Produkte im Vergleich zur Konkurrenz unterschiedliche Stärken und Schwächen aufweisen. Egalb ob Staubsauger und Virenscanner. Es ist zwar ehrenvoll zu postulieren, “ Die Wahrnehmung von Firmeninteressen entspricht nicht dem Grundsatz einer objektiven Beratung“, doch welcher Vertreter eines Herstellers (Produktmanager, Marketing-Fachmann etc.) segnet ein Prüfprogramm ab, von welchem er genau weiß, dass die Schwächen des eigenen Produktes übergewichtet sind? Und was ist, wenn ein Dutzend Hersteller am Tisch sitzen? Wie läuft die „Wahl“ dann ab? Kein Wort hierüber steht in den Richtlinien, allein die üblichen Floskeln wie „objektiv“ und „sachgerecht“ werden als Erklärung geliefert. Dies darf man als einen Plattitüdensalat bezeichnen. Durch die Einräumung der StiWa, dass „das endgültige Prüfprogramm manchmal erst einige Wochen später eingeht“  besteht die Möglichkeit, die Fachbeiräte, die womöglich sogar zu einer gemeinsamen Vorgehensweise gefunden haben, schlicht und einfach zu überrumpeln. Da die Fachbeiräte aber nach §5 zur Verschiwegenheit verfplichtet sind, kann auch die propagierte Transparenz der StiWa nicht eingehalten werden, denn kommt es zu Fehlern, zu einer Umstellung, Umgewichtung etc., dürfen die Fachbeiräte nicht einmal ihr Leid klagen. Da auch nur „Grundzüge der Bewertung“ der Bewertung festgelegt werden, bleibt in der redaktionellen Aufarbeitung zudem auch ganz legal noch ein Ermessensspielraum, welcher natürlich gern genutzt wird.  Zu allem Übel muss die StiWa nach §7  „gravierende Abweichungen“ lediglich in den „Anmerkungen zum Prüfprogramm“ festhalten, ein Einspruchsrecht der Fachbeiräte aber gibt es nicht. Da nützt auch der §8 („Bei wesentlichen Abweichungen werden Fachbeiratsmitglieder entsprechend informiert.“) nichts, selbst wenn dann weitere Fachbeiratssitzung einberufen wird. Wer die „Experten“ sind, welche Firmen Fachbeiräte stellen durften und es tatsächlich dann auch taten, bleibt ebenso offen, wie deren Einfluss. Nicht einmal als „halbtransparent“ würde ich so etwas bezeichnen. Eines aber darf man mit Fug und Recht behaupten: im Falle des Rommelsbacher DSG 800 (einem Dampfgarer) saß mit Sicherheit kein Verteter des mittelständischen dt. Unternehmens im Fachbeirat, denn dieses Gerät wurde mit der Entnote 4 bestaft, weil ein „Kabel unsicher“ sei. Die Dreifachisolierung, die Kabelschnecke (Zuglastschutz) und der positive TÜV-Test wurden ignoriert, ein lächerlich winziges Bild in der Ausgabe 03/2012 samt  unzureichender Bildunterschrift warf mehr Fragen auf als es beantwortete, der Hersteller sah sich zu einer Stellungnahme samt Hinweis (online) genötigt (mittlerweile wieder entfernt) und der Leser … tja, der fragte sich, wenn überhaupt, wieso ein Gerät, welches selbst nach StiWa-Maßstaben also nicht durch eine Sicherheitsprüfung fiel, dann mit einem Ausreichend bedacht wurde. Da kommt der Verdacht auf, die Abwertungen seien ein großes Spielfeld, oder?
Viele auf den ersten Blick tolle Sätze und hehre Ziele sind also im Leitfaden zu finden, aber nur oberflächlich betrachtet geht es „fair“ und transparent zu. Die Folge ist u.a. ein „interessanter“ Abwertungskatalog.

– „Bei befriedigendem Virenschutz konnte das test-Qualitätsurteil nur eine halbe Note besser sein
– „bei ausreichendem Virenschutz konnte es nicht besser sein
– „War der Dateiscanner ohne Internetverbindung oder die Reaktionszeit auf neue Schadprogramme mangelhaft, wurde der Virenschutz um eine halbe Note abgewertet
– „War der Farbschutz oder die mikrobiologische Qualität mangelhaft, konnte das test-Qualitätsurteil nicht besser sein
– „War das Saugen befriedigend oder ausreichend, konnte das test-Qualitätsurteil nicht besser sein
– „War das Saugen aus Ritzen mangelhaft, konnte das Gruppenurteil Saugen nur eine Note besser sein
„Bei mangelhaften Umwelteigenschaften wurde das test-Qualitätsurteil um eine Note abgewertet
– „Bei mangelhaftem Staubrückhaltevermögen konnten die Umwelteigenschaften nicht besser sein
– „War das Geräusch auf Hartboden ausreichend, konnten die Umwelteigenschaften nur zwei Noten besser sein
„War die Motordauerprüfung befriedigend oder die Stoß- und Fallprüfung ausreichend, konnte die Haltbarkeit nicht besser sein
– „Ab ausreichendem Urteil für Vertikutieren oder Haltbarkeit und Verarbeitung konnte das test-Qualitätsurteil nicht besser, bei ausreichender Sicherheit nur eine Note besser sein
– „Bei mangelhafter Rasenfilz- und Moosentfernung konnte Vertikutieren nicht besser, bei mangelhafter
Verstopfungsneigung (ohne Fangbehälter) nur eine Note besser sein
– „Waren sowohl Bild als auch Ton ausreichend, konnte das test-Qualitätsurteil nicht besser als das Bild sein
– „War die Bildqualität für alle Fernsehsignale nur ausreichend, wurde das Bild um eine halbe Note abgewertet
– „Bei ausreichendem Ton oder ausreichender  Handhabung konnte das test-Qualitätsurteil nur eine Note besser sein
– „Waren Gebrauchsanleitung und Hilfen oder Bedienen mit Fernbedienung ausreichend oder schlechter, konnte die Handhabung nur eine Note besser sein
– „Waren die Umwelteigenschaften ausreichend, wurde das test-Qualitätsurteil um eine halbe Note abgewertet
– „Bei mangelhafter Druckgeschwindigkeit wurde das Drucken um eine halbe Note  abgewertet
– „Bei ausreichenden Umwelteigenschaften wurde das test-Qualitätsurteil um eine halbe Note abgewertet
– „Bei ausreichendem oder mangelhaftem Stromverbrauch konnten die Umwelteigenschaften maximal eine halbe Note besser sein

Diese 30 (!) Abwertungspunkte bei 6 Vergleichtstests der Ausgabe 4/12 mit einer Spanne von einer halben bis 2 Noten, von Teilaspekten zu Gruppennoten und Gesamtnoten sind teils absolut nachvollziehbar (v.a. wenn es um mangelhafte Funktionsnoten geht), teils fragwürdig („Die 3 Prüfpersonen beurteilten subjektiv die Belastung durch Staub und Fasern beim Verarbeiten.“ – das lässt sich mit Zusatzfiltern durchaus einfach genau ermitteln!)m letztlich aber nur mit einem Ziel versehen: die Vergrößerung der Notenspanne, damit auch schön deftige Notenunterschiede herauskommen, die rein mathematisch nie entstehen könnten. Dem unbedarften Leser wird den Eindruck vermittelt, die StiWa würde  kritisch testen und sich nicht scheuen, die Wahrheit zu sagen. Warum aber selbst befriedigende Werte für Abwertungen sorgen, warum mal um eine halbe und mal um zwei Noten abgewertet wird, weiß wohl nur die Redaktion.
Es ist „fair“, ein Produkt, welches nur ein Ausreichend bei der Note bekommt, diese Note auch als Gesamtnote zu verpassen, das ist ein deutlicher hinweis, dass z.B. eine tolle Handhabung oder eine erstklassige Verarbeitung die Gesamtnote nicht verbessern kann, weil hierdurch eine starke Verzerrung stattfinden würde und funktionalere Geräte ins Hintertreffen geraten würden. Es ist aber nicht „fair“, Teilaspekte, die in sich keine große prozentuale Gewichtung aufweisen, nachträglich so aufzuwerten, dass Teil- und/oder Gesamtnote massiv darunter leiden. Dabei hat die StiWa ja sogar die Chance, weitgehend ohne solche Abwertungen auszukommen, denn die Gewichtung Einzelkriterien ist ja nirgends ersichtlich, es werden keine Kriteriennoten angegeben. Das ist an sich schon grenzwertig, denn dem Leser (und dem Hersteller!) erschließt sich nicht, wie dann die Teilnoten errechnet werden. Ist dies transparent zu bezeichnen?

Da fragt man sich, was eigtl. Transparenz ist. Übersetzt bedeutet es „Durchsichtigkeit“, also in etwas „ich kann den Test durchschauen, die Ergebnisse sind nachvollziehbar“. Dies kann den Tests der StiWa aber nicht attestiert werden, auch weil konkrete Werte vorsichtig ausgedrück doch eher „Mangelware“ sind. Wie die Erstellung der Noten erfolgt, wird schlicht und einfach nicht verraten, Referenzwerte fehlen komplett. Sie sind nicht immer zwingend notwendig, das muss man klar sagen, aber gibt man keine Referenzwerte an, fehlt das relationistische Moment, wodurch der Leser (ja, und der Hersteller) nicht einschätzen kann, welche Restrisken bestehen, wie lange „schnell“ dauert, wie gut „aktuell“ usw.  ist. „Verschleierung der Fakten“ könnte man dies als Kritiker nennen, als einen „Schutz des Testverfahrens vor Kopierern“ wird es seitens der StiWa dargestellt. Zwischen den Stühlen sitzt wie üblich der Rezipient, der nicht weiß, wie viel Staub genau im Teppich zurückbleibt, wie viele Viren nicht erkannt wurden, wie stark Lichthöfe auf dem Bildschirm sind.

Als ob die bisher erkannten Schwammigkeiten nicht schon genug wären, als ob die Ergebniserlangung nicht schon unbefriedigend genug ist, so stellt sich spätestens seit 1975 ein weiteres Problem dar, welches bis heute auf Unverständnis stößt: Nehmen wir mal an, ein Produkt wurde die vom Gesetzgeber vorgeschriebenen Limits einhalten, auf dem aktuellen Stand der Technik sein und alle Sicherheitsaspekte in der Praxis realisieren können, das Produkt würde die TÜV-Tests bestehen – dann ist dies im „Richtlinienland“ BRD schon mal eine Qualitätsaussage.  Was macht man da aber als StiWa, wenn einem dies als zu lasch erscheint? Man setzt härtere Maßstäbe an und wertet ein Produkt ab.
So etwas gibt es nicht? Das wäre unsinnig? Das würde über das Ziel hinausschießen? Ja, ja und ja … und zudem auch noch Realität! Im BGH-Urteil im Falle „Marker“ (es ging um eine Sicherheits-Skibindungen, 09.12.1975, AZ: VI ZR 157/73) wurde der StiWa Tür und Tor geöffnet, sich über bestehende Grenzen hinwegzusetzen. „Dieses Urteil bewertet das Recht der im Verbraucherauftrag tätigen unabhängigen StiWa auf Meinungsfreiheit höher als das Recht des eingerichteten und ausgeübten Gewerbebetriebs.“ lässt sich im BDI-Leitfaden als Zusammenfassung des Urteils lesen. Der StiWa wird höchst richterlich ein „erheblicher Ermessensspielraum“ eingeräumt, solange der durch „Objektivität, Neutralität, Wissenschaftlichkeit“ begründet ist. Ist der Mensch argumentativ schwach ausgestellt, tendiert er zur Syonymanhäufung – in diesem Falle ist diese klassische, defektierende Vorgehensweise gut zu erkennen. Wissenschaftlichkeit setzt nämlich Objektivität und Neutralität voraus, es sind nicht drei unabhängige Aspekte, sondern einfach nur eine zwingend notwendige Vorraussettzung. Zwölf Jahre später sprang der BGH der StiWa abermals zur Seite, im Falle AL-KO SchwabenGeräte GmbH (es ging um einen Komposthäcklser, AZ: VI ZR 144/86) bewertet der BHG die Prüfungsfreiheit der StiWa höher,  „solange die Prüfverfahren objektiv, neutral, sachkundig, nachvollziehbar und Ergebnisse eines fairen Testverfahrens sind.“ Der Synoymhaufen ist nun schon fünf Begriffe hoch.  Konkret wurde auch hier höchst richterlich bestätigt, dass „die StiWa rechtmäßig über eine DIN-Norm hinausgehende Anforderungen“ festlegen und umsetzen kann.
Es geht hierbei gar nicht um Skibindung und Häcksler, möglicher Weise waren die wirklich alles an empfehlenswert, das ist aber nicht der Knackpunkt, dieser besteht darin, dass die StiWa das Recht bekommt, DIN-Normen und TÜV-Ergebnisse links liegen zu lassen und willkürlich Maßstäbe anzuwenden, die natürlich dafür sorgen, dass so richtig schön Alarmstimmung verbreitet werden kann, am besten natürlich wenn es um Sicherheit geht, idealer Weise wenn es Kinder betrifft. Klingt klischeehaft? Ja, ist es auch, aber die StiWa ist sich dafür nicht zu schade. Die Folge: ein in Brand gesetzter Plüsch-Affe als Skandalisierungsbild erster Güte und schon die bloße Existenz geringster Mengen polyzyklischer aromatischer Kohlenwasserstoffe als heftiger, rundumschlagender Abwertungsgrund. Ob eine Gesundheitsgefährung überhaupt besteht, ob ein Kind nicht vielleicht eine ganze Kiste von Spielzeug essen müsste,  um Schaden zu nehmen, wird dabei komplett ausgeblendet. Boulevard-Jounalismus auf übelstem BILD-Niveau bezahlt vom Steuerzahler und abgesichert vom Bundesgerichtshof – besser kann es ein Verein nicht haben, das sind paradisische Zustände für skandalgeile Redakteure. Die im Übrigen auch nicht ersichtlich sind, denn eine Verfasserangabe bei den Tests wird nicht gemacht. Wer also den Artikel schrieb, ist für den Leser (ja, und natürlich den Hersteller) nicht zu sehen. Ein nettes Stilmittel, um unter dem Deckmantel der Presse- und Meinungsfreiheit sein Unwesen zu treiben. Das trauen sich in dieser konsequenten Weise nicht einmal SZ, FAZ, BILD und Co.

Was bleibt also zu fordern? Eigentlich nur einige wenige Punkte:
1. Angabe der Firmen, welche Fachbeiräte für den jeweiligen Test stellten
2. Angabe von Kriteriennoten und wichtiger Referenzwerte
3. ein genereller, kompakter Abwertungskatalog
4. Angabe der Prüfinstitute samt Kosten für den Test
5. Angabe der genauen Gebrauchseigenschafts- und Sicherheitstests

Warum dies nie realisiert werden wird, ist aber schnell erläutert: die StiWa würde sich großer Kritik aussetzen, weil
1. die nun vorhandene Transparenz die Willkür aufdecken würde
2. „fragwürdige Verflechtungen“ mit Vetretern der dt. Industrie ausländische Unternehmen zu einer Klagewelle animieren würde
3. der Steuerzahler sich dann fragt, wodür er eigentlich so viel Geld ausgibt
weshalb er 4. das Vertrauen in die StiWa verliert
und 5. die Zeitschrift nicht mehr kaufen wurde

Zeit für ein neues Format, eine „echte Test-Zeitschrift“, eine transparante, eine nachvollziehbare, weiterhin werbefrei, gern auch aus Steuermitteln bezahlt, aber eben seriös!

JS für Orthy.de, C2012