Zie ook:
(·) Causaliteit en Correlatie.
Over de betekenis van correlatie, regressie en significantie.
(·) Principes van Causale analyse voor 'N=1' steekproef:
Voorspellende kracht van correlatiewaarden: van steekproef naar populatie en naar specifiek geval.

Alento

Training & Advies

 

-

 

Arc of Essentials ©

 

-

  drs. C.P. van der Velde  

-

  12-11-2015

Dimensie/ vakgebied:

Causale Logica



Cursus / training:

Methode Causale Analyse

©

Introductie Causale analyse



Uitgangspunten en richtlijnen.



1.

 

Inleiding. Oorzaak-gevolg problemen.



1.1.

 

Het gaat om het resultaat.


Een terugkerende situatie in ons leven is dat we een bepaald doel willen bereiken. In het algemeen heeft dat doel twee kanten:
• Toename van gewenste omstandigheden.
• Afname van ongewenste omstandigheden.
Nemen we zelf ons lot ter hand dan is het zaak om ons in te zetten voor voor de volgende twee doelen, afzonderlijk of gecombineerd:
• Het veroorzaken, althans bevorderen, van gewenste effecten.
• Het verhinderen, althans tegengaan, van ongewenste effecten.
Voor elk van deze twee doelen zijn voorafgaande acties nodig:
• Het bevorderen (vermeerderen, versterken) van de oorzaken voor de gewenste effecten.
• Het tegengaan (verminderen, verzwakken) van de oorzaken voor de ongewenste effecten.
In beide gevallen is dus eerst kennis nodig van de oorzaken van de betreffende effecten.

1.2.

 

Op zoek naar de cruciale schakel.


Als we een bepaald resultaat willen realiseren dan willen we in feite een oorzaak aandragen die het gewenste effect teweegbrengt.
M.a.w., bij een gegeven combinatie van omstandigheden willen we een factor toevoegen die - naar verwachting - vrijwel zeker tot het beoogde effect zal leiden.
(of vermeerderen, bevorderen, versterken, enz.) - dus met een hoge kans - Algemener gezegd, we willen een bepaalde factor zodanig vermeerderen, bevorderen of versterken, dat dit een aanzienlijke kans oplevert dat het beoogde effect al optreden.
De kunst is dus om die doorslaggevende factor, de cruciale schakel, te achterhalen.

Causale inferentie.


Omstandigheden in het verleden kunnen niet meer worden beïnvloed. Het gewenste effect ligt in de regel ergens in de toekomst, ver of nabij.
Het bepalen van de cruciale schakel vraagt daarom allereerst om goede voorspellingen.
Hiervoor is het toepassen van oorzaak-gevolg verbanden nodig.
Via causale inferentie kennen we een causale relatie toe aan een aantal verschijnselen: 'oorzaak' en ' effect', zeg A1 en E1.

1.3.

 

Het opsporen van oorzaak-gevolg verbanden.


Hiervoor is kennis van oorzaak-gevolg principes nodig.
Causale analyse dient om deze kennis te verwerven.

Inductie


Stel het voorschrift op van de causale relatie tussen A1 en E1: de causale regel.
Dit vraagt met name om twee elementaire competenties:
(a)

Uit waarnemingen afleiden van patronen.


Herkennen van regelmatigheden in gegevens en processen.
(b)

Uit patronen afleiden van cruciale schakels.


Opsporen van cruciale schakels en benodigde bouwstenen voor de doeluitkomst.

1.4.

 

Basisaannamen in oorzaak-gevolg onderzoek.


Het eerste uitgangspunt van elk onderzoek naar kennis is het vermijden van een 'gekleurde' blik, vooringenomenheid. Stel dat we uitgaan van zo min mogelijk vooronderstellingen. D.w.z. een 'schone lei', of 'tabula rasa'. Wat kunnen we dan tenminste aannemen, voordat we beginnen met onderzoek naar causale relaties?

Er is in ieder geval een onderzoeksgebied, een domein. Wanneer we naar oorzaken en gevolgen zoeken is dit gebied meestal fysisch van aard: de wereld van materie en energie, tijd en ruimte. Maar binnen die werkelijkheid kan ze ook intra-psychisch zijn: de wereld van bewuste subjectieve beleving.
Deze beide kunnen ook gedeeld worden via taal en communicatie: de wereld van intersubjectieve beleving.
De laatste twee domeinen zijn eigenlijk niet geschikt voor causale analyse omdat de eerste - en daarmee indirect ook de tweede - problematische, of althans complicerende aspecten bevatten: (a) 'interne' subjectieve beleving, die niet direct empirisch toegankelijk is; en (b) de ervaring van keuzevrijheid of 'vrije wil', die niet logisch verenigbaar is met causale determinatie.
Het domein van abstracte patronen sluiten we meestal uit omdat dit geen causale mechanismen kent, enkel logische implicaties. Het is ook niet vatbaar voor causale analyse omdat logica juist nodig is voor causale analyse - en niet omgekeerd.
{N.b. In wezen zijn Voor de verschillen tussen deze vier elementaire domeinen en bijbehorende dimensies van informatie, zie: De Vier Domeinen van informatie volgens

  Arc of Essentials ©

. }.

Binnen het domein zijn er altijd wel bepaalde verschijnselen (fenomenen) te onderscheiden.
Het aantal verschijnselen die in een domein, of deelgebied daarvan, met redelijke objectiviteit te onderscheiden is, is in principe niet-aftelbaar oneindig. (Dat staat nog los van wat louter subjectief, met fantasie, projectie en dergelijke, valt te ontwaren).
Welke verschijnselen we onderscheiden is immers afhankelijk van de indeling, de schaalgrootte, en de selectie die we onvermijdelijk toepassen. En dat levert een combinatorische explosie van mogelijke onderscheidingen.
{N.b. Voor de kwantitatieve ontwikkeling van onderscheidingen in een systeem, zie:
Combinatorische explosie in Logische systemen }.
Toch kunnen we een aantal algemene principes over de verschijselen binnen het domein formuleren.
Allereerst zijn er objecten, of observatie-eenheden, zogezegd 'individuele gevallen'.
Deze objecten hebben bepaalde eigenschappen: traits.
Daarbij zijn er ruimtelijke en tijdgerelateerde eigenschappen.

We bekijken de verschijnselen in het domein altijd binnen een bepaald, begrensd kader, een context, van tijd (periode) en ruimte (plaats). Vervolgens is een onderscheid te maken tussen:
(1)

Constantie.


Datgene wat (relatief) onveranderlijk, statisch c.q. stabiel blijft.
(2)

Variatie.


Datgene wat (relatief) veranderlijk, fluctuerend c.q. dynamisch blijkt.
De constantie omvat vaste eigenschappen (constanten), en duurzame relaties: met name oorzaak-gevolg relaties: causale relaties.
De variatie omvat veranderlijke eigenschappen (variabelen), en (tijdgebonden) relaties: met name ordeningsrelaties (die bepaald worden door specifieke causale relaties en daardoor in principe veranderlijk zijn).

We hebben dus enerzijds eigenschappen, en anderzijds relaties.
De eigenschappen - constanten en variabelen - hebben bepaalde waarden.
De aanname is dat bepaalde causale relaties bepalend zijn voor zowel de waarden van bepaalde eigenschappen, als de ordeningsrelaties. Omdat 'echte' constanten niet (traceerbaar) beïnvloed worden door causale relaties, gaat het uitsluitend om variabelen die beïnvloed worden.

We willen dus uit de kennelijke variatie in bepaalde eigenschappen c.q. variabelen, nog onbekende, of nader te bevestigen, causale relaties afleiden.
We kunnen het domein echter niet rechtstreeks, 'An Sich' benaderen, maar alleen via waarnemingen (observaties) metingen).
We maken daarom een onderscheid tussen:
(1) De volledige verzameling van reëel bestaande verschijnselen in het domein: de populatie.
(2) De verzameling verschijnselen uit het domein: die door ons worden waargenomen of gemeten: de steekproef of selectie.
De steekproef kan in principe de volledige populatie omvatten, maar vaak vormt ze daar maar een deel van.

De mate van variatie van variabelen kunnen we vanuit onze waarnemingen van de steekproef op een statistisch-kwantitatieve manier in kaart brengen: meten en berekenen. Het resultaat noemen we dan variantie.

Alle variantie in een steekproef uit een populatie in een niet-abstract (sub)domein omvat in principe twee hoofdcategorieën:
(1)

Chaos.


'Toevalsruis', random 'error', noise.
Te verwaarlozen.
(2)

Dynamiek.


Gevolg van ordening: samenhang, structuur, systematiek. De laatste bestaande uit causale relatie(s), oftewel mechanismen.
Daarnaast kunnen we spreken van:
(3)

'Proxi-chaos', 'micro-dynamiek'.


Subtiele, extreem complexe structuur die bijna niet te traceren, bewijzen is.
Ze behoort dus in principe, theoretisch tot (2), maar zolang we dit (vooralsnog) niet empirisch kunnen aantonen, rekenen we haar uit pragmatische overwegingen (voorlopig) tot (1) - tenzij en voor zover niet het tegendeel blijkt.

In de structuur zijn te onderscheiden:
(a)

Systematische 'error', bias.


Onbedoelde afwijkingen c.q. fouten, a.g.v. onvoldoende correctheid, door tekortkomingen en gebreken (bias), in experiment, resp. steekproef.
(b)

Reële en direct relevante systematiek.


Maximum niveau van validiteit direct relevant want conform de hypothese.
Geldigheid binnen de steekproef resp. de populatie.
Interessant is te bedenken dat alle samenhang die we in de werkelijkheid met enige objectiviteit kunnen vaststellen, uitsluitend uit causale relaties bestaat. Met andere woorden, onze werkelijkheid is doortrokken van causaliteit.
Kennis van causale relaties is ook onmisbaar voor elk inzicht en elke uitspraak met enige verklarende kracht (in retrospectie) of voorspellende kracht (in prospectie).
Causaliteit is hierdoor ook de basis van alle betrouwbare, valide kennis, dus in principe zeker van wetenschappelijke kennis. Het correct herkennen van causale relaties zou dan ook de eerste deskundigheid moeten zijn van academici. Helaas zijn er maar weinig academici te vinden die hierover een samenhangend verhaal kunnen houden dat van voldoende inzicht in causaliteit getuigt.

Schema

 

Causale analyse



Globale schets van de procedure.

2.

 

Probleemstelling.



2.1.

Hoofddoelen.


Heel globaal bezien worden organismen in hun algehele functioneren geleid door twee soorten motieven:
(I)

'Negatieve' motieven.


Het tegengaan of verminderen van ongunstige c.q. ongewenste omstandigheden en gebeurtenissen.
(II)

'Positieve' motieven.


Het bevorderen of vermeerderen van ongunstige c.q. ongewenste omstandigheden en gebeurtenissen.
De vraag is dus hoe sitiuaties in gewenste richting te kunnen beïvloeden.

2.2.

Vraagstukken.


Tijdrichting:
(a)

Terugzien (Retrospectief).


Kunnen achterhalen van de 'herkomst' van gebeurtenissen.
D.i. informatie over gebeurtenissen in het verleden.
Deze informatie is nodig om twee dingen te weten te komen:
(1) Welke acties of gebeurtenissen hebben eerder tot ongewenste effecten geleid?
(2) Welke acties of gebeurtenissen hebben eerder tot gewenste effecten geleid?
Dus de vraag is, wat, welke factor, heeft een gegeven toestand veroorzaakt?

(b)

Vooruitzien

(Prospectief).
Kunnen voorzien van de gevolgen van acties of gebeurtenissen.
D.i. informatie over gebeurtenissen in de toekomst.
Deze informatie is nodig om twee dingen te weten te komen:
(1) Welke acties of gebeurtenissen zullen later tot ongewenste effecten leiden?
(2) Welke acties of gebeurtenissen zullen later tot gewenste effecten leiden?
Dus de vraag is, wat, welk effect, zal een bepaalde toestand veroorzaken?

2.3.

Verklaren en voorspellen.


Vervolgens hebben we inzicht nodig in twee volgende vraagstukken c.q. afgeleide doelstellingen:
(a)

Verklaren.


Onderzoek in hoeverre een gegeven verschijnsel, E1, kan worden verklaard als effect van een (eerdere ) oorzaak A1.
Dus het doel is: achteraf kunnen opsporen van oorzaken.
Dit vereist:
'Terugvoorspellen', retrodictie, causale attributie, backward mapping.
O.a. t.b.v. evaluatie, etiologie, determinatie, diagnose. D.m.v. abductie.

(b)

Voorspellen.


Onderzoek in hoeverre een gegeven verschijnsel, A1, een oorzaak vormt voor een (later) effect E1 .
Dus het doel is: tevoren kunnen inschatten van effecten.
Dit vereist:
Voorspellen, predictie, forward mapping.
O.a. t.b.v. anticipatie, prognose. D.m.v. deductie.
Doel is dus het bepalen van dominante trends of tendenties, in een bepaald gebied in de werkelijkheid: een populatie in het referentiële domein in de empirie.

2.4.

De 'standaard' Causale hypothese.


Het opstellen/ constructie van een nieuwe causale regel.
Formulering van een (toetsbare) hypothese, veronderstelling over een trend c.q. tendentie in het referentiële domein.
Deze geeft een regel weer met betrekking tot een algemeen geldige wet, mechanisme of regelmatigheid.
Keuze van specifieke hypothese: op basis van beschikbare gegevens en bestaande inzichten.
(1)

Te onderzoeken:


Stelling: er geldt een causale relatie tussen twee dingen c.q. verschijnselen: 'oorzaak' en 'effect', zeg A1 en E1.
D.w.z., "A1 bewerkstelligt, versterkt, bevordert, verandert of beïnvloedt E1".

Notatie:


Bijv.: 'Causale relatie (A1, E1)'; of: 'CE(A1,E1)'; of: '(A1 -> E1 )'; of: '(A1 ==> E1)'; e.d..
Oftewel, gestandaardiseerd:
A1   E1.

(2)

Te toetsen hypothese:


Het verband kan direct of indirect, geheel of gedeeltelijk van toepassing zijn.
(a)

Er is een volledige causale determinatie.


Hypothese met de algemene vorm:
"A1 'VEROORZAAKT' E1".
Causale relatie vereist altijd: symmetrische variatie van A1 en E1.
(symmetrische variatie is de empirische basis voor rekenkundige symmetrische variantie, beter bekend als statistische covariantie).
Oftewel:
A1   E1.
M.a.w.: A1 vormt volledig en uitsluitend oorzaak van E1.
Dat vereist: de symmetrische variantie van A1 en E1 is totaal (± 1).

(b)

Of, er is een zekere mate van van causale determinatie:


"A1 'BEPAALT' E1".
D.w.z., de symmetrische variantie van A1 en E1 wijkt af van nul.

(c)

Of, er is (tenminste) een gedeeltelijke causale determinatie:


"A1 'beïnvloedt' E1".
D.w.z., de symmetrische variantie van A1 en E1 wijkt af van nul maar is niet volledig (± 1).

2.5.

Bewijzen of weerleggen.


Het onderzoeken en toetsen van een hypothese kan dienen voor twee doelen, die tegengesteld (complementair) zijn aan elkaar maar tegelijk weer twee kanten van dezelfde medaille, vanwege hun gemeenschappelijke onderwerp: de geldigheid van een causale relatie.
(I)

Bewijsvoering.


Aanleveren van bewijzen, onderbouwing, argumentatie, premissen, bevestigingen of positieve indicaties (ondersteunende waarnemingen),
ter ondersteuning van een stelling c.q. hypothese.
(a) M.n. in discussiefase 1: bewijsvoering (a); stelling, betoog, pleidooi, onderbouwing.
(b) M.n. in discussiefase 3: bewijsvoering (b); verweer, verdediging (rebuttal).
(c) M.n. in discussiefase 5: bewijsvoering (c); dupliek.

(II)

Weerlegging.


Aanvoeren van tegenwerpingen, met tegenbewijs, uitzonderingen, contra-indicaties, anomalieën (onverenigbare waarnemingen),
ter bestrijding van een stelling c.q. hypothese.
(a) M.n. in discussiefase 2: weerlegging (a); commentaar, twijfel, tegenspraak, kritiek.
(b) M.n. in discussiefase 4: weerlegging (b); repliek.

2.6.

Te onderzoeken variabelen.


De - veronderstelde - betrokken factoren: ('causale factoren').
Te meten variabelen zijn:
(a)

Onafhankelijke variabele.


A1: Veronderstelde causale 'oorzaak'.
Verklarende c.q. voorspellende factor, explanatory variable (explanans).
De predictor variabele(n), determinant.
Initiële conditie, incentive, treatment, program.
(causa efficiens, impetus, stimulant, influence, agent, catalyst, trigger ; stimulus, ..).

(b)

Afhankelijke variabele.


E1: Verondersteld, verwacht causaal 'gevolg', 'effect'.
Te verklaren c.q. te voorspellen factor (explanandum).
De criterium variabele(n), response variable.
'Effect', resultaat, uitkomst (outcome; symptom, performance).

Validiteit.



Beweringen over oorzaak-gevolg verbanden (verklaringen, voorspellingen) worden heel vaak gedaan zonder een redelijke vorm van betrouwbaar onderzoek, adequate proefopzet en valide theorievorming.
In die gevallen is het nodig om de veronderstelde verbanden te kunnen toetsen met behulp van criteria die betrekking hebben op de verschillende vereisten (noodzakelijke criteria) voor causale inferenties, die anders via een 'echte' experimentele setting worden gewaarborgd.

3.

 

Conceptvaliditeit.



3.1.

Conceptvaliditeit van de causale factoren.


Vereisten aan de te meten variabelen.
(1)

Eenduidig herkenbaar.


Elk is gedefinieerd via minstens één uniek kenmerk (of unieke combinatie van kenmerken).
(2)

Traceerbaar in tijd en ruimte.


Elk is te 'verankeren' in tijd en ruimte, daardoor af te bakenen ten opzichte van andere gegevens.
(3)

Meetbaar. D.i. observeerbaar.


Zintuiglijke verifieerbaarheid (empirische grond). Dus tenminste rechtstreeks empirisch toegankelijk en/of (indirect) eenduidig afleidbaar.

3.2.

Conceptvaliditeit van het causale model.


Vereisten aan de relaties tussen de factoren volgens het hypothetische model.
Algemene kenmerken van een causaal mechanisme.
(1)

Evident verschil.


Er is minstens één evident verschil tussen causale factor en effect.
D.w.z. een eenduidig onderscheid.
Dit vereist: er is minstens één verschillend structuurkenmerk, dus in minstens één inherente eigenschap van beide (het verschil volgt dus niet louter uit definitie, verwoording of interpretatie).
(2)

Overbrugbaarheid.


Overbrugbaarheid van causale factor en effect.
Dit via domein-overlapping, van minstens één inherente eigenschap. (Anders is er geen transformatie mogelijk).
Vereist: er is voldoende structuurovereenkomst, of symmetrie, in inherente eigenschappen, tussen A1 en E1 (dus geen essentieel verschil).
(3)

Toetsbaarheid.


Toetsbare vorm van de causale relatie.
Via eenduidige formulering en representatie.
Weergave van een duidelijke en vervulbare logisch-causale structuur: de causale relatie kan direct of indirect zijn, met conjuncte of disjuncte, distale of proximale oorzaken en/of effecten, gemedieerd c.q. geschakeld in keten of serie enz..
(4)

Plausibel causaal werkingsmechanisme.


Het causale model dient een beschrijving te bieden van een aannemelijk causaal mechanisme dat verondersteld wordt werkzaam te zijn in het referentiële domein. Deze biedt een eenduidige specificatie van een transformatieproces.
Deze specificatie dient te voldoen aan de algemene randvoorwaarden voor causale inferentie (zie aldaar).

4.

 

Betrouwbaarheid.



4.1.

Eisen aan de meetwaarden van de variabelen.


Betrouwbaarheid van gebruikte waarnemingsgegevens, benamingen en beschrijvingen, en cijfers (kwantitatieve data) over incidentele feitelijke toestanden in het domein.
(1) Exactheid, 'scherpte'.
De meetwaarden zijn eenduidig 'leesbaar'. D.w.z. syntactische, met name lexicale betrouwbaarheid.
Dit wordt onder meer bevorderd door conceptvaliditeit, zie aldaar.
(2) Precisie, accuratesse.
De meetwaarden weerspiegelen de reële verhoudingen in het referentiële domein.
D.w.z. nauwkeurigheid, inhoudelijke correctheid, 'waarheidsgetrouwheid', correspondentie.
Dit vereist objectiviteit: de meetwaarden zijn in hoge mate 'object-bepaald', dat wil zeggen weerspiegelen de beoogde, corresponderende (empirische) feiten.
De meetwaarden bevatten zo min mogelijk afwijkingen c.q. 'error' ten opzichte van de reële (empirische) feiten.
(3) Niet vertekend (non-biased).
Implicatie van (2). Er waren zo min mogelijk storende invloeden die kunnen hebben geleid tot niet-toevallige, zgn. systematische error oftewel bias in de meetwaarden.
Zoals subjectiviteit: de meetwaarden zijn zo min mogelijk 'subject-bepaald', bepaald of 'gekleurd' door niet-algemene persoonlijke of collectieve eigenschappen en processen, zoals percepties, interpretaties, waarden, belangen, enz..
Betrouwbaarheid wordt onder meer bevorderd door aselecte trekking. Die vermindert de kans op niet-toevallige afwijkingen (ad 3). Daardoor kunnen eventuele afwijkingen later statistisch worden 'uitgemiddeld' en met recht worden geduid als toevallig, 'ruis' oftwel random error; zodat de objectieve feiten met meer precisie (ad 2) (bij benadering) kunnen worden beschreven.
Aselecte trekking is bovendien van belang voor zowel interne als externe validiteit, zie aldaar.
Betrouwbaarheid wordt verder bevorderd, althans arbitraire afwijkingen in de meetwaarden worden tegengegaan, door uniformiteit, standaardisatie, van procedures door welomschreven protocollen - met als risico rigiditeit, en daardoor weer selectiviteit.

5.

 

Controle op symmetrie.


Wat we eerst moeten zien aan te tonen is een samenhang tussen de onderzochte kenmerken in de waarnemingsgegevens.

5.1.

Afzonderlijke variantie.


Er blijkt voldoende variantie van alle betrokken variabelen (stochasten).
(Anders wordt correlatie onmogelijk).

5.2.

Symmetrische variatie.


Om een causale relatie aan te tonen, moeten we op zijn minst een symmetrische variantie aantonen.
Bij een evenredige relatie geldt:
(a) Hoe meer A1 afneemt - des te meer E1 afneemt.
(b) Hoe meer A1 toeneemt - des te meer E1 toeneemt.
Nb. Voor een 'omgekeerd evenredige' relatie geldt uiteraard het omgekeerde.

5.3.

Relaties tussen toestandsverschillen.


Als sprake is van een causale relatie, leidt verschil in het éne verschijnsel tot verschil in het andere verschijnsel.
(a) Een verschil of verandering in E1 - is gevolg van enig verschil of verandering in A1.
(b) Een verschil of verandering in A1 - veroorzaakt enig verschil of verandering in E1.
Dus: De 'effect'-variabele E1 vertoont in de regel een 'beduidende' patroonafwijking - in of na contact met de 'oorzakelijke' variabele A1.

5.4.

De logische structuur van causaliteit.


Voor gegronde toepassing van causale inferentie moet voldaan worden aan de algemene kenmerken van de logische structuur van causale relaties.
(a)

Verklaren: aantonen van Noodzakelijke voorwaarde

(cruciale factor).
Causale attributie, met schema: 'Als E1 dan (eerder) A1'.
D.w.z., E1 is voldoende indicatie voor (eerdere) A1.
M.a.w., 'E1 impliceert A1'.
{E1 A1 }; {(A1 ¬E1 ) }; {¬(¬A1 E1 ) }.
Het verband, disjunctie, is niet direct empirisch waarneembaar.
Is houdbaar bij bevestigingen (positieve indicaties, hits):
'Zonder A1, volgt geen E1';
oftewel: 'Niet-A1 en (kort daarna, eveneens) Niet-E1', d.w.z.
A1 ¬E1 }.

(b)

Voorspellen: aantonen van Voldoende voorwaarde

(afdoende factor).
Causale deductie, Met schema: 'Als A1 dan (later) E1'.
D.w.z., A1 is voldoende indicatie voor (latere) E1.
M.a.w., 'A1 impliceert E1'.
{A1 E1 }; {(¬A1 E1 ) }; {¬(A1 ¬E1 ) }.
Het verband, conjunctie, is niet direct empirisch waarneembaar.
Is houdbaar bij bevestigingen (positieve indicaties, hits):
'Zodra A1, dan volgt E1';
oftewel: 'A1 en (kort daarna, eveneens) E1', d.w.z.
{A1 E1 }.

(c)

Verklaren èn voorspellen: aantonen van Bepalende voorwaarde

(relevante factor).
Causale inferentie, Met schema: 'Als E1 dan (eerder) A1', en/of 'Als A1 dan (later) E1 '.
D.w.z.: A1 biedt voldoende èn noodzakelijke voorwaarde voor E1.
D.w.z. er geldt een (logische) equivalentie van A1 en E1.
(Nb. niet te verwarren met identiteit, '=').
{(E1 A1) (A1 E1) };
{(¬E1 A1) A1 E1) };
{¬(E1 ¬A1) ¬(A1 ¬E1) };
{A1 E1 }.
Het verband, equivalentie, is niet direct empirisch waarneembaar.
Is houdbaar bij bevestigingen (positieve indicaties, hits):
'Niet-A1 en (kort daarna, eveneens) Niet-E1', en/of 'A1 en (kort daarna, eveneens) E1'.
{(¬A1 ¬E1) (A1 E1) }.

5.5.

Componenten van causale werking.


Aantonen van systematische bijdrage
Van veronderstelde causale factor A1 aan verondersteld effect E1.
Dit vereist minstens éénzijdige afhankelijkheid van effect-variabele E1 van oorzakelijke variabele A1 .
Oftewel: een monocausale relatie.
{N.b. Hier werken we onder de default aanname: eventuele causale inwerking vindt plaats op fysisch macro-niveau, dus in lineaire, non-time-symmetric, irreversibele fysische tijd.
Geldig is de 'klassieke' c.q. relativistische fysica (Newton-Einstein).
We gaan hier voorbij aan de quantum-fysica, met 'anomalieën' zoals non-localiteit e.d.. Dat is redelijk omdat we in het dagelijks leven zelden direct merkbaar bemoeienis hebben met sub-atomaire processen.
Zie voor algemene opmerkingen over quantum-theorie: Quantum-verklaringen van bewustzijn. }.
Met name speuren we dus naar een specifiek soort cruciale en afdoende bijdrage van de veronderstelde causale factor A1 aan het verondersteld effect E1.
(a)

Verklaren: aantonen van unieke /exclusieve bijdrage.


E1 kan dienen als indicator van A1.
(b)

Voorspellen: aantonen van autonome /zelfstandige bijdrage.


(Impliceert onbelemmerde gelegenheid; afwezigheid van beletsel).
E1 is inherent aan A1.
De causale hypothese impliceert dus: A1 levert zelfstandige èn unieke bijdrage aan E1.

5.6.

Controle op contra-indicaties van causaliteit.


De betreffende causale hypothese is onhoudbaar in geval van uitzonderingen d.i. tegenvoorbeelden.
Deze hebben een specifieke logische vorm.
(a)

Tegenbewijs van Noodzakelijke voorwaarde.


'Niet-A1 en (niettemin) E1', d.w.z.
A1 E1 }.
(b)

Tegenbewijs van Voldoende voorwaarde.


'A1 en (niettemin) Niet-E1', d.w.z.
{A1 ¬E1 }.
(c)

Tegenbewijs van Bepalende voorwaarde

.
'Niet-A1 en (niettemin) E1', en/of 'A1 en (niettemin) Niet-E1', d.w.z.
{(¬A1 E1 ) (A1 ¬E1 ) }.

5.7.

Uitsluiten van onverwachte invloeden.


Controle op invloed van secundaire, onafhankelijke variabelen: covariaten, moderator variabelen.
(a)

Uitsluiten van disjuncte bijdragen.


Vereist uitsluiten van alternatieve verklaringen;
d.w.z. overbodigheid van de bijdrage van (oorzaak) A1;
wegens multi-causaliteit.
Impliceert uitsluiten van invloed van disjuncte oorzaak Dj in causale relatie.
Dj1: alternatieve, 'vervangende' voorwaarde, 'disjuncte' oorzaak, additieve/ parallelle oorzaak.
Met schema: 'Als (A1 en/of Dj1) dan E1'.
{(A1 Dj1 ) E1 }.
Variantie/ activiteit hiervan leidt parallel tot additionele component (proportie) verklaarde variantie .
Geeft kans op 'verstrengeling', onvoldoende onderscheid, van (parallelle) effecten.
Uitsluiten door aantonen van afwezigheid, isolatie, minimale waarde of constantie van mogelijke Dj.
M.n. onder lage waarden van A1.
D.w.z.: 'Niet-A1 èn Niet-Dj1'.
A1 ¬Dj1 }.

(b)

Uitsluiten van conjuncte bijdragen.


Vereist uitsluiten van ontoereikende bijdrage van (oorzaak) A1;
wegens complexe oorzaak.
Impliceert uitsluiten van invloed van conjuncte oorzaak Cj in causale relatie.
Cj1: noodzakelijke, (rand)voorwaarde, 'conjuncte' oorzaak.
Bijv. katalysator e.d..
Met schema: 'Als (A1 èn Cj1) dan E1'.
{(A1 Cj1 ) E1 }.
Variantie/ activiteit hiervan leidt parallel tot interactie-effect.
Geeft kans op ongegrond onderscheid van (samenhangende) oorzaken.
Constantie /passiviteit hiervan leidt tot reductie /degressie van component (proportie) verklaarde variantie.
Uitsluiten door aantonen van afwezigheid, isolatie, minimale waarde of constantie van mogelijke Cj.
M.n. onder hoge waarden van A1.
D.w.z.: 'A1 en Niet-Cj1'.
{A1 ¬Cj1 }.

(c)

Uitsluiten van gemeenschappelijke bijdragen.


Vereist uitsluiten van irrelevante c.q. illusoire, fictieve bijdrage van ('oorzaak') A1;
wegens gemeenschappelijke oorzaak.
Impliceert uitsluiten van invloed van gemeenschappelijke oorzaak (common cause) oorzaak Cm1 in causale relatie.
Cm1: gemeenschappelijke oorzaak, 'common cause'.
Met schema: 'Als Cm1 dan (A1 èn E1)'.
{Cm1 (A1 E1 ) }.
Uitsluiten door aantonen van afwezigheid, isolatie, minimale waarde of constantie van mogelijke Cm1.
D.w.z.: 'A1 en Niet-Cm1'.
{A1 ¬Cm1 }.

Door aantonen van een exclusieve beïnvloeding van de (proximale) oorzaak A1 door een specifieke voorliggende oorzaak P1.
P1: voorliggende, 'precedente' oorzaak.
Initiële, meer distale oorzaak.
Met schema:
'Als P1 dan A1; Als A1 dan E1);
Als Niet-P1 dan Niet-A1; Als Niet-A1 dan Niet-E1)'.
{((P1 A1 ) (A1 E1 ) );
P1 ¬A1 ) A1 ¬E1 ) ) }.
Bijvoorbeeld door actief de precedente oorzaak te reguleren.
Door middel van gecontroleerde, c.q. arbitraire eliminatie van A1 in controle conditie; resp. introductie van A1 in experimente conditie.

(d)

Uitsluiten van omgekeerde causaliteit.


D.w.z. uitsluiten van omgekeerde (inverse) causaliteit;
en wederzijdse (reciproke) causaliteit.
Dus waarborgen van voldoende onafhankelijkheid van causale factor A1 t.o.v. effect-variabele E1.
Dit kan door de meetwaarden te controleren op coördinaten in tijd (chronologie) en ruimte ( gepaarde waarnemingen).
Zie verderop, aanvullende vereisten.

6.

 

Interne validiteit.


Interne validiteit: de mate waarin bevindingen, gevonden regelmatigheden in de waarnemingsgegevens correct zijn afgeleid uit, en generaliseerbaar zijn, dus geldig zijn binnen de (gehele) steekproef.
Waarborgen voor interne validiteit.

Proefopzet (experimenteel ontwerp, design).


Minimale vereiste aan de waarnemings-situatie.
Globale opzet van het onderzoeksontwerp (proefopzet, design).
Dit dient bij voorkeur een 'echt experimenteel ontwerp' te zijn:
een gerandomiseerd, gebalanceerd, dubbel blind, pretest-posttest, placebo-gecontroleerd
onderzoek.

6.1.

Opsporen van het verwachte verschil.


Nagaan of de veronderstelde 'oorzaak' A1 inderdaad een noemenswaardig verschil maakt voor het veronderstelde 'effect' E1.
D.w.z., vergelijken van de waarden van de 'effect-variabele' E1 onder verschillende condities:
(a)

Condition 0. Controle- of baseline conditie.


Het bepalen van een ijkpunt (calibratie, benchmarking).
Met causale factor A1 afwezig constant, lager dan gemiddeld of op baseline niveau.
Door bijv. eliminatie, isolatie of fixatie /inhibitie - van de causale factor A1.
T.b.v. controle op disjuncte oorzaak Dj.
D.m.v. vóórmeting c.q. 'nulmeting' (pre-test).
M.b.t. de begintoestand van het systeem (initiële toestand).
(b)

Condition 1. Experimentele of treatment conditie.


Testen van de causale relatie (trial).
Met causale factor A1 aanwezig, variabel, hoger dan gemiddeld of boven baseline niveau.
Door bijv. introductie, exposure, intrusion /activatie - van de causale factor A1.
T.b.v. controle op conjuncte oorzaak Cj.
D.m.v. nameting (post-test).
M.b.t. de eindtoestand van het systeem (finale toestand).
(c)

Condition 2. Pseudo-experimentele of placebo conditie.


Alles overeenkomstig de experimentele conditie, maar nu met een gefingeerde causale factor, A2 aanwezig, variabel, hoger dan gemiddeld of boven baseline niveau.
T.b.v. controle op oneigenlijke, psychologische e.a. oorzaken.

6.2.

Verdeling van de (eerste) steekproef.


Eerste vereiste is aanwezigheid van voldoende, juiste conditiegroepen: met name een experimentele groep, een controle-groep en eventueel een placebo groep).
Steekproefgroepen (c.q. cells).
(a)

Vergelijkingsgroep (comparison group).


Tbv. controle- of baseline conditie.
(b)

'Experimentele' groep.


Tbv. Experimentele of treatment conditie.
(c)

'Placebo' groep.


Tbv. Pseudo-experimentele conditie.

7.

 

Testen op symmetrie.


Het toetsen van de hypothese.

7.1.

Te bewijzen systematiek.


Aantonen van voldoende systematiek van samenhang.
M.n. van voldoende systematische coïncidentie resp. symmetrische variatie van de gemeten variabelen.

7.2.

Herkennen van patronen.


Het vinden van causale werkingsprincipes komt nu neer op: het herkennen van indicaties voor - niet direct waarneembare - patronen.
Observaties van bevestigingen en uitzonderingen, per steekproef-conditie.
(a)

Bevestigingen.


(positieve indicaties, hits).
(a1)

Onder controle conditie.


('nulmeting').
Het effect E1 blijft afwezig, constant, lager dan gemiddeld of op baseline niveau.
{ t1 t2 t3 ((¬A1[t1]

..

¬E1[t1] )  

..

A1[t2]

..

E1[t3 ] ) );
(1)  (A1[t2]  

..

E1[t3] );
(2)  ((((A1[t2] [Cj1 [t2]] ) [Dj1[t2]] )

..

((¬A1[t2] [± Cj1 [t2]] ) [¬Dj1[t2]] ) )  

..

¬E1[t3] ). ) )t3, t2, t1 }.
(a2)

Onder experimentele conditie.


Het effect E1 blijkt aanwezig, variabel, hoger dan gemiddeld of boven baseline niveau.
{ t1 t2 t3 ((¬A1[t1]

..

¬E1[t1] )  

..

(A1[t2]

..

E1[t3 ] ) );
(1)  (A1[t2]  

..

E1[t3] );
(2)  ((((A1[t2] [Cj1 [t2]] ) [Dj1[t2]] )

..

((A1[t2] [Cj1[ t2]] ) [± Dj1[t2]] ) )  

..

E1[t3] ) ) )t3, t2, t1 }.
(b)

Uitzonderingen.


(negatieve indicaties, failures).
(b1)

Onder controle conditie.


{ t1 t2 t3 ((¬A1[t1]

..

¬E1[t1] )  

..

A1[t2]

..

E1[t3 ] ) );
(1)  ¬(A1[t2]  

..

E1[t3] );
(2)  ((((A1[t2] [Cj1 [t2]] )

Dj1[t2]

)

..

((¬A1[t2] [ ¬Cj1[t2]] )

Dj1 [t2]

) )  

..

E1[t3 ] ). ) )t3, t2, t1 }.
(b2)

Onder experimentele conditie.


{ t1 t2 t3 ((¬A1[t1]

..

¬E1[t1] )  

..

(A1[t2]

..

¬E1[t3 ] ) );
(1)  ¬(A1[t2]  

..

E1[t3] );
(2)  ((((A1[t2]

Cj1[t2]

) [Dj1[t2]] ) )

..

((¬A1[t2]

¬Cj1[t2]

) [¬Dj1 [t2]] ) )  

..

¬E1[t3] ) ) )t3, t2, t1 }.

Nb. Relatie met logische systemen.


De empirische waarnemingen van incidentele toestanden van de steekproef interpreteren we als logische ( grond) instanties.
In die zin vormen ze conjuncties van positieve en/of negatieve atomaire formules, zgn. literalen.
{(± A1[t2] [± Cj1[t2] ] ) [± Dj1[t2]] ) )  

..

± E1[t3] }.
Deze instanties verwijzen - mits de meetgegevens betrouwbaar zijn - naar zgn. domein toestanden.
Ze geven het domein weer op een louter beschrijvend niveau. Op semantisch niveau zijn dit waarheidsbeweringen met betrekking tot de toestand van (delen van) het domein dat we in ogenschouw nemen.

8.

 

Aanvullende vereisten.


Als we bovendien een 'echte' causale relatie willen aantonen, moet nog aan een heel aantal aanvullende voorwaarden worden voldaan.

8.1.

Kenmerken in fysische tijd .


(1)

Afzienbaarheid van transformatieproces.


Voldoende traceerbare en specifieke tijdwaarden.
(a) Startmoment en eindtoestand van verandering in causale factor A1 - is eenduidig traceerbaar.
(b) Startmoment en eindtoestand van verandering in effect-variabele E1 - is eenduidig traceerbaar.

(2)

Chronologie.


Adequate tijdsvolgorde, (chronologie, temporele sequentie) van veranderingen in causale variabelen.
(a) Als A1 afneemt - zal daarna E1 afnemen.
(b) Als A1 toeneemt - zal daarna E1 toenemen.
T.b.v. uitsluiten van omgekeerde (inverse) causaliteit;
en wederzijdse (reciproke) causaliteit.
Dus waarborgen van voldoende onafhankelijkheid van causale factor t.o.v. effect-variabele.

(3)

Faseverloop.


Herkenbare stadia van transformatie van de causale variabelen, m.n. de effect-variabele.
Minimaal vereiste opbouw en verloop van onderzoeksprocedure.
(a)

Beginfase.


Initiële toestand. Baseline conditie.
Start van de 'controle' conditie.
Eventueel voormeting, c.q. 'nulmeting' (pretest).
(b)

Exposure fase.


Start van de 'experimentele' conditie.
Toevoeging, toename of verandering van veronderstelde 'oorzaak', causale factor A1 (exposure fase).
(c)

Overgangsfase.


Contact-moment van 'sturende' causale factor A1 met 'ontvangende' effect variabele E1.
Start van het causale proces, 'drempeloverschrijding'.
Activatie van de cruciale causale schakel.
Omslagpunt; 'tussen-toestand'.
Ontstaan-moment (toename, verandering) van effect E1.
Start van de 'effect-fase'.
(d)

Uitwerking van causale factor.


Verschijnen, toename of verandering van veronderstelde 'effect' E1.
Afloop van het causale proces.
(e)

Eindfase.


Nameting (posttest).
Afronding van de procedure.

(4)

Relaties tussen tijdsverschillen.


Te verwachten toestanden in het domein op verschillende tijdstippen.
D.w.z. de te observeren waarden van variabelen (A1,E1} zijn op tijdstippen {t1,t2,t3 , .. }:
(a)

Nominaal meetniveau (discreet, dichotoom):


'A1 gaat in de tijd vooraf aan E1'.
{x t1 t2 t3 (((¬A1[x, t1]

..

A1[x,t2] )  E1[x,t1]

..

E1[x,t3] ) );
(t1 < t2 < t3 ) )t3, t2, t1, x }.
(b)

Ordinaal en 'gradueel' meetniveau (scale: continu, interval, ratio):


Continuumhypothese: 'verandering in A1 gaat in de tijd vooraf aan Verandering in E1'.
(Waarbij 'X

$

' staat voor waarde van een variabele X).
{x t1 t2 t3 (((A1

$

[x,t1]

..

A1

$

[x,t2] )   (E1

$

[x,t1]

..

E1

$

[x,t3] ) );
(A1

$

[x,t1] < A1

$

[x,t2] ); (E1

$

[x, t1] < E1

$

[x,t3] ) )t3, t2, t1, x }.

(5)

Temporele nabijheid.


Minimaal tijdverschil - tussen veranderingen in causale factoren {A1,E1}.
T.b.v. uitsluiten van (verkleinen van kans op) indirecte, 'geschakelde' (sequentiële) causaliteit, keten causaliteit.
De oorzaken van E1 kunnen geschakeld zijn, in keten of serie ('domino-effect'), enz..

(6)

Voldoende constante latentietijd


Voldoende constantie van tijdverschil - tussen veranderingen in causale factoren {A1,E1}.
T.b.v. uitsluiten van indirecte causaliteit, intermediërende c.q. instrumentele factoren; m.n. variantie van conjuncte oorzaken.

8.2.

Kenmerken in fysische ruimte.


(1)

Directe wederzijdse toegankelijkheid tussen causale factoren.


Een causaal effect E1 vereist de activatie van de cruciale causale schakel A1 tijdens het 'omslagpunt' in het transformatieproces.
Dit vereist voldoende ruimtelijke nabijheid van de causale factoren. D.w.z., er is een contactgebied.
(2)

Gebruik van gepaarde waarnemingen.


Vaak wordt een causale relatie niet in de interactie tussen groepen of individuen gezocht, maar binnen - het functioneren van - individuen. In dat laatste geval ligt het vereiste contactgebied tussen de veronderstelde een causale factoren in laatste instantie dus ook binnen elk individu. De waarnemingsgegevens van de causale variabelen moeten dan ook per individu gekoppeld zijn: door 'gepaarde' waarnemingen.

8.3.

Kenmerken in materiaal.


(a)

Rechtstreekse inwerking

van de causale factor A1.
(b)

Overdracht van kenmerken.


Bij contact (of meeste nabijheid), worden kenmerken van de causale factor A1 'verplaatst' of 'vertaald' naar wijzigingen in kenmerken van de effect-variabele E1.
(c)

Overgangsfase: graduele overgang.


Bij verandering van effect-variabele E1.

9.

 

Kwantitatieve kenmerken.


Berekeningen over de waarnemingsgegevens.
Dit betreft beschrijvende statistiek.

9.1.

In kaart brengen van frequenties.


We kunnen de waarnemingen overeenkomstig hun logische structuur (zie boven) registreren, en hun frequenties opnemen in een zgn. contingentie tabel (cross tabulation, of 'crosstab').
Deze tabel bevat cellen voor alle categorieën van variantie die in de waarnemingsgegevens naar voren komen: d.w.z., voor alle mogelijke combinaties van gemeten variabelen - op zijn minst {A1,E1} - en hun waarden - op zijn minst onder resp. boven hun gemiddelden: {0,1}. Ze bevat dus minimaal twee bij twee cellen: voor de bevestigingen en uitzonderingen in zowel controle- als experimentele conditie.

9.2.

Vergelijken van proporties.


We kunnen met deze cijfers de hoeveelheden c.q. proporties vergelijken tussen soorten observaties, c.q. metingen in een steekproef met betrekking tot incidentele gevallen x in de betreffende populatie, c.q. het referentieel domein.

9.3.

Vergelijken van varianties.


Een contingentie tabel vormt bovendien de grondslag voor de berekening van talrijke statistische maten voor de vergelijking van varianties, met name Chi-kwadraat2), en varianten of afgeleiden daarvan, zoals (Pearson product moment) correlatie coëfficiënt, regressie coëfficiënt, proportie verklaarde variantie, Student's t, F, Fisher z, enz..
Deze maten worden gebruikt voor statistische toetsing van causale hypothesen (zie onder).

10.

 

Externe validiteit.


Externe validiteit: de mate waarin bevindingen, gevonden regelmatigheden in de waarnemingsgegevens voldoen aan interne validiteit, en bovendien generaliseerbaar zijn, dus geldig zijn voor de (gehele) populatie.
De tweede stap in de statistische analyse is toetsen of de steekproefuitkomsten inderdaad de populatiewaarden weerspiegelen op langere termijn - en dus mogen gelden voor de gehele populatie.
Dit betreft verklarende statistiek.

Waarborgen voor externe validiteit.


T.b.v. generalisatie van (eerste) steekproef naar de populatie, c.q. een volgende steekproef (inductie, extrapolatie, divergentie).

10.1.

Statistische analyse.


De eerste stap in de statistische analyse is toetsen of de steekproefuitkomsten op de onderzochte aspecten:
(a) voldoende betrouwbaar zijn, d.w.z. een behoorlijke afspiegeling bieden van de populatie; en
(b) voldoende valide zijn, d.w.z. voldoende markant om zinvolle voorspellingen te doen vanuit de steekproefgegevens naar toestanden in de populatie.

10.2.

Statistische maten.


Bij een statistische toets berekenen we een statistische grootheid uit een hoeveelheid beschikbare meetgegevens.
Die grootheid kan een maat zijn voor een statistisch verband: overeenstemming, of juist verschil.
Deze zijn uiteraard twee kanten van dezelfde medaille.
(a)

Correlatie.


r : gestandaardiseerde afgeleide van gemeenschappelijke variantie (covariantie) van A1 en E1.
(Pearson product-moment correlatie coëfficiënt, van Karl Pearson (1857-1936).
De correlatie coëfficiënt heeft een gestandaardiseerd bereik, is dus onafhankelijk van schaal.
(-1 ≤ r ≤ 1 ).
T.b.v. test symmetrische variatie van A1 en E1.
(r = 0 ): A1 en E1 zijn onafhankelijk, niet gerelateerd.
(r < 0 ): omgekeerd evenredig verband tussen A1 en E1.
(r > 0.5 ): de hellingshoek (gradient) van de correlatielijn ligt boven 45 graden.
Het is meestal de bedoeling dat de gevonden correlatie een symmetrische variantie weerspiegelt tussen reële processen in het referentiële domein c.q. de populatie. De veronderstelling is dat deze symmetrie over langere termijn geldt en structureel is, dus inherent aan de causale relatie tussen de betreffende factoren.
(b)

Regressie.


B1: regressiecoëfficiënt.
Bereik is afhankelijk van schaal c.q. van standaardisatie van {X,Y}.
y :=B0 +(B1 *x ) +e.
e: error term (a.g.v. voorspellingsfout).
(B1 > 1.0) : lijn boven 45 graden.
Ahw. Minder x 'nodig', of 'aangevoerd', om dezelfde invloed op y te krijgen.
Ahw. Relatief 'overmaat' van effect/winst y.
(c)

Verklaarde variantie.


P: De proportie verklaarde variantie (pvv).
Het kwadraat van de correlatiewaarde levert de proportie verklaarde variantie: de gestandaardiseerde relatieve hoeveelheid symmetrische variantie (c.q. covariantie) tussen de betreffende variabelen ten opzichte van een volledige symmetrie.
(P > 0.5 ): voorspelling better than random.
(d)

Effect-verschil.


t : t-waarde. (Student's t).
T.b.v. test van verschil in effect E1, met versus zonder oorzaak A1.

10.3.

Statistische toetsing.


Waarborgen voor Statistische conclusie validiteit.

10.3.1.

Zwakke, diffuse indicatie: Significantie van effect-verschil.


Als we een symmetrische variantie willen aantonen, moet op zijn minst blijken dat de gezochte symmetrie in voldoende mate uit de waarnemingsgegevens naar voren treedt.
We onderzoeken allereerst de 'marginale' versie van de causale hypothese: A1 is relevant voor E1 .
Dat wil zeggen dat de 'oorzaak' inderdaad een noemenswaardig verschil maakt voor het 'effect'.
M.a.w., het 'effect-verschil' tussen de onderzochte condities is in dat geval 'beduidend', voldoende markant, dus in voldoende mate afwijkend van nul.
Dat betekent dat ze in statistische zin naar alle waarschijnlijkheid afwijkt van toeval.
(I)

Bewijsvoering.


Hypothese H1 : de 'oorzaak' A1 maakt (wel) enig verschil voor het 'effect' E1.
('geen toeval', oftewel 'er-is-verschil').
(II)

Weerlegging.


Hypothese H0 : de 'oorzaak' A1 maakt geen (enkel) verschil voor het 'effect' E1.
('louter toeval', oftewel 'geen-verschil').

Het begrip significantie wil zoveel zeggen als dat het effect-verschil als 'beduidend' kan worden beschouwd.
Dus: er is tenminste een 'significant' verschil tussen de waarden van het 'effect' (E1[t1],E1[t3]) - onder een gegeven 'significant' verschil tussen de waarden van de 'oorzaak' (A1[t1],A2[t2]).
De vraag is nu hoe groot volgens de steekproefuitkomsten de kans is dat een voorspelde patroonafwijking in de effect-variabele E1 in de populatie niet louter toe te schrijven is aan toevalsvariantie oftewel 'toevalsruis' (random error).
We kunnen kijken of die afwijking afleidbaar is uit statistische gegevens.
We zoeken daarom een rekenkundige relatie.

De statistische maat testen we in het algemeen op consistentie - niet-strijdigheid - met de aanname dat het gevonden verband louter aan toeval te wijten is, de zgn. 'nulhypothese'.
X : stochast, variabele Bijv. {A1,E1,.. }.
i : index van X-waarde.
x[i] : geobserveerde waarde van X in steekproef, score, X-waarde, schaal-gebonden.
z(x[i]) : z-waarde, gestandaardiseerde waarde van x[i].
Pdf : Probability density function.
Phi, Cdf : Cumulative probability density function.
(a)

Cumulatieve kans: p-waarde.


p : cumulatieve kansdichtheidswaarde, kanswaarde voor te meten waarde x[i].
p = Phi(z(x[i])).
Gebaseerd op proportie bevestigingen (pro-indicaties, hits).
D.w.z., kans dat er enig verschil is (t), resp. enig verband (r).
(Deze twee, verschil en verband, zijn 'twee kanten van dezelfde medaille').
(b)

Toevalskans: q-waarde.


q : 'overschrijdingskans'.
Kanswaarde voor veronderstelde toevalsvariantie, 'toevalsruis' (random error), in het voorspelde 'effect-verschil' voor de populatie.
q = 1.0 -p.
Gebaseerd op proportie uitzonderingen (negatieve indicaties, failures).
D.w.z., kans dat er geen verschil is (t), resp. verband (r).
(c)

Foutmarge: alpha (α).


Kanswaarde, voor maximaal toegestane toevalsvariantie, in het voorspelde 'effect-verschil' voor de populatie.
Anders gezegd de 'foutmarge', de kritische waarde, de criteriumwaarde is het maximaal niveau van de random error (de q waarde) voor significantie.
Deze vertegenwoordigt de gehanteerde 'toevalstolerantie'.
Ze definieert het onzekerheidsgebied, de kritische zône, het verwerpingsgebied (voor H0), het significantie gebied.
De alpha wordt arbitrair vastgesteld door de onderzoeker dan wel ingegeven door de heersende academische conventies.
Gebruikelijk zijn tamelijk 'tolerante' c.q. 'liberale' waarden, meestal in de volgende range:
(0.005 < α ≤ 0.05 ).
(Leveren enigszins hoge kans op 'fout Type I': Overdeterminatie, overschatting van verband c.q. effect-verschil, false positive conclusion; onderschatting van toeval).
Meer 'stringente' c.q. 'conservatieve' waarden liggen bijvoorbeeld in de range:
(0.0005 < α ≤ 0.005 ).
(Leveren hogere kans op 'fout Type II': Onderdeterminatie, onderschatting van verband c.q. effect-verschil, false negative conclusion; onderschatting van toeval).
(d)

Betrouwbaarheidsinterval (confidence interval, CI).


CI = 1.0 -α
(e)

Significantie.


Wanneer blijkt dat de q-waarde kleiner of gelijk is dan een bepaalde 'alpha' (α) waarde kunnen we - voorlopig - concluderen tot inconsistentie met de nulhypothese.
(q ≤ α ).
Bij een tweezijdige test:
(q ≤ (α /2 ) ).

Bij een gegeven steekproefgrootte N en een bepaalde gekozen alpha waarde geldt:
(·) Naarmate de symmetrische variatie tussen twee variabelen, (bijv. A1, E1) toeneemt;
(·) neemt hun gemeenschappelijke variantie toe (c.q. covariantie, correlatie, proportie verklaarde variantie, t-waarde, enz.);
(·) neemt de kansdichtheidswaarde (cumulatieve kans, p-waarde) van het statistische verband toe;
(·) neemt de toevalskans (verwachte random error, q-waarde) af;
(·) neemt de voorspellingsfout af (c.q. proportie onverklaarde variantie, enz.);
(·) neemt de 'overschrijdingskans', de kans op overschrijding van de gestelde foutmarge (alpha) af;
(·) neemt de kans op significantie toe.

10.3.2.

Sterke, scherpe indicatie: Voorspellende kracht van de correlatiewaarde.


Veelzeggender dan significantie is de kans dat de proportie verklaarde variantie in de populatie niet alleen voldoende afwijkt van louter 'toevalsruis', maar bovendien behoorlijke voorspellende kracht heeft.
Dat wil zeggen, dat de symmetrische variatie die ze weergeeft voldoende groot is voor betrouwbare voorspellingen van (nieuwe) meetwaarden.
Dit vereist dat ze niet te veel wordt overheerst door afwijkingen in het symmetrische patroon in de vorm van 'uitzonderingsruis' (systematic error, bias) onder invloed van andere causale factoren.
Dat wil zeggen, dat de kans op correcte voorspellingen ten minste die van louter 'toevaltreffers' overstijgt, dus better than random is. Hiervoor dient niet zozeer de cumulatieve kanswaarde als criterium, maar eerder de proportie verklaarde variantie. D.w.z.:
(P > 0.5).

11.

 

Aanvullende eisen aan de populatie.


(a) De populatie afzienbaar en inzichtelijk, dus is eindig.
(b) De gehele populatie blijft vanaf de eerste steekproef, tot en met de gehele periode waarover de onderzoeksresultaten moeten gelden, in alle relevante opzichten constant.

12.

 

Aanvullende eisen aan de steekproef.



12.1.

Steekproef is vergelijkbaar met populatie.


Representativiteit van waarnemingen.
De steekproef is een evenredige afspiegeling van de populatie.
De steekproef is in elk onderdeel representatief voor de populatie.
(a) Meerdere observaties. Om de kans op toeval te verkleinen helpt het om zoveel mogelijk vergelijkbare situaties te observeren.
(b) De steekproefomvang is voldoende voor generalisatie.
(c) De steekproef heeft t.o.v. de populatie vergelijkbare, analoge samenstelling van elementen.
Er is dus geen sprake van een onevenwichtige, eenzijdige of 'partijdige' selectie van elementen.
Strategie: Controlling selection bias. Elk element uit de populatie heeft een gelijke kans om in de steekproef terecht te komen.
Methode: De steekproef is aselect, dus 'blind', via volstrekt willekeurige selectie uit de populatie tot stand gekomen.
Aselecte steekproef, randomisatie (random sampling, random selection).
(d) De steekproef heeft t.o.v. de populatie een vergelijkbare verdeling van eigenschappen over individuele eenheden.
Dit op grond van invloedrijke additieve kenmerken (covariaten).
Methode: trekking van elementen op basis van a priori ordening van de populatie: systematische steekproef, gelede steekproef.
Afzonderlijke trekking per categorie; geleding (stratificatie, segmentatie) in quota, strata , cohorts.
Verdeling van de steekproef in homogene subgroepen (blocks): matching/ pairing (vooraf), blocking (achteraf).

12.2.

Steekproefgroepen zijn onderling vergelijkbaar.


(a) Steekproefgroepen zijn vergelijkbaar in omvang.
Gebalanceerde steekproef.
(b) Steekproefgroepen zijn vergelijkbaar in samenstelling.
Voldoende evenredige verdeling van eigenschappen over (sub)groepen.
Methode: random classificatie (random assignment). Aselecte toewijzing van steekproefeenheden aan conditiegroepen en subgroepen.

12.3.

Steekproefeenheden zijn onderling vergelijkbaar.


Interne vergelijkbaarheid van steekproefeenheden (proefpersonen, respondenten, subjects).
(a) Steekproefeenheden zijn volledig onderling 'inwisselbaar'. Zijn proxies van elkaar.
Alle steekproefeenheden zijn - over de gehele steekproef en binnen alle (sub)groepen - vanaf de aanvang onderling identiek op niet-gemeten variabelen, en blijven dat ook tijdens de metingen.
(b) De waarnemingsgegevens zijn - binnen de experimentele condities - onderling onafhankelijk.
Strategie: De steekproefeenheden blijven geïsoleerd van elkaar, en worden per groep waarover gemiddeld wordt uitsluitend in identieke situaties gebracht.

12.4.

Constantie.


Toestand tussen voormeting en nameting is statisch (afgezien van de variatie van de 'oorzakelijke' variabele A1).
Ceteris paribus conditie.
(a) De gehele steekproef blijft tijdens de metingen constant.
(a1) Steekproefomvang blijft gelijk.
(a2) Steekproefgroepen blijven gelijk (in omvang, samenstelling).
(a3) Steekproefeenheden blijven gelijk.
Ze blijven onder meer constant en geïsoleerd van externe invloeden.
(b) Er vindt geen beïnvloeding, interactie of communicatie plaats tussen steekproefgroepen.
(c) Er vindt geen beïnvloeding, interactie of communicatie plaats tussen steekproefeenheden.
Te voorkomen door o.m. 'blinde' opzet: blind testing:
De steekproefeenheden weten niet bij welke groep c.q. conditie ze zijn ingedeeld (weten het verschil in 'treatment' niet).

12.5.

Algemene vereisten voor de invloeden op de steekproefgroepen.


Er vindt geen beïnvloeding, interactie of communicatie plaats tussen onderzoekers en steekproefgroepen c.q. -eenheden.
Te voorkomen door o.m.:
(a) Uniforme omgeving en behandeling van steekproefeenheden.
Ceteris paribus conditie.
(Vaak onhaalbaar in sociaal-wetenschappelijk onderzoek).
(b) 'Dubbelblinde' opzet. De onderzoekers (proefleiders, observators e.a. uitvoerders) weten niet met welke groep c.q. conditie ze te maken hebben (weten het verschil in 'treatment' niet).
(b) Onafhankelijkheid van uitvoerders.
Dit kan worden gecontroleerd door test-hertest vergelijking; d.m.v. herhaalonderzoeken door derden ( replicaties).
(c) Onafhankelijkheid van setting.
Dit kan worden bevorderd door de setting te variëren (ceteris liberis) via veldonderzoeken.
(d) Uitsluiten van onbedoelde covariaten (Zie elders).

13.

 

Aanvullende eisen aan de variabelen.


(a) De variabelen zijn op een interval-meetniveau (zeg een 'glijdende schaal') meetbaar, - en zijn op die schaal ook gemeten.
(b) Bij correlatie-onderzoek: er blijkt een normale verdeling.
De gemeten variabelen (stochasten) vertonen in hun 'gedrag' (d.i. wisselende omvang) een spreiding c.q. variantie die evenwichtig rond het gemiddelde schommelt. (Dit in overeenstemming met de zgn. Gauss functie of bell curve).
(c) De meetwaarden van de onderzochte variabelen vertonen ook onderling een overeenkomstige variantie ( homoscedasticiteit).

In de praktijk blijken waarnemingsgegevens c.q. steekproefdata maar zelden aantoonbaar te voldoen aan al deze vereisten.
{Nb. In die gevallen worden vaak andere statistische analysemethoden aanbevolen, zoals nonparametrische testtechnieken, maar deze hebben weer hun eigen zwaktes zoals beperkte bruikbaarheid voor modelvorming met waarborging van voldoende betrouwbare voorspellende kracht). }

14.

 

Deductieve validiteit.


In veel gevallen waarin empirisch-statistisch onderzoek wordt toegepast ten behoeve van causale analyse is het doel om de uitkomsten toe te passen op grote groepen: bijvoorbeeld, het testen van nieuw ontwikkelde vaccins om ze in geval van succes grootschalig te kunnen inzetten voor de bevolking.
Maar veel andere toepassingen hebben tot doel om beslissingen te ondersteunen in praktijksituaties, waarin het gaat om een klein aantal behoorlijk unieke individuen: bijvoorbeeld, onderzoek naar therapeutische methoden om deze in geval van behoorlijke effectiviteit te gebruiken in psychotherapie aan individuen of cliëntsystemen.
Dit betekent toepassing van de gevonden causale regel op specifiek geval: 'in vivo', c.q. 'in situ'.

De gemiddelde waarden zijn niet de individuele waarden.


Voor dit doel kan niet zonder meer gebruik worden gemaakt van de genoemde statistische maten, zoals correlatie- en regressie-coëfficient, proportie verklaarde variantie. Deze zeggen in eerste instantie alleen iets over de gemiddelde waarden van de gehele steekproef, of van de populatiewaarden voor zover die op een valide wijze geschat zijn. Ze zeggen echter vrijwel niets over meetwaarden van kenmerken van individuen in een steekproef of een populatie, dus nog minder over reële 'oorzaken' en 'effecten' in individuele gevallen.

De derde stap in de statistische analyse is dan ook het toetsen of de steekproefuitkomsten, in hun vertaling naar populatiewaarden, inderdaad bruikbaar zijn ten behoeve van concrete toepassingen in praktijksettings.
Dat vereist betrouwbare voorspellingen over nieuwe observaties, d.w.z. meestal veel kleinere steekproeven, vaak van 'N=1' omvang.

14.1.

Waarborgen voor deductieve validiteit.


Derde steekproef.


Meting van de populatie, volgend stadium.
Derde selectie.
Voorspelling van populatie naar item, 'N=1' steekproef.
Tbv. substitutie, instantiatie, applicatie, deductie (convergentie, down-chunking ).

C.P. van der Velde © 2002, 2010, 2018.