Wanneer is een hoop een hoop? Als je computer dat zegt?

Sietze

In sommige delen van de wetenschap proberen we taal hard te maken, zodat we ermee kunnen rekenen en zo kunnen we er gebruik van maken. Zeker in de computerwetenschappen, waar we nog wel eens gevoelige categorieën hard willen maken, lijdt dat tot problemen. Denk bijvoorbeeld aan discriminatie door algoritmes, maar het gaat veel dieper dan dat. De vragen die je namelijk moet beantwoorden zijn zaken zoals: Wanneer zijn lange mensen lang? Of wanneer zijn kalende mensen kalend? Of zoals de titel al behelst: Wanneer is een hoop een hoop?

De Sorites Paradox

Die vraag: wanneer is een hoop een hoop? Is een paradox uit het oude Griekenland en wordt vaak toegeschreven aan Eubulides. Om de paradox te begrijpen moeten we wat heel simpele logica doen.

Aanname: Een hoop zand bestaat uit een miljoen (of een ander groot getal n) korrels zand.
Aanname: Een hoop bestaat ook uit een miljoen minus 1 korrels zand. (ook wel n – 1).
Vervolg: Een hoop* (miljoen - 1) bestaat dus ook uit een miljoen minus 2 korrels zand (hoop* -1).
…
Conclusie: Een hoop bestaat uit 1 korrel zand.

Wacht, wat? Een hoop zand bestaat absoluut niet uit 1 korrel zand, dat is onzinnig, maar die eerste aanname houdt. Het vervolg kunnen we door trekken, dus hoeveel korrels moeten we weghalen? Waar trek je de grens? Wanneer is een hoop geen hoop meer? Bij 300,564 korrels of 300,565 korrels? Op die vraag hebben we geen antwoord omdat het concept “hoop” vaag is.

Wat nu?

Naïef wil je misschien zeggen: 'er is een arbitraire grens waar een hoop geen hoop is', maar zo'n arbitraire grens geeft problemen als je hem als beleid gaat gebruiken. Stel nou dat we een erg vreemd algoritme maken dat bepaalt of jij een uitkering krijgt, afhankelijk van of jij een hoop zand bezit of niet. Als je de arbitraire grens stelt op 300,355 benodigde korrels, is het dan acceptabel dat iemand met 300,354 korrels geen uitkering krijgt? Dat is volgens je definitie dan niet meer een hoop en dan heb je dus vette pech, tenzij je even gauw zand gaat halen.

Als we wat minder naïef te werk gaan zeggen we dat hoop-zijn, lang-zijn, kalend-zijn, een soort schalend gebeuren is. Je kunt meer of minder hoop-hebben. Je kunt hebben dat een hoop ongeveer 90% hoop is. Het is dan nog geen volledige heuvel zand maar het zit in de buurt. Een algoritme dat hierop inspeelt moet dus ook schalend te werk gaan, anders zit je nog steeds met zo'n arbitraire grens. Schalen is al veel netter, maar we breken het probleem hier eigenlijk mee op zonder het werkelijk op te lossen. Stel we hebben datzelfde algoritme, maar je krijgt geld afhankelijk van de hoedanigheid van je hoop zand. Dan is het maximum wanneer iets 'een volledige 100% hoop is' nog steeds essentieel, want bij 40% krijg je dus 40% van een uitkering enzovoorts, maar als we dus de hoeveelheid korrels zand die nodig zijn voor een volledige hoop opschuiven naar links (een kleinere hoop is al een volwaardige hoop) dan krijg je plots meer uitkering.

Daarbij komt ook nog eens context kijken. We kunnen misschien wel meten hoeveel jaren je hebt gewerkt, maar dat zegt niets over de effectiviteit van je jaren gewerkt (misschien was je erg lui). Of een ander voorbeeld, je bent misschien met 1.77m niet enorm lang voor een Nederlander, maar elders in de wereld tel je wel weer als lang. Een hoop zand hier in Nederland is misschien niet hetzelfde als hoop zand in de Sahara.

Definitie kwestie

Het is goed mogelijk dat wij categorieën gebruiken waar wij totaal geen heldere toegang tot hebben noch een definitie van kunnen formuleren. Een hoop is een hoop omdat we dat zien en kunnen ervaren dat het hoop is. Daar zit waarschijnlijk wat verschil in tussen mensen en soms zullen we ook zeggen dat we het niet zeker weten. Voor computers moet er echter een grens getrokken worden, zelfs als we zeggen dat het vaag is: ergens moet een concreet onderscheid liggen tussen een hoop en een niet-hoop. Waar dat ligt is echter een hele rare vraag.

Dit item is geschreven door Sietze van Kaf.

maandag 17 oktober 2022, 01:32 uur #1

Jouska

FKAN

Als we iets subjectiefs zoals 'een hoop' willen omzetten naar iets objectiefs leggen we dat gewoon arbitrair vast.
Het is subjectief dus we verzinnen het gewoon en het hoeft verder aan geen enkele natuurwet oid te voldoen.

Ik zie het probleem niet zo.

maandag 17 oktober 2022, 02:28 uur #2

Bubbel-Urp

Lekker hoor!

Ik denk dat je problemen verwart. Maatvoering kent geen problemen. De moeilijkheid zit hem in het nauwkeurig specifiëren van het domein.

Wanneer je spreekt over [subjectieve] maatvoering, dan spreek je over iets dat vergeleken kan worden. Bij vergelijkingen is er ten alle tijden sprake van context. Aangezien context een vast gegeven is, is het niet relevant dat het vergelekene subjectief is. De vergelijking en de uitkomst hebben immers enkel betekenis in het domein van de context waartoe ze behoren. Nu kan het zijn dat je de uitkomst van de vergelijking wilt vergelijken met de uitkomst van een andere vergelijking, maar dan ben je met heel iets anders bezig. Dan treed je buiten het domein van de context. Je begeeft je nu in het domein van een andere context, dus ook in een ander soort vergelijking, dus ook in een andere maatvoering.

Ook voor computers is dit geen probleem. Sterker nog: alles draait juist om context in computers. Wat is immers een 0 of 1? Dat is afhankelijk van de context; die uiteindelijk gedefineerd wordt middels instructies, ofwel software. In software ontwikkeling is het werken met het begrip Context dan ook heel gebruikelijk. Zo kan er een entiteit (maat, object, etc.) van iets bestaan, terwijl die entiteit eigenlijk niet echt bestaat, maar feitelijk een samensmelting is van diverse contexten. Dit zien we ook terug in de simpelste APIs, zoals bijv. de in het .NET Framework bestaande ApplicationContext, ThreadContext, ProcessContext. De eigenschappen, functies en waarden van ieder zijn enkel gelieerd aan de context waartoe ze behoren. Of zoals bijv. in de onderliggende logic in veel game engines, waarbij er een positiecomponent kan bestaan in diverse contexten zoalss PhysicsContext, RenderContext, LogicContext. De waarde van de positiecomponent zal heel anders uitzien en behandeld worden binnen iedere context. We zien het zelfs terug in de taal waarmee we software definiëren: bijv. in de taal C, waar type aliases, type namen en variable namen exact hetzelfde kunnen zijn, omdat ze bestaan in een heel andere context. typedef entity { char a,b,c; } entity; entity entity = (entity){'a','b','c'};. Ofwel parser context, lexical context, syntax context, etc.

Als het je gaat over uitkeringen, toeslagen en wat dan ook: maatvoering is niet het probleem. Het probleem is mensen die met een systeem komen, terwijl ze het domein van dat systeem vervolgens onvoldoende, of onjuist, specificeren. Het zij door onwil, of onkunde, of backdoor. Mensen die zich bezigen met Domain Driven Design kunnen je hier alles over vertellen. Ambtenaren zijn dat helaas niet.

[ Bericht gewijzigd door Bubbel-Urp op maandag 17 oktober 2022 @ 03:04 ]

[Q] Why isn't there a pregnant Barbie doll?
[A] Because Ken came in a different box.

maandag 17 oktober 2022, 02:30 uur #3

Shakkara

Bom Jihad President Cocaine

quote:
Stel nou dat we een erg vreemd algoritme maken dat bepaalt of jij een uitkering krijgt, afhankelijk van of jij een hoop zand bezit of niet. Als je de arbitraire grens stelt op 300,355 benodigde korrels, is het dan acceptabel dat iemand met 300,354 korrels geen uitkering krijgt?

Ja, en nu?

Ik zie een hoop geleuter maar geen helder gedefinieerd probleem

Een wolf maakt zich nooit zorgen dat de schapen flink in de meerderheid zijn.

maandag 17 oktober 2022, 07:10 uur #5

madcap

Een hoop is nog geen heuvel.

Iedereen is uniek, behalve ik

maandag 17 oktober 2022, 07:15 uur #6

swoopie

Leuke verhandeling, maar wat is nou eigenlijk het punt? Wat is je stelling en wat is je conclusie? Het probleem in de koppeling van het criterium 'een hoop' met de vraag of je een uitkering krijgt is makkelijk op te lossen, gebruik gewoon iets anders dan 'een hoop' als criterium. Ik denk ook niet dat dit de kern van de uitkeringscrisis is.

Kortom, ik snap je hele uitleg, ook best prima geschreven, maar ik heb geen idee waar je naartoe wil.

maandag 17 oktober 2022, 07:29 uur #7

Moonlith

quote:
Wacht, wat? Een hoop zand bestaat absoluut niet uit 1 korrel zand, dat is onzinnig, maar die eerste aanname houdt. Het vervolg kunnen we door trekken, dus hoeveel korrels moeten we weghalen? Waar trek je de grens? Wanneer is een hoop geen hoop meer? Bij 300,564 korrels of 300,565 korrels? Op die vraag hebben we geen antwoord omdat het concept "hoop" vaag is.

*zucht*

252.182.

Daar. Heb het voor je uitgerekend.

Vanaf 252.182 is het een hoop, daaronder niet meer.

Zo moeilijk is het niet.

maandag 17 oktober 2022, 07:43 uur #8

RRRobert

≠

quote:
Op maandag 17 oktober 2022 @ 07:29 schreef Moonlith het volgende:

[..]

*zucht*

252.182.

Daar. Heb het voor je uitgerekend.

Vanaf 252.182 is het een hoop, daaronder niet meer.

Zo moeilijk is het niet.

Elke god is een leugen. Elke religie is een doctrine. Elke profeet is een charlatan. Punt.

maandag 17 oktober 2022, 07:47 uur #9

Kikvors

hij die kwaakt

quote:
Stel nou dat we een erg vreemd algoritme maken dat bepaalt of jij een uitkering krijgt, afhankelijk van of jij een hoop zand bezit of niet. Als je de arbitraire grens stelt op 300,355 benodigde korrels, is het dan acceptabel dat iemand met 300,354 korrels geen uitkering krijgt? Dat is volgens je definitie dan niet meer een hoop en dan heb je dus vette pech, tenzij je even gauw zand gaat halen.

Daarom moet je ook geen subjectieve criteria gebruiken bij het maken van beleid. Het probleem is niet dat je 'een hoop' definieert in cijfers, maar dat je 'een hoop' als uitgangspunt voor je beleid gebruikt. Als je dat vermijdt, dan ga je volledig voorbij aan de problematiek van subjectiviteit in harde cijfers uit willen drukken.
En dat heeft helemaal niks met computers te maken.

maandag 17 oktober 2022, 08:09 uur #10

Kortak

The Devil's Advocate

Lijkt de huurtoeslag wel

If someone is trying to bring you down, they are already below you.

maandag 17 oktober 2022, 08:12 uur #11

Even het juiste antwoord. Een hoop is meer dan 3 zandkorrels. 4+ dus

opgelost.

Een hoop zand van 4 zandkorrels is wel een heel klein hoopje zand. Er ligt dan 1 zandkorreltje op 3 andere en we gaan dan de hoogte in

3 is te weinig dan liggen ze naast elkaar.

hoop>=4

maandag 17 oktober 2022, 09:08 uur #12

quote:
Op maandag 17 oktober 2022 @ 02:30 schreef Shakkara het volgende:

[..]

Ja, en nu?

Ik zie een hoop geleuter maar geen helder gedefinieerd probleem

Hoeveel leuters zitten er in een hoop geleuter?

Redactie Frontpage

maandag 17 oktober 2022, 09:53 uur #13

Innisdemon

quote:
Op maandag 17 oktober 2022 @ 01:32 schreef Jouska het volgende:
Als we iets subjectiefs zoals 'een hoop' willen omzetten naar iets objectiefs leggen we dat gewoon arbitrair vast.
Het is subjectief dus we verzinnen het gewoon en het hoeft verder aan geen enkele natuurwet oid te voldoen.

Ik zie het probleem niet zo.

Yep. Vergelijkbaar met ons meet- en rekensysteem.

'Me' is géén bezittelijk voornaamwoord

maandag 17 oktober 2022, 11:14 uur #14

MoesTuinNB

Een hoop is gewoon een heuveltje bij elkaar geveegd, geschoven, geschept, gegooid of gelegd materiaal. Simpel genoeg.

maandag 17 oktober 2022, 11:14 uur #15

mvdejong

Home is where the cat is.

quote:
Voor computers moet er echter een grens getrokken worden, zelfs als we zeggen dat het vaag is: ergens moet een concreet onderscheid liggen tussen een hoop en een niet-hoop.

Niet echt. Een computer (hardware en operating system) kan ueberhaupt niets met dit definities, en hoe de programmatuur ermee omgaat is een kwestie van de ontwerpers (technisch en functioneel) en programmeurs.

En daar zit het probleem : er is dan een context ontstaan waarin het vastleggen van die definitie noodzakelijk is geworden. En een van de belangrijkste contexten waarin definities zo scherp mogelijk moeten worden vastgelegd bestond al vele millennia voordat er zelfs maar een abacus werd gebouwd : wetgeving.

Het probleem zit niet in de computer of de wet, maar soms maakt het vertalen van een probleem in een ontwerp dat als programma gebouwd kan worden, of als wetgeving dat in een wetboek kan worden opgenomen, wel duidelijk dat er niet voldoende is nagedacht over het probleem.

Sam the American Eagle : You, sir, are a demented, sick, degenerate, barbaric, naughty freako!
Alice Cooper : Why, thank you!
Sam the American Eagle : Freakos: One. Civilization: Zero.

maandag 17 oktober 2022, 11:15 uur #16

Joop_van_Amerongen

Joop de op Schepper

Ik ga dit nog eens teruglezen op het toilet. Land van hoop en glorix.

Verdraaid!

Administrator

maandag 17 oktober 2022, 12:07 uur #17

Danny

Ik mis m'n grote vriend..

quote:
Op maandag 17 oktober 2022 @ 08:12 schreef Kortak het volgende:
Even het juiste antwoord. Een hoop is meer dan 3 zandkorrels. 4+ dus

opgelost.

Een hoop zand van 4 zandkorrels is wel een heel klein hoopje zand. Er ligt dan 1 zandkorreltje op 3 andere en we gaan dan de hoogte in

3 is te weinig dan liggen ze naast elkaar.

hoop>=4

Wanneer wordt 't dan een heuvel? of een berg?
Is een moment waarop je één korrel weghaalt van een berg zand en je dan denkt 'nee, nu is het geen berg meer'?

- Oh hi Mark!
- Cool... Cool, cool, cool.
Jayden, Ik mis mijn grote vriend...
Zie wat ik kijk: trakt.tv

maandag 17 oktober 2022, 12:10 uur #18

Ayn

It is what it is

quote:
Op maandag 17 oktober 2022 @ 07:15 schreef swoopie het volgende:
Leuke verhandeling, maar wat is nou eigenlijk het punt? Wat is je stelling en wat is je conclusie? Het probleem in de koppeling van het criterium 'een hoop' met de vraag of je een uitkering krijgt is makkelijk op te lossen, gebruik gewoon iets anders dan 'een hoop' als criterium. Ik denk ook niet dat dit de kern van de uitkeringscrisis is.

Kortom, ik snap je hele uitleg, ook best prima geschreven, maar ik heb geen idee waar je naartoe wil.

Neurowetenschappers hebben geen idee waar ze naartoe willen, simpelweg omdat geen hond noch mens door heeft hoe het menselijke brein werkt, als er überhaupt al enige logica in zit.
Goede vriend van mij heeft een CVA gehad, herseninfarct. Ik met hem mee naar handelende neuroloog. Hij wilde dat graag en mocht niet rijden. Vriend had restschade en stelde daar vragen over. De neuroloog antwoordde op al zijn gerichte vragen: "Geen idee, de tijd zal het leren." Vriend en ik vonden dat eerlijk.
Maar soit. Hier hebben we te maken met een scribent die zichzelf kenschetst als "neurowetenschapper".
Ik heb de neiging de "-loog" meer credit toe dichten dan een willekeurige "-wetenschapper".

IIWII

maandag 17 oktober 2022, 12:13 uur #19

quote:
Op maandag 17 oktober 2022 @ 12:07 schreef Danny het volgende:

[..]

Wanneer wordt 't dan een heuvel? of een berg?
Is een moment waarop je één korrel weghaalt van een berg zand en je dan denkt 'nee, nu is het geen berg meer'?

Nederland ligt merendeels onder water. Leuke discussie.

maandag 17 oktober 2022, 12:45 uur #20

quote:
Op maandag 17 oktober 2022 @ 12:10 schreef Ayn het volgende:

[..]

Neurowetenschappers hebben geen idee waar ze naartoe willen, simpelweg omdat geen hond noch mens door heeft hoe het menselijke brein werkt, als er überhaupt al enige logica in zit.
Goede vriend van mij heeft een CVA gehad, herseninfarct. Ik met hem mee naar handelende neuroloog. Hij wilde dat graag en mocht niet rijden. Vriend had restschade en stelde daar vragen over. De neuroloog antwoordde op al zijn gerichte vragen: "Geen idee, de tijd zal het leren." Vriend en ik vonden dat eerlijk.
Maar soit. Hier hebben we te maken met een scribent die zichzelf kenschetst als "neurowetenschapper".
Ik heb de neiging de "-loog" meer credit toe dichten dan een willekeurige "-wetenschapper".

Verhip, ik had niet eens gezien dat hij zichzelf neurowetenschapper noemt, of dat hij dat misschien zelfs is. Hoe dan ook, als je een column schrijft is dat doorgaans om naar een conclusie toe te werken of om een mening te geven of misschien om de lezer aan het denken te zetten. Ik kan geen van beide ontdekken in dit artikel en ik ben er ook niet kritisch door gaan nadenken. Dat heeft niet per sé iets te maken met de dat deze auteur neurowetenschapper is, maar meer dat het verhaal wat mij betreft gebaseerd is op teveel aannames en niet echt naar iets toewerkt.

maandag 17 oktober 2022, 13:00 uur #21

quote:
Op maandag 17 oktober 2022 @ 12:45 schreef swoopie het volgende:

[..]

Verhip, ik had niet eens gezien dat hij zichzelf neurowetenschapper noemt, of dat hij dat misschien zelfs is. Hoe dan ook, als je een column schrijft is dat doorgaans om naar een conclusie toe te werken of om een mening te geven of misschien om de lezer aan het denken te zetten. Ik kan geen van beide ontdekken in dit artikel en ik ben er ook niet kritisch door gaan nadenken. Dat heeft niet per sé iets te maken met de dat deze auteur neurowetenschapper is, maar meer dat het verhaal wat mij betreft gebaseerd is op teveel aannames en niet echt naar iets toewerkt.

Exact dat dus. Wetenschappers baseren zich op aannames en dan is het erg lastig een samenhangend epistel te schrijven.
En daarom zijn columns van socalled wetenschappers volslagen zinloos. Inderdaad, begin met een casus, leg die uit en sluit af met een conclusie.
Dan krijg je een zinvol draadje omdat je mensen dwingt om na te denken. Essentie van een columns.

maandag 17 oktober 2022, 13:41 uur #22

BasOne

Spaceship!

Computer says no.

Free speech?....... Yeah about as free as a Ferrari!!
Nothing travels faster than the speed of light with the possible exception of bad news, which obeys its own special laws.
Laboro te salutante

maandag 17 oktober 2022, 13:42 uur #23

erikal

Zaken ambigu maken en houden dat zit nu eenmaal in onze aard. Het moet zo vaag en zo fout interpreteerbaar mogelijk zijn.

In de wereld van voeding en gezondheid kom je dat ook aan alle kanten tegen. Ik noem een voorbeeld: iedereen is wel bekend met de wijsheid dat je gevarieerd moet eten.

Maar wat betekent dat nou!? Als we het bijvoorbeeld over de minst populaire voedingsgroep zouden hebben: moet je elke dag een andere groente eten... of betekent het misschien dat je elke dag diverse groentes zou moeten eten?

Het juiste antwoord is het laatste (ZEKER in Nederland), het makkelijkste antwoord is het eerste. Dus rara welke definitie kiezen mensen.

Maar stel nou dat we het allemaal erover eens zouden zijn dat je elke dag diverse groentes zou moeten eten. Wat betekent dat dan!? Wat is "divers" ? Is het de manier van bereiden (rauw, gekookt, geroosterd, gegrild...)? Verschillende soorten sla mixen? Of groentes van verschillende kleuren eten?

Alhoewel het laatste niet helemaal de juiste definitie is... is het wel een vuistregel waardoor je het waarschijnlijk wel goed gaat doen de meeste tijd. Groen, wit, paars, oranje - schep een regenboog. Alleen maar groen is niet genoeg.

Als je de biologie erachter weet dan is het zeer eenvoudig om te beredeneren wat de juiste definitie is. Maar ik kan me niet herinneren dat ik daar ook maar 1 les van heb gehad op school. Biologie, ja. Nuttige alledaagse biologie... mwoa.

maandag 17 oktober 2022, 17:23 uur #25

quote:
Op maandag 17 oktober 2022 @ 17:07 schreef RetepV het volgende:

[..]

De mijne zegt wel "yes". Hoe kan dat dan? Aardstralen?

foto

maandag 17 oktober 2022, 20:04 uur #27

Deepcage

je moet die hopen van mij elke ochtend eens zijn... Da's best een hoop hoor

dinsdag 18 oktober 2022, 10:37 uur #28

"Een top die minder dan 200 meter boven zijn omgeving uitsteekt is een heuvel. Is het hoogteverschil met de omgeving groter dan heet het een berg."

Dus effe een diameter van een zandkorrel meten en dan uitrekenen hoeveel zandkorrels die hoogte halen. Dan weet je precies in zandkorrels wanneer het overgaat van een heuvel naar een berg.

dinsdag 18 oktober 2022, 11:49 uur #29

quote:
Op dinsdag 18 oktober 2022 @ 10:37 schreef Kortak het volgende:

[..]

"Een top die minder dan 200 meter boven zijn omgeving uitsteekt is een heuvel. Is het hoogteverschil met de omgeving groter dan heet het een berg."

Dus effe een diameter van een zandkorrel meten en dan uitrekenen hoeveel zandkorrels die hoogte halen. Dan weet je precies in zandkorrels wanneer het overgaat van een heuvel naar een berg.

jij kunt zandkorrels 200 meter hoog direct op elkaar stapelen

woensdag 19 oktober 2022, 00:06 uur #30

quote:
Op dinsdag 18 oktober 2022 @ 11:49 schreef Danny het volgende:

[..]
jij kunt zandkorrels 200 meter hoog direct op elkaar stapelen

nee, en dat was de vraag ook niet. Een heuvel bestaat uiteraard uit gras, wortels, aarde, zand, wormpjes, lucht etc.

maar in een computersysteem (software) kan je exact aangeven wanneer het een heuvel word of een berg of een hoop is of gewoon 3 zandkorrels.

Reageer zelf

Om te kunnen reageren moet je zijn ingelogd op FOK.nl. Als je nog geen account hebt kun je gratis een FOK!account aanmaken

De Sorites Paradox

Wat nu?

Definitie kwestie

30 reacties