La impossibilitat d’Arrow
25/05/2017 Dídac López
Dídac López, col·laborador del blog col·lectiu desdelamediterrania.cat Dídac López, col·laborador del blog col·lectiu desdelamediterrania.cat

Per Dídac López, col·laborador del blog col·lectiu desdelamediterrania.cat

Fa tres mesos, el 21 de febrer del 2017, es moria a Palo Alto (Califòrnia), a l’edat de 95 anys, Kenneth J. Arrow. Per al gran públic era conegut pel “teorema de la impossibilitat d’Arrow” o “la paradoxa d’Arrow”, que sovint apareix en els debats sobre sistemes electorals per dir que no n’hi pot haver cap de perfecte.

Aquest teorema, naturalment, és d'un abast més ample i val a dir que la seva aplicació a la teoria de votacions es fa a través del teorema més específic de Gibbard-Satterhwaite. I, no cal dir, que les aportacions d’Arrow van més enllà d’aquest treball de la seva època de doctorand a la Columbia University.

Kenneth J. Arrow tenia 30 anys quan es va doctorar. Havia nascut a la ciutat de Nova York el 23 d’agost del 1921, fill d’una família jueva procedent de Romania. Com moltes altres figures de l’economia neoclàssica crescudes en temps de la Depressió, de jove tingué conviccions socialistes. Es graduà en matemàtiques al City College of New York (1940) i a la Columbia University (mestratge, 1941). En el 1942 fou enrolat en la Força Aèria com a oficial meteoròleg, i romandria en l’exèrcit fins el 1946. De retorn a la vida civil, es casà (1947) i reprengué els estudis, alhora que treballava com a investigador associat en recerca econòmica en la Comissió Cowles de la Universitat de Chicago (1946-1949) i en la RAND Corporation de Califòrnia. En el 1949, ocupà una plaça de professor ajudant a la Stanford University.

És des de la Universitat de Stanford que tramet al “Journal of Political Economy” un article titulat “A Difficulty in the Concept of Social Welfare”, que es publicarà en el número d’agost del 1950.

El punt de partida és la identificació de dos mètodes essencials de presa de decisions socials en una democràcia capitalista:

- el sufragi, típicament utilitzat per prendre decisions “polítiques”.

- el mercat, típicament utilitzat per prendre decisions “econòmiques”.

Arrow qualifica de “democràcies emergents amb sistemes econòmiques mixtes”, Gran Bretanya, França i Escandinàvia, en les quals co-existeixen aquests dos modes de presa de decisió si bé el mètode de votació adquireix més rellevància que el “mecanisme de preus”.

Arrow també esmenta dos altres modes de decisió, prevalents en les societats tradicionals, però també en les unitats socials més petites de les societats democràtiques:

- la presa de decisions per un sol individu o per grups més petits, és a dir la decisió dictatorial

- la presa de decisions a través de normes tradicionals o codis religiosos, és a dir la decisió convencional.

En aquests dos mètodes de presa de decisions hom no amalgama una multitud de preferències individual, com sí fan el sufragi i el mercat. Els mètodes dictatorial i convencional són racionals en la mesura que l’individu (dictador i intèrpret) sigui racional, però Arrow es demana si el sufragi i el mercat, en tant que modes col·lectius de decisió poden mostrar la mateixa consistència.

És des d’aquesta interrogació que Arrow revisa la paradoxa de la votació. L’adreça a una situació simple: tres votants (1, 2, 3) que han de triar una opció entre tres alternatives (A, B, C). Si l’individu 1 té com a preferència A > B > C; l’individu 2 té com a preferència B > C > A; i l’individu 3 té com a preferència C > A > B; en resulta un anell. Si bé la majoria (2 de 3) prefereix A a B, i una altra majoria (2 de 3) prefereix B a C, hi ha també una majoria (2 de 3) que prefereix C a A. Arrow posa com a exemple de tria tres opcions presents a la societat nord-americana: desarmament (A), guerra freda (B) i guerra oberta (C). Pot semblar que la tria dels individus 2 i 3 és inconsistent, mentre que la tria de l’individu 1 seria la lògica de preferir la pau a la guerra. Ara bé, l’individu 2 bo i témer la guerra oberta (C) tem encara més un desarmament (A) que deixi enlaire l’hegemonia assolida pels Estats Units. L’individu 3, en canvi, més bel·licista en principi, té més por al cost econòmica d’una guerra freda a llarg termini que al desarmament. Aquesta paradoxa de votació la trobem enunciada pel Marquès de Condorcet en una obra del 1785 (http://gallica.bnf.fr/ark:/12148/bpt6k417181), però de fet fou detectada molt abans. En aquest sentit, Hägele & Pukelsheim (2001) comentaven tres passatges de l’obra de Ramon Llull sobre sistemes electorals (https://www.math.uni-augsburg.de/htdocs/emeriti/pukelsheim/2001a.html) que proven de superar aquesta paradoxa. El que es demana Arrow és si realment aquests mètodes d’agregació de gustos individuals (d’individus racionals) poden dur a una selecció racional per part de la comunitat. Aquesta qüestió Arrow la segueix en el marc d’una discussió en l’àmbit de l’economia del benestar. Així doncs, en aquest article, Arrow no es preocupa únicament del mètode de votació sinó també de mètodes de planificació econòmica basats en el pagament de compensacions.

La notació que segueix Arrow s’aplica a un conjunt d’individus racionals (1, 2, 3...) que han de triar entre en un conjunt d’alternatives mútuament excloents (x, y, z...). Aquests individus poden ser consumidors que trien entre diferents productes; empreses que trien entre diferents decisions corporatives; responsables econòmics de benestar que trien entre diferents distribucions de mercaderies i exigències laborals, etc. Concretament, si es tracta de triar entre estats socials, un estat social seria la descripció completa de la quantitat de cada mena de bé i servei en mans de cada individu, la quantitat de treball a realitzar per cada individu, la quantitat de cada recurs productiu per a cada mena d’activitat productiva, etc.

Del conjunt d’alternatives, cada individu haurà de considerar successivament tots els possibles parells d’alternatives. Per al parell x, y, podrà preferir x a y (xPy), preferir y a x (yPx) o romandre indiferent entre les dues (xIy = yIx). Arrow utilitza el símbol xRy per expressar la situació en la qual “x és preferida o indiferent a y”. Així per a tot parell x, y, serà vàlid xRy i/o yRx (si són vàlides totes dues és perquè xIy = yIx) (axioma I). Per a un trio d’alternatives (x, y, z), si es compleixen xRy i yRz, es complirà també xRz (axioma II).

Per a cada individu i resultarà una relació d’ordre Ri entre les diferents alternatives. L’ordre individual Ri compleix els axiomes I i II, però Arrow qüestiona la possibilitat de construir una relació d’ordre R per al conjunt de la societat. La “funció de benestar social” seria doncs el procés o normal pel qual, en resposta a un conjunt d’ordenaments individuals R1,...,Rn, es genera un ordenament social R.

Arrow assum una societat integrada per dos individus (1, 2) que han de triar entre tres alternatives (x, y, z). Tindrem, doncs, dos ordenaments individuals, R1 i R2. La “funció de benestar social” haurà de ser definida, doncs, per qualsevol combinació possible de R1 i R2 (condició 1). Aquesta funció haurà de complir també que si l’alternativa x augmenta en algun ordenament individual o no cau en cap cas, llavors si es verificava xPy abans del canvi, després també haurà de verificar-se xPy (condició 2).

Una altra condició que ha de complir la funció és la independència d’alternatives irrellevants (condició 3). És a dir, que les preferències socials entre les alternatives x i y depenen únicament de les preferències individuals entre x i y, essent irrellevants les preferències sobre terceres alternatives.

La funció també ha de complir la sobirania de cada individu sense imposicions, de manera que si xRy val per als dos individus, l’ordenament social mai no podrà contemplar yPx (condició 4).

De manera semblant, la funció no ha de ser dictatorial, en el sentit que l’ordenament de cap individu ha de determinar directament l’ordenament social prescindint dels altres ordenaments individuals (condició 5).

A partir d’aquestes cinc condicions, Arrow examina tres conseqüències:

- conseqüència 1: Si x’P1y’ i x’P2y’, la funció x’Py’

- conseqüència 2: Si x’P1y’ i y’P2x’ dóna lloc a x’Py’, llavors sempre que x’P1y’ es verificarà x’Py’

- conseqüència 3: Si x’P1y’ i y’P2x’ dóna lloc a x’Iy’.

Un colp demostrades les tres conseqüències, Arrow suposa els ordenaments xP1yP1z i zP2xP2y. D’acord amb la conseqüència 1, s’ha de complir xPy. Com que es donen yP1z i zP2y, d’acord amb la conseqüència 3, s’ha de complir yIz. Ara bé, si es compleixen xPy i yIz, també s’ha de complir xPz. Però, d’altra banda, de xP1z i zP2x, la conseqüència 3 condueix a xIz. Ací apareix una contracció entre xPz i xIz: no pot ser que l’ordenament social prefereix x a z i, alhora, sigui indiferent entre x i z.

Una funció social que complex les condicions 2-3, en afegir la condició 1, llavors ens du a violar la condició 4 o la condició 5. Dit d’una altra manera, si hi ha un mínim de tres alternatives entre les quals els membres de la societat són lliures d’ordenar de qualsevol manera, llavors tota funció social de benestar que satisfaci les condicions 2 i 3 i generi un ordenament social que satisfaci els axiomes I i II ha d’ésser o bé imposadora o dictatorial. La “paradoxa de Condorcet”, doncs, no seria eliminada per cap mètode de votació o representació proporcional. D’altra banda, Arrow conclou que cap mecanismes de mercat pot crear una tria social racional en tots els casos. La sobirania dels votants/consumidors és incompatible amb la racionalitat col·lectiva.

Aquesta incompatibilitat es pot resoldre de diverses maneres bo i evitant les mesures imposades i/o dictatorials: imposant restriccions a la tria individual o bé introduint un procés de comparació interpersonal d’ordenaments.

Aquest treball d’Arrow seria la base de la seva tesi doctoral, supervisada per Harold Hotelling, i del seu llibre, “Social Choice and Individual Values” (John Wiley & Sons; NY, 1951), considerada l’obra fundacional de la “teoria de l’elecció social”. L’obra tingué una segona edició revisada dotze anys després (Yale University Press, 1963).

En el 1972, la Reial Acadèmia Sueca de Ciències atorgava el Premi “Nobel” d’Economia a John R. Hicks i a Kenneth J. Arrow “per les llurs contribucions pioneres a la teoria d’equilibri econòmic general i la teoria del benestar”, bo i destacant d’Arrow que “la més important contribució és el seu ‘teorema de possibilitat’ segons el qual és impossible construir una funció de benestar social a partir de funcions de preferència individuals”.

A partir del teorema de (im)possibilitat d’Arrow, Amartya Sen havia enunciat en el 1970 “la impossibilitat d’un sistema liberal paretià” (http://www.journals.uchicago.edu/doi/10.1086/259614) és a dir d’un sistema social que simultàniament combini: a) un sentit mínim de llibertat; b) condueixi sempre a una eficiència de Pareto (un estadi de distribució de recursos en el qual sigui impossible una redistribució per millorar la situació d’un individu sense perjudicar un altre); c) sigui capaç de funcionar en qualsevol societat.

Pel que fa a l’aplicació del teorema d’Arrow en els sistemes electorals, a banda de les contribucions del mateix Arrow cal esmentar els treballs específics d’Allan Gibbard (1973, http://www.jstor.org/stable/1914083?origin=crossref&seq=1#page_scan_tab_contents) i Mark Satterthwaite (1975, http://www.sciencedirect.com/science/article/pii/0022053175900502?via%3Dihub).

El teorema de Gibbard-Satherthwaite s’aplica a eleccions amb tres o més candidats. Indefugiblement, qualsevol sistema electoral acaba caient en una o més d’aquestes tres situacions:

a) el sistema és dictatorial, és a dir que un individu pot escollir, en determinades condicions, el guanyador.

b) hi ha, si més no, un candidat que mai no pot guanyar (imposició prèvia)

c) el sistema és susceptible de vot tàctic, en el sentit que hi ha condicions sota les quals un votant amb coneixement de com votaran els altres i del sistema emprat tindrà un incentiu per votar d’una manera que no reflectirà les seves preferències.

La impossibilitat d’un sistema electoral que, alhora que no tingui imposicions prèvies, tampoc no condueixi a un vot tàctic, no significa és clar que tots els sistemes electorals siguin igualment imperfectes. És a partir dels teoremes d’Arrow i de Gibbard que es construeixen iniciatives com l’índex d’eficiència en la satisfacció del votant (VSE, http://electology.github.io/vse-sim/VSE/) del “Center for Election Science”.