Predir el resultat del 28 de novembre

La predicció dels resultats electorals és l’objectiu de les enquestes electorals. Els diaris i els mitjans de comunicació publiquen sondatges de forma periòdica. Tots tenen una reacció comuna: la sorpresa! Ara guanyen uns, ara els altres. Ara a molta distància i ara a poca. “Com pot ser que hi hagi tanta diferència entre una enquesta i una altra?”, exclamen molts.

Com hem dit ja alguna vegada, les enquestes només són una fotografia fixa d’un moment concret de la campanya. Cadascuna d’elles està subjecte a un marge d’error, derivat en gran part del nombre d’entrevistes que es realitzen. Així mateix, la famosa “cuina” que cada casa d’empreses aplica resulta un “forat negre” que fa difícil saber en quina mesura les enquestes que es publiquen l’encerten més o menys. Això sí: totes s’hi intenten apropar el màxim possible.

No obstant això, l’estadística permet en certa manera “superar” aquesta limitació. Sabem que les enquestes són imperfectes, però diferents enquestes “juntes” alleugereixen aquesta imperfecció. L’estadística fa la resta. Això és el que ha fet Xavier Fernández i Marín, antic professor nostre a la UPF i que molt amablement ens permet publicar les dades en El Pati.

Expliquem-ho bé. Si agaféssim la intenció de vot de les diferents enquestes i les agrupéssim en un gràfic, ens sortiria això:

Com ràpidament podeu comprovar, es fa difícil d’interpretar. La variació entre les diferents “cases” i enquestes és àmplia i és perillós afirmar les tendències que segueixen els partits.

Res d’insalvable. Aplicant estadística bayesiana (veure nota a peu d’article) s’és capaç de construir quina és la tendència electoral de cada partit en base als resultats de les enquestes preelectorals. Com a resultat, s’obté aquests gràfics (punxeu a la imatge per veure la mida original).

Els punts són les enquestes preelectorals que s’han fet. La línia representa la tendència de vot. Es pot veure clarament l’augment de suport electoral cap a CiU, la davallada del PSC, d’ERC i d’CV i l’estabilitat de PP. També es fa palès com el suport a RLS (Reagrupament, Laporta i Solidaritat) ha anat creixent al llarg del temps (una advertència: l’eix de les Y, el % de vot, té una escala diferent per cada partit perquè s’apreciïn bé les diferències).

Són només alguns comentaris. Aquestes dades (i les enquestes que vagin sortint) tindran molt més suc. A partir d’avui El Pati Descobert us oferirà una nova secció fins el 28 de novembre, dia de les eleccions catalanes. Cada vegada que es publiqui una enquesta, s’inclouran les dades i s’analitzarà si aquella enquesta realment es desvia molt o no de la tendència general mostrada per la resta (hem obert una pestanya en què anirem introduint els diferents resultats).

Sense la intensió de pecar de pretensiosos, podem dir que es tracta d’uns càlculs sense precedents en l’anàlisi del comportament electoral a Catalunya. Servirà als lectors d’aquest bloc per interpretar millor la realitat i als partits per saber quina és la tendència (o l’impacte) que té el seu missatge.

És per aquest motiu que us convidem a seguir-nos i a acompanyar-nos en aquest fascinant camí: el d’acostar-nos a què passarà durant la nit electoral.

——————————-

Nota metodològica (pels curiosos i entesos): L’estimació del suport de cada partit es fa fent servir inferència bayesiana. A través d’R i JAGS se simulen els paràmetres d’interès fent servir mètodes Monte Carlo i cadenes de Markov (MCMC). Amb aquests paràmetres és possible estimar el suport latent de cada partit (el suport que no coneixem, però que podem aproximar-nos-hi en base a les enquestes). Podeu provar de descarregar les dades i reproduir els resultats.

9 Responses to “Predir el resultat del 28 de novembre”


  1. 1 Albert Setembre 15, 2010 a les 10:22 pm

    Per desgràcia, crec que la “cuina” té l’habilitat de desvirtuar en extrem els resultats. Per exemple, per Internet ha circulat que una enquesta interna donava entre 8 i 10 escons a Solidaritat mentre que a la darrera de La Vanguardia no els donava representació.
    Seguirem de prop aquests anàlisis de les enquestes.

    • 2 tonirodon Setembre 16, 2010 a les 9:09 am

      Albert,

      Jo no diria tant que “desvirtua”. Sens dubte les enquestes també poden tenir una finalitat política. Però moltes s’hi juguen el prestigi. Des de dins hi ha com una mena de tensió per reconciliar aquests dos aspectes…
      Precisament la virtut d’aquesta anàlisi és que supera aquests “problemes” de la cuina.

  2. 3 gustavo Setembre 16, 2010 a les 9:07 am

    Muy interesante. Seguiré la evolución
    Gracias

  3. 4 Jordi Solà Setembre 16, 2010 a les 9:44 am

    Només una observació sobre això que el suport a RLS ha anat creixent al llarg del temps. Com que hi ha una llarga sèrie de 0% i apareixen de sobte, a mitjan 2009, crec que no toca parlar de creixement.

    El moment en que apareixen és el moment en que se’ls codifica separadament. Fins aleshores o bé no es podia dir que els votaries perquè no existien o bé se’ls deixava dins de la categoria d’altres i no els podies identificar. Per tant la seva sèrie de dades hauria de començar a mitjan 2009, no abans.

    • 5 tonirodon Setembre 16, 2010 a les 9:51 am

      Jordi,

      Sí, sí. En som conscients. De fet, per ser exactes s’haurien de separar. El proper model fixarà a 0 fisn que R es crea i a partir d’aquí veurem com evoluciona.

      Gràcies!

    • 6 marcguinjoan Setembre 16, 2010 a les 11:28 am

      De fet Jordi si et fixes en l’evolució dels gràfics de vot a RLS i del vot a Altres, en el moment en què RLS apareix per primer cop, a finals del 2009, és el moment en què el vot a Altres sofreix una important devallada…

      • 7 Jordi Solà Setembre 16, 2010 a les 12:54 pm

        És clar que pots tractar d’interpretar les dades correctament atenent a les dades d’altres. Però no veig perquè hauries de considerar només el període final d’altres, que és coherent amb aquesta interpretació, i no la totalitat del període, força més erràtic.

        En tot cas, no anava per aquí jo. La meva observació anava en el sentit que la línia de tendència resultant a RLS no és procedent perquè la sèrie de valors es dicotòmica i es divideix en un moment inicial (no hi ha valor) i un moment final (hi ha valor). Si la sèrie 0,0,0,0,0,1,1,1,1,1 la consideres unitàriament tens una tendència ascendent. Si la consideres separadament tens un primer moment sense valors i un segon moment de completa estabilitat.

      • 8 tonirodon Setembre 16, 2010 a les 1:27 pm

        Sí… és el que dèiem… en tot cas caldrà veure si aquesta “estabilitat” és “completa”. A la propera actualització ho fem!

  4. 9 marcguinjoan Setembre 16, 2010 a les 2:20 pm

    Jordi, efectivament tens tota la raó. El gràfic d’RLS s’hauria de presentar a partir del primer moment en què en tenim enquestes. Abans és possible -i probable: RCAT ja fa temps que funciona- que tinguessin suport latent però mai ningú s’havia pres la molèstia de donar-ne els resultats desagregats amb l’opció Altres…


Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s




La sentència

"La independència permetria als catalans estalviar-se el psiquiatre i ser feliços".

Jaume Cabré.

El nostre Twitter

Vull subscriure’m

Uneix-te al nostre grup del facebook

Entrades més vistes

Creative Commons License
El Pati Descobert està subjecte a una llicència de Reconeixement-No comercial-Sense obres derivades 3.0 Espanya de Creative Commons

web counter

%d bloggers like this: