Hvordan Obama kranglet med data for å vinne sin andre periode

Dette er del 2 av vår dybdeprofil av big data-teknikkene som ga Barack Obama en ny periode i embetet. Les del 1.





T han eksperimenterer

Da Jim Messina ankom Chicago som Obamas nye kampanjeleder i januar 2011, påla han et mandat til rekruttene sine: de skulle ta avgjørelser basert på målbare data. Men det betydde ikke helt det den hadde fire år før. Kampanjen i 2008 hadde vært datadrevet, som folk likte å si. Dette reflekterte et prinsipielt imperativ for å utfordre det politiske etablissementet med en empirisk tilnærming til valgkamp, ​​og det ble sterkt påvirket av David Plouffe, 2008-kampanjelederen, som elsket beregninger, regneark og resultatrapporter. Plouffe ville vite: Hvor mange av et feltkontors frivillige skift hadde blitt fylt forrige helg? Hvor mye penger ga den annonsekampanjen inn?

Men til tross for all sin avhengighet av data, hadde Obama-kampanjen i 2008 forblitt isolert fra den viktigste metodiske nyvinningen i det 21. århundres politikk. I 1998 gjennomførte Yale-professorene Don Green og Alan Gerber den første randomiserte kontrollerte studien i moderne statsvitenskap, og ga New Haven-velgere til å motta partipolitiske valgpåminnelser via post, telefon eller personlig besøk fra en søksmann og målte hvilken gruppe som så størst. økning i valgdeltakelse. Den påfølgende bølgen av felteksperimenter av Green, Gerber og deres tilhengere fokuserte på mobilisering, testing av konkurrerende kontaktmåter og kom-ut-av-stemmen for å se hvilke som var mest vellykkede.



Den første Obama-kampanjen brukte funnene fra slike tester til å finjustere samtaleskripter og undersøkelsesprotokoller, men den omfavnet aldri selve den eksperimentelle revolusjonen. Etter at Dan Wagner flyttet til DNC, bestemte partiet seg for å begynne å utføre sine egne eksperimenter. Han håpet at komiteen kunne bli en pådriver for forskning for Det demokratiske partiet.

Til det formål hyret han inn Analyst Institute, et Washington-basert konsortium grunnlagt under AFL-CIOs ledelse i 2006 for å koordinere feltforskningsprosjekter på tvers av valgkampen og distribuere funnene blant allierte. Mye av den eksperimentelle verdenens forskning hadde fokusert på velgerregistrering, fordi det var lett å måle. Gjennombruddet var at registreringen ikke lenger måtte tilnærmes passivt; arrangørene trengte ikke bare å vente på at de avmeldte skulle komme ut av anonymiteten, signere et skjema og, håpet de, stemme. Nye teknikker gjorde det mulig å intelligent profilere ikke-velgere: kommersielle datavarehus solgte lister over alle voksne i stemmerett alder, og sammenligning av disse listene med registreringslister avslørte kvalifiserte kandidater, hver knyttet til en hjemmeadresse som en søknad kunne sendes til. Ved å bruke mikromålrettingsmodeller ble det identifisert hvilke ikke-registranter som mest sannsynlig var demokrater og hvilke republikanere.

Obama-kampanjen innebygde samfunnsvitere fra Analyst Institute blant sine ansatte. Partiets embetsmenn visste at å legge til nye demokratiske velgere til registreringslistene var et avgjørende element i deres strategi for 2012. Men allerede kampanjen hadde ambisjoner utover å bare endre ikke-deltakende borgers oppførsel gjennom registrering og mobilisering. Den ønsket å ta på seg det mest irriterende problemet i politikken: å endre velgernes mening.



Utvidelsen av data på individnivå hadde muliggjort den typen testing som kunne bidra til det. Eksperimentører hadde typisk beregnet den gjennomsnittlige effekten av intervensjonene deres over hele befolkningen. Men etter hvert som kampanjer utviklet dype portretter av velgerne i databasene deres, ble det mulig å måle egenskapene til menneskene som faktisk ble rørt av et eksperiment. En serie tester i 2006 av kvinnegruppen Emily's List hadde illustrert potensialet ved å gjennomføre kontrollerte forsøk med mikromåldatabaser. Da gruppen sendte direktereklame til fordel for demokratiske guvernørkandidater, vek den knapt de som hadde poengsum plassert i midten av partisanspekteret; det hadde en langt større innvirkning på de som hadde blitt profilert som myke (eller ikke-ideologiske) republikanere.

Den testen, og andre som fulgte, demonstrerte begrensningene ved tradisjonell målretting. Slike teknikker hviler på en rekke langvarige forutsetninger - for eksempel at midtveisfarere var de mest overbevisende og at sjeldne velgere var mest sannsynlig å bli fanget i en gå-ut-av-stemmen. Men eksperimentene introduserte ny usikkerhet. Folk som ble identifisert med 50 prosent sannsynlighet for å stemme på en demokrat, kan faktisk bli splittet mellom de to partiene, eller de kan se ut som sentrister bare fordi ingen data knyttet til deres poster presset en partisk prediksjon i en eller annen retning. Poengsummene i midten er menneskene vi vet mindre om, sier Chris Wyant, en feltarrangør fra 2008 som ble kampanjens valgsjef i Ohio fire år senere. I hvilken grad vi gjettet om overtalelse var ikke tapt for noen av oss.

En måte kampanjen forsøkte å identifisere de modneste målene på, var gjennom en serie av det Analytikerinstituttet kalte eksperimentinformerte programmer, eller EIPs, designet for å måle hvor effektive ulike typer meldinger var til å flytte opinionen.



Den tradisjonelle måten å gjøre dette på hadde vært å prøve temaer og språk i fokusgrupper og deretter teste vinnermaterialet i meningsmålinger for å se hvilke kategorier av velgere som reagerte positivt på hver tilnærming. Eventuell innsikt ble forvrengt av de kunstige innstillingene og av de små utvalgene av demografiske undergrupper i tradisjonelle meningsmålinger. Tar du betydelige ressursbeslutninger basert på 160 personer? spør Mitch Stewart, direktør for den demokratiske kampanjegruppen Organizing for America. Er ikke det galt? Og det har folk gjort i flere tiår!

Et eksperimentelt program ville bruke disse trinnene til å utvikle en rekke potensielle meldinger som kan bli utsatt for empirisk testing i den virkelige verden. Eksperimentører vil tilfeldig tildele velgere til å motta varierte sekvenser av direktereklame – fire stykker om samme politikktema, som hver foretar en litt annen sak for Obama – og deretter bruke pågående spørreundersøkelser for å isolere egenskapene til de hvis meninger endret seg som et resultat.

I mars brukte kampanjen denne teknikken til å teste ulike måter å fremme administrasjonens helsepolitikk på. En serie med utsendelser beskrev Obamas reguleringsreformer; en annen informerte velgerne om at de nå hadde rett til gratis regelmessige kontroller og burde avtale en. Eksperimentet avslørte hvor mye velgerresponsen var forskjellig etter alder, spesielt blant kvinner. Eldre kvinner tenkte mer på retningslinjene når de fikk påminnelser om forebyggende behandling; yngre kvinner likte dem mer når de ble fortalt om prevensjonsdekning og nye regler som forbød forsikringsselskaper å belaste kvinner mer.



Da Paul Ryan ble kåret til den republikanske billetten i august, skyndte Obamas rådgivere ut en EIP som sammenlignet forskjellige angrepslinjer om Medicare. Resultatene var overraskende. Velgerne [hadde virket] veldig uelastiske, sier Terry Walsh, som koordinerte kampanjens meningsmåling og betalte medieutgifter. Faktisk, når vi gjorde Medicare EIPs, fikk vi positive bevegelser som var veldig oppmuntrende, fordi det var på et tidspunkt da vi ikke så mye bevegelse i velgerne. Men den bevegelsen kom fra hold der en tradisjonell kampanje aldri ville ha gått på jakt etter sinn som den kunne endre. Obama-teamet fant ut at velgere mellom 45 og 65 var mer sannsynlig å endre sine syn på kandidatene etter å ha hørt Obamas Medicare-argumenter enn de over 65, som for øyeblikket var kvalifisert for programmet.

En lignende strategi for å målrette en uventet befolkning dukket opp fra en EIP i juli som testet Obamas meldinger rettet mot kvinner. Velgerne som var mest lydhøre for kampanjens argumenter om likelønnstiltak og kvinners helse, var de hvis sannsynlighet for å støtte presidenten ble skåret til bare 20 og 40 prosent. Disse resultatene antydet at de sannsynligvis delte republikanske holdninger; men her var en ting som kunne trekke dem til Obama. Som et resultat, da Obama avduket et direkte-postspor som bare tok for seg kvinnespørsmål, var det ikke for å øke interessen blant kjernedelene av den demokratiske koalisjonen, men for å strekke seg etter konservative som var i strid med partiet deres i kjønnsproblematikk. Hele målet med kvinnebanen var å plukke stemmer til Romney, sier Walsh. Vi var i stand til å overtale folk som falt lavt på kandidatstøttepoeng hvis vi ga dem en spesifikk beskjed.

Samtidig forfulgte Obamas kampanje et andre, enda mer dristige eventyr innen overtalelse: en-til-en-interaksjon. Tradisjonelt har kampanjer begrenset deres overtalelsesarbeid til kanaler som massemedia eller direktereklame, hvor de kan kontrollere presentasjon, språk og målretting. Å sende frivillige for å overtale velgere ville bety å tvinge dem til å samhandle med motstandere, eller med velgere som var usikre fordi de var fremmedgjort fra politikk i delikate saker som abort. Kampanjer har typisk motstått å gi fra seg kontrollen over interaksjoner på bakkenivå med velgere for å risikere slike potensielt brennbare situasjoner; de følte at de ikke visste nok om sine støttespillere eller frivillige. Du kan ha en negativ innvirkning, sier Jeremy Bird, som fungerte som nasjonal visedirektør for Organizing for America. Du kan skade kandidaten din.

I februar forsøkte Obama-frivillige imidlertid 500 000 samtaler med mål om å vinne nye støttespillere. Velgere som var blitt tilfeldig valgt fra en gruppe identifisert som overbevisende ble spurt etter en telefonsamtale som begynte med en frivillig lesing fra et manus. Vi opplever definitivt at enkelte mennesker beveget seg mer enn andre mennesker, sier Bird. Analytikere identifiserte egenskapene deres og gjorde dem til kjernen i en overtalelsesmodell som spådde, på en skala fra 0 til 10, sannsynligheten for at en velger kunne bli trukket i Obamas retning etter en enkelt frivillig interaksjon. Eksperimentet lærte også Obamas feltavdeling om de frivillige. De i California, som alltid hadde hatt en eksepsjonelt moden frivillig organisasjon for en stat uten slagmark, viste seg å være spesielt overbevisende: velgere som ble oppringt av Californians, uansett hvilken stat de var i seg selv, var mer sannsynlig å bli Obama-tilhengere.

Alex Lundry opprettet Mitt Romneys datavitenskapsenhet. Det var mindre enn en tidel av størrelsen på Obamas analyseteam.

Med disse funnene i hånden, ble Obamas strateger trygge på at de ikke lenger var begrenset til reklame som en kanal for overtalelse. De begynte å sende trente frivillige for å banke på dører eller ringe med mål om å endre mening.

Det dramatiske skiftet i valgkampkulturen ble følt på gata, men det var mulig bare på grunn av fremskritt innen analyse. Chris Wegrzyn, en utvikler av databaseapplikasjoner, utviklet et program med kodenavnet Airwolf som matchet fylkes- og delstatslister over personer som hadde bedt om poststemmesedler med kampanjens liste over e-postadresser. Sannsynligvis ville Obama-tilhengere få regelmessige påminnelser fra sine lokale feltarrangører, be dem om å returnere stemmesedlene sine, og, når de først hadde fått, en melding som takker dem og foreslår andre måter å være involvert i kampanjen på. Den lokale arrangøren ville daglig motta lister over velgerne på hans eller hennes gressbane som hadde utestående stemmesedler slik at kampanjen kunne følge opp med personlig kontakt på telefon eller på dørstokken. Det er en grunnleggende måte å binde sammen online og offline verden, sier Wagner.

Wagner vendte imidlertid oppmerksomheten utover feltet. I juni 2011 var han analysesjef for kampanjen og hadde begynt å gå rundt i de andre enhetene ved hovedkvarteret, fra innsamling til kommunikasjon, og tilbød seg å hjelpe til med å løse problemene deres med data. Han så for seg analyseavdelingen – nå en stab på 54 personer, plassert i et vinduløst kontor kjent som Cave – som et internt konsulentselskap med andre deler av kampanjen som sine kunder. Det er en prosess for å hjelpe folk til å lære om verktøyene slik at de kan være en deltaker i prosessen, sier han. Vi bygde i hovedsak produkter for hver av de forskjellige avdelingene som var sammenkoblet med en massiv database vi hadde.

Flow

Da stillingsannonser som søkte spesialister innen tekstanalyse, databasert annonsering og netteksperimenter kom ut av den sittende operatørens kampanje, så Mitt Romneys rådgivere ved republikanernes hovedkvarter i Bostons North End med en kombinasjon av ærefrykt og forvirring. Gjennom primærvalgene hadde Romney sett ut til å være den eneste republikaneren som kjørte en kampanje fra det 21. århundre, og banket metodisk tidligstemmer i stater som Florida og Ohio før hans uorganiserte motstandere kunne etablere operasjoner der.

Men den republikanske vinnerens relative sofistikering i primærvalgene motbeviste mangel på ekspertise sammenlignet med Obama-kampanjen. Siden sin første kampanje for guvernør i Massachusetts, i 2002, hadde Romney stolt på TargetPoint Consulting, et Virginia-firma som da var en pioner i å koble informasjon fra forbrukerdatavarehus til velgerregistreringsposter og bruke den til å utvikle prediktive modeller på individuelt nivå. Det var TargetPoints administrerende direktør, Alexander Gage, som hadde laget begrepet mikromålretting for å beskrive prosessen, som han modellerte etter bedriftsverdenens tilnærming til håndtering av kunderelasjoner.

Slike teknikker hadde gitt George W. Bushs gjenvalgskampanje en betydelig fordel i målrettingen, men republikanerne hadde gjort lite for å institusjonalisere denne fordelen i årene siden. I 2006 hadde demokratene ikke bare matchet republikanerne når de tok i bruk kommersielle markedsføringsteknikker; de hadde kommet videre ved å integrere metoder utviklet i samfunnsvitenskapene.

Romneys rådgivere visste at Obama bygde innovative interne dataanalyseavdelinger, men de følte ikke behov for å matche disse aktivitetene. Jeg tror ikke vi trodde, i forhold til markedsplassen, at vi kunne være best på data internt hele tiden, sa Romneys digitale direktør, Zac Moffatt, i juli. Vår idé er å finne de beste firmaene å jobbe med oss. Som et resultat forble Romney avhengig av TargetPoint for å utvikle velgersegmenter, ofte bare én gang, og deretter levere dem til kampanjens databaser. Det var strukturen Obama hadde forlatt etter å ha vunnet nominasjonen i 2008.

I mai tok en TargetPoints visepresident, Alex Lundry, permisjon fra sin stilling i firmaet for å sette sammen en datavitenskapelig enhet i Romneys hovedkvarter. For å avrunde teamet sitt hentet Lundry inn Tom Wood, en postdoktorstudent ved University of Chicago i statsvitenskap, og Brent McGoldrick, en veteran fra Bushs kampanje i 2004 som hadde forlatt politikken for konsulentfirmaet Financial Dynamics (senere FTI Consulting), hvor han hjalp finans-, helse- og energiselskaper til å kommunisere bedre. Men Romneys datavitenskapsteam var mindre enn en tidel av størrelsen på Obamas analyseavdeling. Uten en stor intern stab til å håndtere de enorme nasjonale datasettene som gjorde det mulig å teste og spore innbyggere, prøvde Romneys dataforskere aldri å utdype forståelsen av individuell atferd. I stedet fikserte de på å prøve å låse opp et stort, vedvarende mysterium, som Lundry rammet inn på denne måten: Hvordan kan vi få en følelse av om denne reklamen fungerer?

Du får vanligvis GRP og sporingsmålinger, sier han og viser til brutto ratingpoeng som er den grunnleggende enheten for å måle TV-kjøp. Det er et veldig stort årsakssprang du må gjøre fra det ene til det andre.

Lundry bestemte seg for å fokusere på mer håndterbare måter å måle det han kalte informasjonsflyten. Teamet hans konverterte emner for politisk kommunikasjon til diskrete enheter de kalte enheter. De klassifiserte i utgangspunktet 200 av dem, inkludert problemer som bilindustriens redningsaksjon, kontroverser som den rundt føderal finansiering av solenergiselskapet Solyndra, og slagord som krigen mot kvinner. Da et nytt konsept (som Obamas direkte bemerkning, under en tale om vår felles avhengighet av infrastruktur, at du ikke bygde det) dukket opp som en del av valgårsleksikonet, la analytikerne det til listen. De sporet hver enhet på National Dialogue Monitor, TargetPoints system for å måle frekvensen og tonen som bestemte emner nevnes med på tvers av alle medier. TargetPoint integrerte også innhold samlet inn fra avisnettsteder og tekstutskrifter av kringkastede programmer. Lundrys team hadde som mål å undersøke hvordan hver enhet klarte seg over tid i hver av to kategorier: den uformelle sfæren til sosiale medier, spesielt Twitter, og det journalistiske produktet som kampanjer kaller opptjent pressedekning.

Til syvende og sist ønsket Lundry å vurdere innvirkningen hver type offentlig oppmerksomhet hadde på det som betydde mest for dem: Romneys posisjon i hesteveddeløpet. Han vendte seg til vektor-autoregresjonsmodeller, som aksjehandlere bruker for å isolere påvirkningen av enkeltvariabler på markedsbevegelser. I dette tilfellet så Lundrys team etter mønstre i forholdet mellom National Dialogue Monitors data og Romneys tall i Gallups daglige sporingsmålinger. I slutten av juli trodde de at de hadde identifisert en tre-trinns prosess de kalte Wood's Triangle.

Innen tre eller fire dager etter en ny enhets inntreden i samtalen, enten gjennom betalte annonser eller gjennom nyhetssyklusen, var det mulig å lage en velinformert hypotese om hvorvidt emnet var sannsynlig å vinne oppmerksomhet i media ved å spore om det genererte Twitter skravling. Den uformelle samtalen blant eliter i politisk klasse førte vanligvis til tradisjonell trykk- eller kringkastingsdekning én til to dager senere, og det kan igjen ha innvirkning på hesteveddeløpet. Vi så denne prosessen om og om igjen, sier Lundry.

De begynte å tenke på annonser som et sjokk for systemet – en måte å enten introdusere et nytt emne eller gjenopprette fokus på et område der eliteinteressen hadde falmet. Hvis en enhet ikke fikk sin egen energi – som da republikanerne i løpet av sommeren anklaget at Det hvite hus hadde gitt avkall på arbeidskravene i de føderale velferdsreglene – ville Lundry foreslå et nytt sjokk til systemet med en annen annonse om emnet fem til syv dager senere. Etter 12 til 14 dager, fant Lundry ut, hadde en enhet beveget seg gjennom systemet og brukt opp sin evne til å flytte opinionen – så han ville anbefale kampanjens kommunikasjonsmedarbeidere at de gikk videre til noe nytt.

Denne innsikten tilbød kampanjefunksjonærer en teori om informasjonsflyt, men de ga ingen veiledning i hvordan de skulle fordele kampanjeressurser for å vinne valgkollegiet. Forutsatt at Obama hadde overlegne data og analyser på bakkenivå, prøvde Romneys kampanje å utnytte sine rivalers strategi for å forme sin egen; hvis demokratene trodde at en stat eller et mediemarked var konkurransedyktig, var det kanskje et bevis på at republikanerne burde tenke det også. Vi var nødvendigvis reaktive, for vi satt sammen flyet mens det lettet, sier Lundry. De hadde et enormt forsprang på oss.

Romneys politiske avdeling begynte å holde regelmessige møter for å se på hvor i landet Obama-kampanjen fokuserte ressurser som annonsedollar og presidentens tid. Målet var å prøve å spå om beregningene bak disse avgjørelsene. Det var i hovedsak måten Microsofts Bing nærmet seg Google på: å prøve å reversere markedslederens kode ved å studere det synlige resultatet. Vi ser på hvor presidenten går, sa Dan Centinello, Romneys visepolitiske direktør som hadde tilsyn med møtene, i løpet av sommeren.

Obamas mediekjøpsstrategi viste seg å være spesielt vanskelig å tyde. I begynnelsen av september, som en del av sin standard anmeldelse, la Lundry merke til at uken etter det demokratiske konvensjonen hadde Obama sendt 68 annonser i Dothan, Alabama, en by nær Florida-grensen. Dothan var et av landets minste mediemarkeder, og Alabama en av de tryggeste republikanske statene. Selv om området var kjent for erfarne annonsekjøpere som et av stedene der et mediemarked krysser statsgrenser, nådde Dothan TV-stasjoner bare rundt 9000 velgere i Florida, og rundt 7000 av dem hadde stemt på John McCain i 2008. Dette er en vanskelig -kjerne republikansk mediemarked, sier Lundry. Den er utrolig liten. Men de annonserte der.

Romneys rådgivere kan ha dannet en teori om det bredere mediemiljøet, men uansett hva som sendte Obama på jakt etter en liten lomme med stemmer var utenfor deres måling. Vi kunne fortelle, sier McGoldrick, at det var noe i algoritmene som fortalte dem hva de skulle kjøre.

I morgen: Del 3 – Fellesskapet

gjemme seg