Introduktion til eksport af regressionstabeller med estout i Stata

Det kan være forbundet med en masse unødigt arbejde at skulle konstruere regressionstabeller fra bunden, når man skal formidle sine statistiske analyser fra Stata. Der findes heldigvis flere pakker til Stata, der kan være én behjælpelig med at få eksporteret regressionstabeller fra Stata til Word (eller LaTeX, HTML osv.). En af de bedste pakker til at gøre dette er estout (Jann 2005 2007).

Dette indlæg 1) introducerer hvordan man med pakken estout kan eksportere regressionstabeller fra Stata og 2) giver en oversigt over hvilke aspekter man skal være opmærksom på, når man integrerer en eksporteret regressionstabel.

1. Installation af estout

Den nemmeste måde at installere estout på, er ved at skrive følgende i kommandolinjen:

. ssc install estout, replace

Er estout allerede installeret, tjekker Stata om dine filer er opdateret. Såfremt estout ikke er installeret og det ikke resulterer i installationen af estout, kan det også installeres manuelt.

2. Konstruktion af regressionstabel

Det smarte ved estout er, at når vi gennemfører en regression, gemmes estimaterne i hukommelsen, og vi kan så få dem vist i en tabel (skal vi have flere modeller i samme tabel, klarer estout dermed også det). På den måde kan vi også få vist det mest essentielle, uden at få hele standard outputtet, der gives i Stata.

Som et eksempel vil jeg bruge data fra tabel 1 i Matthews (2000, 37). Der er tale om det klassiske eksempel med korrelationen mellem storke og fødselsraten. Datasættet kan, for interesserede, åbnes i Stata med:

. use http://erikgahner.dk/files/data/storksbabies.dta

Det første vi gør er at rydde hukommelsen for eventuelle tidligere gemte regressioner. Dette er ikke nødvendigt hvis hukommelsen i forvejen er tom, men ikke desto mindre er det en sund vane, når man begynder på konstruktionen af en ny tabel:

. eststo clear

Det eneste du så skal gøre nu for at gemme en regression i hukommelsen, er at skrive “eststo:” før kommandoen for din regression. På den måde gemmes resultaterne fra din estimation. I vores storkeeksempel vil det sige:

. eststo: reg birthrate storks

Har du flere regressionsmodeller, der skal være i din tabel, skal du bruge eststo-kommandoen flere gange. Altså:

. eststo: reg y x1
. eststo: reg y x1 x2

Derefter kan vi i vores storkeeksempel skrive esttab, for at få vist regressionstabellen. Til dette har vi en række muligheder (“options”), vi ligeledes kan anvende, for eksempel som i nedenstående, hvor vi fortæller Stata, at vi også gerne vil have vist determinationskoefficient (r2) og standardfejl (se):

. esttab, r2 se

----------------------------
                      (1)   
                birthrate   
----------------------------
storks             0.0288** 
                (0.00940)   

_cons               225.0*  
                  (93.56)   
----------------------------
N                      17   
R-sq                0.385   
----------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

For en oversigt over hvilke muligheder der er, se hjælpefilen til esttab (help esttab). Tabellen er meget mere overskuelig end det normale output fra Stata, og vi har mulighed for nemt at eksportere ovenstående til for eksempel Word.

3. Eksport af regressionstabel

Det er muligt at eksportere ens regressionstabel til forskellige dokumentformater, hvor den mest udbredte er den frit tilgængelige standard .rtf (Rich Text Format). Det er ikke muligt at eksportere ens tabel i .doc eller .docx (man kan selvfølgelig altid blot åbne .rtf-filen efterfølgende i Word og gemme den som .docx).

Ved at tilføje "using" til esttab-kommandoen samt angive filnavn og filtype, gemmer Stata filen med tabellen i ens Working Directory. Vil vi gemme ovenstående tabel i en rtf-fil med navnet birthrate, skriver vi følgende:

. esttab using birthrate.rtf, r2 se

Dette giver et output a la:


	(1)
	birthrate

storks	0.0288^**
	(0.00940)

_cons	225.0^*
	(93.56)

N	17
R²	0.385

Standard errors in parentheses ^* p < 0.05, ^ p < 0.01, ^* p < 0.001

For at opsummere, har vi til nu gjort følgende:

// Installerer estout
. ssc install estout, replace

// Nulstiller hukommelsen
. eststo clear

// Åbner datasæt til eksemplet
. use http://erikgahner.dk/files/data/storksbabies.dta

// Gemmer regression i hukommelsen
. eststo: reg birthrate storks

// Viser regressionstabel (med r2 og standardfejl)
. esttab, r2 se

// Eksporterer regressionstabel
. esttab using birthrate.rtf, r2 se

For et ekstra eksempel på eksport af en regressionstabel med estout, kan jeg henvise til Sønderskov (2011, 168f). Den tabel vi har eksporteret, er dog på ingen måde færdig endnu, da der er brug for visse modifikationer.

4. Tilpasning af regressionstabel

Jeg har haft den fornøjelse at læse flere opgavebesvarelser, hvor estout er anvendt til at eksportere regressionstabeller til brug i Word. Jeg har i den forbindelse også haft mulighed for at identificere nogle af de faldgruber, der er forbundet med brugen af estout. For at brugen af estout skal være tilfredsstillende, er det ikke tilstrækkeligt blot at eksportere tabellen, inkludere den i sit dokument og stoppe legen der. Der er med andre ord et par forhold, man skal notere sig.

I. Læs og applicer råd i Beck (2010)
Der er et par gode pointer i den pågældende artikel. Sørg for at tabellen er meningsfuld og letlæselig. Sørg for at variabelnavne og lignende indhold i tabellen giver mening for dig selv såvel som læseren. Lad desuden være med at angive flere decimaler end dem der har betydning. (Råd nr. 9 i artiklen ser jeg bort fra i denne sammenhæng.)

II. Oversæt til dansk
Hvis ens besvarelse er på dansk, skal tabellen også være det. Hvis du er i tvivl om hvad et statistisk begreb hedder på dansk, kan du give denne ordliste et visit. Husk ligeledes at anvende korrekt decimalseparator (komma hvis dit dokument er på dansk).

III. Tilføj tabeloverskrift
Alle tabeller skal have en titel. Husk det.

IV. Tilpas andre tabeller
Såfremt der i dit dokument er andre tabeller, skal der ganske logisk være en konsistent brug af skrifttype, skriftstørrelse, afstande m.v., der er identisk i alle tabeller. Det betyder med andre ord, at regressionstabellen skal tilpasses andre tabeller, der måtte være i din besvarelse. Lad være med at bruge Times New Roman i den ene tabel, for derefter at bruge Calibri i den næste tabel.

5. Afsluttende bemærkning

Jeg har i nærværende introduktion til hvordan man eksporterer regressionstabeller fra Stata begrænset mig til et meget simpelt (og forhåbentligt pædagogisk) eksempel, men fremgangsmåden er akkurat den samme ved mere omfangsrige regressionstabeller (med flere modeller). For mere information omkring estout henvises der til estout: Making Regression Tables in Stata, samt hjælpefunktionen:

. h estout

Skulle noget af ovenstående forvolde problemer, er du velkommen til at skrive en kommentar til indlægget.

Referencer

Beck, N. 2010. “Making Regression and Related Output More Helpful to Users.” The Political Methodologist 18(1):4-9.

Jann, B. 2005. “Making regression tables from stored estimates.” The Stata Journal 5(3):288-308.

Jann, B. 2007 “Making regression tables simplified.” The Stata Journal 7(2):227-244.

Matthews, R. 2000. “Storks Deliver Babies (p = 0.008).” Teaching Statistics 22(2):36-38.

Sønderskov, K. M. 2011. Stata - en praktisk introduktion. København: Hans Reitzels Forlag.