Data fra SPSS til Stata og R

Der var engang hvor folk brugte SPSS. I dag bruger man enten Stata og/eller R, men det hænder desværre, at man finder et datasæt, der kun vil åbnes i SPSS (.sav-filer). Der findes dog måder hvorpå man kan få et datasæt fra SPSS til Stata såvel som R. I dette indlæg beskriver jeg et par af disse måder.

Hvis man har SPSS installeret, kan man åbne datasættet og gemme det i et format, der kan åbnes i Stata såvel som R. Proceduren her er simpel: Åben datasættet i SPSS, gå op under “File”, vælg “Save As” og gem filen som Comma delimited (*.csv). Denne fil kan importeres til Stata vha. følgende kommando (hvor datasættet selvfølgelig er gemt med navnet data):

insheet using "data.csv", delimiter(";")

I R kan man anvende kommandoen read.csv og gemme datasættet i en data frame. I dette tilfælde vil kommandoen for samme datasæt som i ovenstående eksempel være:

data = read.csv("data.csv", sep = ";")

Husk i begge tilfælde at angive et korrekt working directory forinden, så den kan finde datasættet. I SPSS er det muligt at gemme datasæt i Stata-format (.dta), hvor man, såfremt man gør det, kan åbne datasættet på normal vis i Stata efterfølgende. Jeg har dog flere gange oplevet at SPSS er gået ned når jeg har gjort det, hvorfor det ikke er noget jeg personligt kan eller vil anbefale.

Har man ikke SPSS installeret, findes der pakker der kan være en behjælpelig. I R kan man anvende foreign-pakken. Først henter vi og indlæser pakken, for derefter at importere datasættet til en data frame med read.spss:

install.packages("foreign")
library(foreign)
data = read.spss("data.sav", to.data.frame=TRUE)

Hvis man vil importere SPSS-filer direkte til Stata, kan man anvende usespss-pakken. Denne virker dog udelukkende på 32-bit versionen, hvorfor det er et par år siden jeg sidst anvendte den. Der kan læses mere om den teknik her.