Unik identifikationsvariabel i R og Stata

Hvis du står og mangler en identifikationsvariabel i dit datasæt/din data frame, altså en variabel hvor hver række har en unik værdi, er det heldigvis nemt at lave dette i R såvel som i Stata. I R overskriver du blot din data frame (i dette tilfælde kaldt din.dataframe) med en ny data frame, der har en variabel, som indeholder rækkenummeret for hver række. Derefter navngiver du variablen:

[code] din.dataframe = cbind(1:NROW(din.dataframe), din.dataframe)
colnames(din.dataframe)[1] = ‘id’
[/code]

I Stata er det endnu nemmere og kan gøres med følgende:

[code] . g id = _n
[/code]

I begge ovenstående tilfælde er variablen kaldt for id.


Leave a Reply

Your email address will not be published.