Skip to content
Snippets Groups Projects
Select Git revision
  • master
1 result

transformaciones.R

Blame
  • Code owners
    Assign users and groups as approvers for specific file changes. Learn more.
    transformaciones.R 1.60 KiB
    #Cargamos los datos con el PIB y export 
    a = read.csv("C:/Users/Santiago/Documents/CARRERA/5º PRIMER CUATRI/DESI/Proyecto D3/Proyecto/all.csv", header = T, sep=";")
    #Cargamos los datos con los continentes
    b = read.csv("C:/Users/Santiago/Documents/CARRERA/5º PRIMER CUATRI/DESI/Proyecto D3/Proyecto/growth-of-income-and-trade.csv", header = T, sep=",")
    
    #Hacemos join entre los dataset por el código del país y renombramos las columnas
    colnames(a)[3] = "Code"
    b = b[(as.character(b$Code) != ""),]
    resul = merge(x = b, y = a[,c(3,6,7)], by = "Code", all.x = TRUE)
    colnames(resul) = c("code", "entity", "year", "export", "PIBpc", "population", "region", "subregion")
    
    #calculamos el PIB total
    resul$PIBt = as.numeric(resul$PIBpc)*as.numeric(resul$population)
    resul$expt = as.numeric(resul$export)*as.numeric(resul$PIBt)/100
    
    #calculamos el crecimiento del PIB total y de las exportaciones por cada año y país
    #para ello, ordenamos el dataframe por estas dos variables y utilizamos la librería dplyr
    resul = resul[with(resul, order(entity, year)), ]
    resulp = resul[,c(1,3,9,10)]
    library(dplyr)
    growth <- function(x)(x/lag(x)-1)*100
    resulp = resulp %>% 
      group_by(code) %>% 
      mutate_each(funs(growth), PIBt, expt)
    
    #juntamos las columnas que nos interesan en un solo dataframe
    datos = cbind(resul[,c(1,2,3,6,7,8)],resulp[,c(3,4)])
    datos$code = as.character(datos$code)
    head(datos)
    #eliminamos NAs y años menor del 2005
    datos = na.omit(datos)
    datos = datos[datos$year > 2004,]
    
    #escribimos el fichero
    write.csv(datos, file = "C:/Users/Santiago/Documents/CARRERA/5º PRIMER CUATRI/DESI/Proyecto D3/Proyecto/data.csv", 
              row.names = T)