Skip to content
Snippets Groups Projects
Commit c607d84b authored by ramoncalabozo's avatar ramoncalabozo
Browse files

Preprocesamiento de datos finalizado

parent a78bc3ce
Branches
No related tags found
No related merge requests found
......@@ -7,40 +7,54 @@ CSV = 'Universidades.csv'
# Archivo sql, donde se generaran las acciones sql
SQL = 'universidaddb.sql'
SENTENCIASQL = "INSERT INTO `universidadesdb`.`universidad` (`idUniversidad`, `TotalPublicaciones`, `PromedioPublicaciones`, `Comunidad`, `2011`, `2012`, `2013`, `2014`, `2015`, `2016`, `2017`, `2018`, `2019`, `2020`) VALUES ('{0}', '{1}', '{2}', '{3}', '{4}', '{5}', '{6}', '{7}', '{8}', '{9}', '{10}', '{11}', '{12}', '{13}');"
SENTENCIASQL = "INSERT INTO `universidadesdb`.`universidad` (`idUniversidad`, `TotalPublicaciones`, `PromedioPublicaciones`, `Comunidad`, `2011`, `2012`, `2013`, `2014`, `2015`, `2016`, `2017`, `2018`, `2019`, `2020`) VALUES ('{0}', '{1}', '{2}', '{3}', '{4}', '{5}', '{6}', '{7}', '{8}', '{9}', '{10}', '{11}', '{12}', '{13}');\n"
def generate_sql(universidad):
sentencias = []
siglas = universidad[0]
comunidad = universidad[1]
once = universidad[2]
doce = universidad[3]
trece = universidad[4]
catorce = universidad[5]
quince = universidad[6]
dieciseis = universidad[7]
dicisiete = universidad[8]
dieciocho = universidad[9]
dicinueve = universidad[10]
veinte = universidad[11]
total = universidad[12]
promedio = universidad[13]
return SENTENCIASQL.format(siglas, comunidad, once, doce, trece, catorce,quince,dieciseis, dicisiete, dieciocho, dicinueve, veinte , total, promedio)
# Lectura de los datos del CSV
dataframe = pd.read_csv(CSV, sep= ";")
# pasamos los valroes del dataframe a una lista
listaUniv = dataframe.to_numpy().tolist()
print(listaUniv[60][1])
sentencias = []
universidad = []
sentencias = []
# Escribir en el archivo sql
for i in listaUniv:
for j in range (13):
universidad.append(listaUniv[i][j])
for u in universidad: # Terminar esto
siglas = u[0]
comunidad = u[1]
once = u[2]
doce = u[3]
trece = u[4]
catorce = u[5]
quince = u[6]
dieciseis = u[7]
dicisiete = u[8]
dieciocho = u[9]
dicinueve = u[10]
veinte = u[11]
total = u[12]
promedio = u[13]
sentencias.append(SENTENCIASQL.format(siglas, comunidad, once, doce, trece, catorce,quince,dieciseis, dicisiete, dieciocho, dicinueve, veinte , total, promedio))
if universidad != []:
insercion = generate_sql(universidad)
sentencias.append(insercion)
universidad = []
for j in range (14):
#elemento = listaUniv[i][j]ºº
elemento = i[j]
universidad.append(elemento)
with open(SQL, 'w') as archivo: # Archivo de escritura
for s in sentencias:
archivo.write(s)
print("\n VOLCADO A LA BD CON EXITO")
This diff is collapsed.
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please to comment