#import
import pandas as pd
import numpy as np
import geocoder
#read file
df = pd.read_csv("file_name.csv")
#drop all null values
file_name.dropna(inplace = True)
#inspect shape
file_name.shape
#inspect first and last rows
file_name.head()
file_name.tail()
#change column names
file_name.rename(columns={'NAME':'name', 'ZONA GEOGRAFICA':'Ciudad'}, inplace = True)
#further inspect particular field
file_name["field"].value_counts()
#prepare fields for geocoding
argentina["Ciudad"]= argentina["Ciudad"].str.replace('Buenos Aires ', "Buenos Aires, Argentina", case = False)
#further inspect particular field
file_name["Ciudad"].value_counts().index
#create geocoding function
pais = file_name
def ciudadClean(ciudad):
ciudad = ciudad.strip()
if pais not in ciudad:
ciudad = ciudad + ", " + pais
return ciudad
#apply function
file_name["Ciudad"]= argentina["Ciudad"].apply(ciudadClean)
#geocode
file_name["geocoder"] = argentina["Ciudad"].apply(geocoder.osm)
#get lat
def ciudadLat(geocoder):
lat = geocoder.lat
return lat
#get long
def ciudadLng(geocoder):
lng = geocoder.lng
return lng
file_name"lat"] = file_name["geocoder"].apply(ciudadLat)
file_name["lng"] = file_name["geocoder"].apply(ciudadLng)
file_name.to_csv("file_name_clean.csv", index=False)