arekziobrowski / gdelt-big-data

0 stars 0 forks source link

Zasilanie tabel #18

Closed arekziobrowski closed 4 years ago

arekziobrowski commented 4 years ago

Zrobić rozwiązanie generyczne do zasilania dowolnej tabeli z pliku HDFS. Wykorzystać narzędzie Sqoop - skrypt napisać w bashu tak jak ten. Następnie zrobić uruchomienie w skrypcie do zasilenia tabel:

zxxa commented 4 years ago

Kolejność:

co z color_metadata?

arekziobrowski commented 4 years ago

color_metadata już jest w tabelce bez potrzeby ładowania. Było ładowane inicjalnie przy ekstrakcji.

arekziobrowski commented 4 years ago

Zrobić czyszczenie country całej przed załadowaniem.