Closed arekziobrowski closed 4 years ago
Kolejność:
country
article
(poniższe mogą być równocześnie)article_keyword
image
image_metadata
co z color_metadata
?
color_metadata
już jest w tabelce bez potrzeby ładowania. Było ładowane inicjalnie przy ekstrakcji.
Zrobić czyszczenie country
całej przed załadowaniem.
Zrobić rozwiązanie generyczne do zasilania dowolnej tabeli z pliku HDFS. Wykorzystać narzędzie Sqoop - skrypt napisać w bashu tak jak ten. Następnie zrobić uruchomienie w skrypcie do zasilenia tabel: