Open skAtom opened 1 week ago
index nameの要素の大きさをヒストグラムで比較してみた。
この時子供用の服はいくつかサイズが分かれているがH&Mのショッピングサイトには以下のようなサイズ分けがされていた。
ladies = ['Ladieswear','Lingeries/Tights', 'Ladies Accessories', 'Divided']
adult = ['Ladieswear','Lingeries/Tights', 'Ladies Accessories', 'Divided','Menswear','Sport']
len(articles_df[articles_df['index_name'].isin(ladies)]) / len(articles_df[articles_df['index_name'].isin(adult)])
データを可視化して全体の特徴を大まかに捉える
画像データとテーブルデータを可視化して実際のデータの様子を捉える。
軸は2つ、1つ目は顧客を軸にしてどんな商品を購入したか見てみる、2つ目は商品を軸にどのような顧客が購入をしたか見てみる。
その他、欠損値の数やデータの記録された時間的な間隔や男女比など一つ一つのカラムに焦点を当てた可視化。
TODO List