tsjshg / TMDU2019Python

4 stars 0 forks source link

20190622.ipynb #3

Open drillan opened 5 years ago

drillan commented 5 years ago

PEP8違反です。

num_list = [1,2,3,4] 
array_2d = np.array( [num_list, num_list] ) 
r.reshape((5,3)) 
mat = r.reshape((3,4)) 
mat[2,1] 
mat[:,1] 
mat[2,:] 
mat[:, [0,3]] 
np.empty((3,4)) 
np.zeros((3,4)) 
np.sqrt( 16  )
np.sqrt( e ) 
my_data['dens'] = my_data['popl'] /my_data['area'] 
pd.concat([a,b]) 
a = my_data[my_data.columns[:2] ]
pd.concat([a,b], axis=1) 
le.transform( data['Region'] ) 
le.inverse_transform( data['Region'] )
# 講義当日の内容と違います。
def pick_second(col_data):
    # 全国で2番目に大きい値を返す。
    return col_data[col_data.rank() == 46]

my_data.apply(pick_second)
drillan commented 5 years ago
data['Region'] = data['Region'].apply(lambda x:x.strip())

上記のコードはstrアクセサを使うとすっきりすると思います。

data['Region'] = data['Region'].str.strip()

教えることが増えてしまうため、どちらでもよいです。

drillan commented 5 years ago
data[GDP].plot(kind='bar')

ラベルが潰れてみえなくなっているため、次のようにfigsizeを大きくするか

data[GDP].plot(kind='bar', figsize=(20, 4))

次のようにデータを絞ってもよいかもしれません。

data[GDP].nlargest(40).plot(kind='bar')
drillan commented 5 years ago

numpyやpandasの.ilocでスライスの処理などを詳しくやってるので、.locの事例もあったほうがよいと思います。 リストによる複数選択も紹介するとよさそうな気がします。