datascienceschool / book

23 stars 23 forks source link

01%20python/04.01%20%ED%8C%90%EB%8B%A4%EC%8A%A4%20%ED%8C%A8%ED%82%A4%EC%A7%80%EC%9D%98%20%EC%86%8C%EA%B0%9C #23

Open utterances-bot opened 3 years ago

utterances-bot commented 3 years ago

4.1 판다스 패키지의 소개 — 데이터 사이언스 스쿨

https://datascienceschool.net/01%20python/04.01%20%ED%8C%90%EB%8B%A4%EC%8A%A4%20%ED%8C%A8%ED%82%A4%EC%A7%80%EC%9D%98%20%EC%86%8C%EA%B0%9C.html

JO-HEEJIN commented 3 years ago

만약 라벨 값이 영문 문자열인 경우에는 인덱스 라벨이 속성인것처럼 점(.)을 이용하여 해당 인덱스 값에 접근할 수도 있다.

오잉 선생님 이거 한글로도 되네요! 코랩이라 그런가...?

s.서울

해봤는데 ㅋㅋㅋ 되네요! 딱히 인코딩도 지정 안 했었는데...? 여튼!@ 항상 잘 보고 있어요 여기 진짜 너무 너무 너무 좋아요!!! 감사합니다!!

cherryb1 commented 3 years ago

마지막에 개별 데이터를 인덱싱하는 경우 새로운 값을 입력하면 왜 변경되지 않고 오류가 뜨는 지 모르겠습니다... 시리즈는 인덱싱으로 하나의 값을 새로 입력하거나 변경 가능하고, 데이터프레임은 컬럼 단위로 새로운 열의 추가나 값의 변경이 가능한데 개별 데이터의 경우 변경이 안되는 것인가요?

guidepro commented 2 years ago

이렇게 해보았습니다. print(df['수학']) print(df[['국어', '영어']]) df['평균'] = df.mean(axis=1) print(df) del df['평균'] df['영어']['방자'] = 80 df['평균'] = df.mean(axis=1).round(0) print(df) print(df[:'춘향']) print(df['향단':'향단'].values.reshape(4)) print(df['향단':'향단'].columns.tolist()) s = pd.Series(data=df['향단':'향단'].values.reshape(4), index=df['향단':'향단'].columns.tolist(), name='향단', dtype='i') print(s)

byeongtaejeon commented 2 years ago

df.loc["향단"] loc 속성이 Series 타입으로 반환하네요...

lysnjn commented 2 years ago

df.T["향단"] 전치시켜서 해결하긴했는데 아직 안배웠지만.. df.loc 이랑 df.iloc이라는 좋은친구들이 숨어있었군용

scrawl-dev commented 1 year ago

(1) 모든 학생의 수학 점수를 시리즈로 나타낸다.

df["수학"]

(2) 모든 학생의 국어와 영어 점수를 데이터 프레임으로 나타낸다.

df[["국어","영어"]]

(3) 모든 학생의 각 과목 평균 점수를 새로운 열로 추가한다.

df["평균 점수"] = round(df.mean(axis=1),2)

(4) 방자의 영어 점수를 80점으로 수정하고 평균 점수도 다시 계산한다.

df.loc["방자","영어"] = 80

(5) 춘향의 점수를 데이터프레임으로 나타낸다.

df[:1]

(6) 향단의 점수를 시리즈로 나타낸다.

pd.Series(list(df[2:3].values), index =["향단"])

to302 commented 1 year ago

1

df["수학"]

2

df[["국어", "영어"]]

3

df['평균 점수'] = sum(df[columns].T.values)/len(columns)

4

df.loc["방자", "영어"] = 80 df['평균 점수'] = sum(df[columns].T.values)/len(columns) df['평균 점수'] = df[columns].mean(axis=1)

5

df[:1]

6

df.T['향단']

fckapp commented 6 months ago

(1) 모든 학생의 수학 점수를 시리즈로 나타낸다.

df["수학"]

(2) 모든 학생의 국어와 영어 점수를 데이터 프레임으로 나타낸다.

df[["국어", "영어"]]

(3) 모든 학생의 각 과목 평균 점수를 새로운 열로 추가한다.

df["평균"] = ((df["국어"] + df["영어"] + df["수학"]) / 3).round(2) df

(4) 방자의 영어 점수를 80점으로 수정하고 평균 점수도 다시 계산한다.

df["영어"]["방자"] = 80 df["평균"] = ((df["국어"] + df["영어"] + df["수학"]) / 3).round(2) df

(5) 춘향의 점수를 데이터프레임으로 나타낸다.

df[ : 1]

(6) 향단의 점수를 시리즈로 나타낸다.

df.T["향단"]