Closed sooj1n closed 3 weeks ago
** ConsumeFromTopicOperator는 디버깅이 너무 어려워서 PythonOperator로 바꿨습니답.
$ pip install pandas $ pip install pyarrow $ pip install kafka-python
데이터 저장 위치
csv : < your installation folder >/data/parquet/p.parquet
parquet : < your installation folder >/data/csv/data.csv
zeppelin
노트 파일 위치 < your installation folder >/data/toparquet..ipynb 제플린에 import note 해서 사용하심 됩니다 ..
닉네임 별 채팅 빈도
날짜 별 채팅 빈도
날짜 + 시간 별 채팅 빈도
단어 빈도
** ConsumeFromTopicOperator는 디버깅이 너무 어려워서 PythonOperator로 바꿨습니답.
USEAGE
Description
데이터 저장 위치
csv : < your installation folder >/data/parquet/p.parquet
parquet : < your installation folder >/data/csv/data.csv
zeppelin
노트 파일 위치 < your installation folder >/data/toparquet..ipynb 제플린에 import note 해서 사용하심 됩니다 ..
닉네임 별 채팅 빈도
날짜 별 채팅 빈도
날짜 + 시간 별 채팅 빈도
단어 빈도