jms0522 / Medical-project

✅ 의료 데이터를 활용한 챗봇과 다양한 파이프라인을 제작합니다.
5 stars 4 forks source link

Airflow dag 생성 #80

Closed jms0522 closed 8 months ago

jms0522 commented 8 months ago

0228 naver qna crawling dag

@cheol2Y @stfano

stfano commented 8 months ago
image

db 저장도 연습으로 해봄

image
cheol2Y commented 8 months ago

image

이후에 작업할거 DAG에서 오류발생시 다시 회복할 수 있게끔 구현 전처리 강화

cheol2Y commented 8 months ago

docker compose up 할때마다 scheduler container 들어가서 pip install 하는 번거로움이 있음, 이거 해결할 방법 있다면 좋을듯

jms0522 commented 8 months ago

docker compose up 할때마다 scheduler container 들어가서 pip install 하는 번거로움이 있음, 이거 해결할 방법 있다면 좋을듯

-볼륨을 사용하거나 애초에 필요한 설정 다 한 이미지를 저장하고 그 이미지로 부터 docker compose up 하면 되는거 아녀? 아님 requirement에 적어놓거나

cheol2Y commented 8 months ago
cheol2Y commented 8 months ago

PostgresDB 할때 설정할것 리눅스 기준 해당 파일을 수정하면 된다.

  1. sudo vim /etc/postgresql/16/main/pg_hba.conf

image

peer 오류가 뜬다면 md5로 변경 DB에 접속할수 있게끔 권한 줄때 해당 아이피 주소를 입력, 번거롭다면 그냥 전체 ip에 대하여 열어놔도 된다

  1. sudo vim /etc/postgresql/16/main/postgresql.conf ip 접속 권한주기

image

stfano commented 8 months ago
image
cheol2Y commented 8 months ago

-docker file 형성 image 현재 docker 이미지를 build하고 docker hub에 push하는 작업까지 완료

cheol2Y commented 8 months ago

postgresql DB의 conf파일을 수정하여 접근 권한을 주어야한다. ec2의 보안그룹에서도 해당 포트(5432)를 열어주어야 접속이 가능하다.

cheol2Y commented 8 months ago

-닥터나우, 하이닥, 네이버 지식인 dag 작성 완료 및 컬럼명 통일

image image image

Dag가 실행되면 정보 수집후 정상적으로 DB에 입력된다