kakaotech-bootcamp-11 / kakaotech-bootcamp-11-ktb-11-project-1-chatbot-nlp-server

0 stars 0 forks source link

[Feat] RAG 모델 최적화 #5

Open jieun-lim opened 2 months ago

jieun-lim commented 2 months ago

current status

PDF에서 카카오 부캠 정보를 적절히 검색 못함

[
  {
    "input": "카카오 클라우드 교육 채널에 로그인이 되지 않을 경우 어떻게 해야 하나요?",
    "status_code": 200,
    "response_text": "카카오 클라우드 교육 채널에 로그인이 되지 않을 경우, 교육 운영 관리자에게 문의하는 것이 좋습니다. 각 회차 별 게시판을 통해 문의할 수 있으며, 문제를 상세히 설명하면 도움을 받을 수 있을 것입니다."
  },
  {
    "input": "카카오 클라우드 교육의 전체 일정과 시간표는 어떻게 구성되어 있나요?",
    "status_code": 200,
    "response_text": "죄송하지만, 현재 카카오 클라우드 교육의 구체적인 일정과 시간표에 대한 정보는 제공할 수 없습니다. 교육 일정과 시간표는 종종 변경될 수 있으므로, 가장 최신 정보를 확인하려면 카카오 클라우드 교육 공식 웹사이트나 관련담당자에게 문의하는 것이 좋습니다. 추가적인 도움이 필요하시면 언제든지 말씀해 주세요!"
  },
  {
    "input": "오프라인 교육 참여 신청 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "카카오 부트캠프의 오프라인 교육 참여 신청 방법은 다음과 같습니다: 1. **카카오 부트캠프 공식 웹사이트 방문**: 먼저 카카오 부트캠프의 공식 웹사이트를 방문하세요. 2. **회원 가입 및 로그인**: 회원 가입을 하고 로그인합니다.이미 회원이라면 로그인만 하시면 됩니다. 3. **프로그램 정보 확인**: 제공되는 다양한 프로그램과 교육 과정을 확인합니다. 자신에게 맞는 프로그램을 선택하세요. 4. **신청서 작성**: 선택한 프로그램의 신청서를 작성합니다. 여기에는 개인 정보, 학력,경력, 자기소개서 등이 포함될 수 있습니다. 5. **제출 및 확인**: 신청서를 작성한 후 제출합니다. 제출 후에는 신청이 정상적으로 완료되었는지 확인 이메일이나 메시지를 받을 수 있습니다. 6. **면접 및 평가**: 필요한경우 면접이나 추가 평가 절"
  },
  {
    "input": "인프런 크레딧을 받기 위해 필요한 절차는 무엇인가요?",
    "status_code": 200,
    "response_text": "인프런 크레딧을 받기 위해 필요한 절차는 다음과 같습니다: 1. 인프런 계정을 제출합니다. 2. 제출한 계정으로 로그인합니다. 3. 부여된 크레딧을 사용하여 자유롭게 수강신청을 합니다. 추가적으로, 부여된 크레딧에 개인 비용을 더하여 강의를구매할 수 없으며, 개인 비용에 대한 정산이 불가능하다는 점을 유의하시기 바랍니다."
  },
  {
    "input": "인프런 강의 지원은 언제까지 유효한가요?",
    "status_code": 200,
    "response_text": "인프런 강의 지원은 2024년 7월 1일부터 2024년 8월 31일까지 유효합니다."
  },
  {
    "input": "ChatGPT Plus 구독료 지원을 신청하는 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "ChatGPT Plus 구독료 지원을 신청하려면 다음 단계를 따르세요: 1. 7월 결제 건에 대한 카드 매출 전표를 준비합니다. 2. 구독료 지원 구글 폼 링크를 통해 카드 매출 전표를 제출합니다. 3. 제출기한은 8월 6일(화) 오후 3시까지입니다. 4. 노션 페이지 내 청구 방법을 꼭 정독하여 추가 지침을 확인합니다. 이 절차를 따르면 ChatGPT Plus 구독료 지원을 신청할 수 있습니다."
  },
  {
    "input": "Colab Pro+ 지원금을 청구하는 과정은 어떻게 되나요?",
    "status_code": 200,
    "response_text": "Colab Pro+ 지원금을 청구하는 과정은 다음과 같습니다: 1. **개인 카드 결제**: 먼저 개인 카드로 Colab Pro+를 결제합니다. 결제 시기는 8월 이내에 완료해야 합니다. 2. **익월 환급 신청**: 결제한 다음 달에환급 신청을 합니다. 청구 시기는 9월 1~2주차입니다. 3. **익월 환급 완료**: 내부 회계 절차에 따라 환급 신청 및 완료까지 시일이 소요됩니다. 환급 시기는 10월 10일 전후입니다. 이 과정을 통해 ColabPro+ 지원금을 청구할 수 있습니다."
  },
  {
    "input": "팀 미션 주제는 어떻게 선택하나요?",
    "status_code": 200,
    "response_text": "팀 미션 주제는 보통 다음과 같은 절차를 통해 선택됩니다: 1. **주제 제공**: 부트캠프 주최 측에서 여러 가지 주제를 미리 준비해 놓습니다. 이 주제들은 현재 기술 트렌드, 실제 산업 문제, 또는사회적 이슈 등을 반영할 수 있습니다. 2. **팀 구성**: 참가자들은 팀을 이루게 됩니다. 팀은 보통 서로의 강점과 관심사를 고려하여 구성됩니다. 3. **주제 발표**: 주최 측에서 준비한 주제를 팀들에게 발표합니다. 이때각 팀은 주어진 주제 중에서 선택할 수도 있고, 경우에 따라서는 자신들만의 주제를 제안할 수도 있습니다. 4. **토론 및 결정**: 팀 내부에서 각 주제에 대해 토론한 후, 팀원들의 관심사와 강점을 고려하여최종 주제를 결정합니다. 5. **멘"
  },
  {
    "input": "개인 미션과 팀 미션의 차이는 무엇인가요?",
    "status_code": 200,
    "response_text": "개인 미션과 팀 미션의 차이는 다음과 같습니다: 1. **목표 설정 및 책임**: - **개인 미션**: 개인이 설정한 목표와 이를 달성하기 위한 계획을 의미합니다. 개인이 직접 책임을 지고 수행합니다. - **팀미션**: 팀 전체가 공동으로 설정한 목표를 의미하며, 팀원들이 협력하여 목표를 달성합니다. 책임은 팀 전체에 분산됩니다. 2. **작업의 범위**: - **개인 미션**: 개인의 능력과 자원에 맞춰진 범위 내에서 수행됩니다. - **팀미션**: 다양한 팀원들의 능력과 자원을 활용하여 더 큰 범위의 작업을 수행할 수 있습니다. 3. **의사 결정 과정**: - **개인 미션**: 개인이 독립적으로 의사 결정을 내립니다. - **팀 미션**: 팀원들 간의협의를 통해 의사 결정을 내립니다. 4. **성과와 보상**: - **개인 미션**: 성과와 보상이 개인에게 직접적으로 돌아갑니다. - **팀 미션**: 성과와 보상이 팀 전체에 분배됩니다. 5. **협력과 커뮤니케이션**: - **개인 미션**:주로 개인의 노력과 시간 관리가 중요합니다. - **팀 미션**: 팀원 간의 협력과 커뮤니케이션이 중요합니다. 이러한 차이점들은 개인과 팀이 목표를 달성하는 방식과 그 과정에서의 경험에 큰 영향을 미칩니다."
  },
  {
    "input": "출석율이 훈련 장려금에 어떻게 영향을 미치나요?",
    "status_code": 200,
    "response_text": "훈련 장려금은 출석율에 따라 지급 여부가 결정됩니다. 구직자(실업자)와 주 15시간 미만 근로자의 경우, 단위 기간 출석율이 80% 이상이어야 훈련 장려금을 받을 수 있습니다. 반면, 개인사업자, 재직자 및 근로자는 출석율과 상관없이훈련 장려금 지급 대상에서 제외됩니다. 다만, 훈련 과정 중 사업자 폐지나 퇴사로 인해 고용 형태가 구직자로 변경되는 경우, 고용보험 상실 신고서를 제출하면 훈련 장려금을 받을 수 있습니다."
  },
  {
    "input": "K-디지털 트레이닝 특별훈련수당의 지급 기준은 무엇인가요?",
    "status_code": 200,
    "response_text": "K-디지털 트레이닝 특별훈련수당의 지급 기준은 지원 기간 내 최대 10만원입니다. 지원 기간은 2024년 7월 1일부터 2024년 8월 31일까지이며, 개인 계정을 생성하여 사용해야 합니다. 환급은 지원 기간 종료 후 일괄 지급됩니다."
  },
  {
    "input": "출석 정정을 신청하는 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "출석 정정을 신청하는 방법은 다음과 같습니다: 1. **단위기간 종료 이후 출석 정정 신청**: 출석 정정을 할 수 있는 기간을 제공하며, 이 과정은 약 1주일이 소요됩니다. 출석은 훈련 장려금과 연관되어 있기때문에 중요합니다. 2. **출석 이의 신청한 내용 확인**: 출석 정정 신청 후, 제출한 증빙 자료 및 출석 데이터를 확인하는 과정이 필요합니다. 이 과정은 약 2~3일이 소요됩니다. 3. **고용센터 출석 정정공문 요청 및 처리**: 출석 정정 건에 대한 수정 요청은 공문을 통해 요청 및 처리됩니다. 이 과정은 약 2~4일이 소요됩니다. 이 과정을 통해 출석 정정을 신청할 수 있습니다."
  },
  {
    "input": "조기취업 시 중도포기 절차는 어떻게 되나요?",
    "status_code": 200,
    "response_text": "조기취업으로 인해 수업 참석이 어려운 경우 중도포기 처리가 됩니다. 중도포기 절차에 대한 구체적인 내용은 제공된 정보에 포함되어 있지 않으므로, 해당 기관의 행정 규칙이나 담당 부서에 문의하여 자세한 절차를 확인하는 것이좋습니다."
  },
  {
    "input": "부정출결(대리출석) 시 발생하는 페널티는 무엇인가요?",
    "status_code": 200,
    "response_text": "부정출결(대리출석) 시 발생하는 페널티에 대해서는 제공된 정보에 포함되어 있지 않습니다. 해당 사항에 대해 자세한 정보를 원하시면 관련 기관이나 담당 부서에 직접 문의하시기 바랍니다."
  },
  {
    "input": "중도포기 시 다른 K-Digital Training 교육 참여에 제한이 있나요?",
    "status_code": 200,
    "response_text": "네, 중도포기 시 다른 K-Digital Training 교육에 참여할 수 없게 됩니다."
  },
  {
    "input": "사원증 배부는 언제, 어디에서 이루어지나요?",
    "status_code": 200,
    "response_text": "사원증 배부는 보통 부트캠프 시작 첫날에 이루어집니다. 정확한 시간과 장소는 부트캠프 시작 전 안내 메일이나 공지를 통해 알려드릴 예정입니다. 일반적으로는 부트캠프 오리엔테이션이 열리는 장소에서 배부됩니다. Pangyo에 있는 Kakao 사무실에서 진행될가능성이 높습니다. 추가적인 정보가 필요하시면, 부트캠프 담당자에게 문의해 주세요."
  },
  {
    "input": "출석 인정 사유는 어떤 것이 있으며, 어떻게 신청하나요?",
    "status_code": 200,
    "response_text": "출석 인정 사유는 다음과 같습니다: 1. 사설 대회 참여로 인한 출석 인정: 대회 참석 후 바로 채용으로 이어지는 경우에만 소요 일수만큼 출석 인정이 가능합니다. 이후 채용의 이유로 수업 참석이 어려울경우 중도 포기 처리됩니다. 2. 졸업식, 국민취업지원제도 상담 등 위에 기재되지 않은 사유는 인정되지 않습니다. 출석 인정을 신청하려면 해당 사유를 증명할 수 있는 서류를 준비하여 행정 규칙에 따라 신청해야 합니다.구체적인 신청 절차는 학교나 기관의 행정 부서에 문의하여 확인하는 것이 좋습니다."
  },
  {
    "input": "국민내일배움카드로 훈련 장려금을 받기 위한 조건은 무엇인가요?",
    "status_code": 200,
    "response_text": "국민내일배움카드로 훈련 장려금을 받기 위한 조건은 다음과 같습니다: 1. **훈련 과정 수료**: 훈련 과정을 성실히 수료해야 합니다. 출석률이 일정 기준 이상이어야 하며, 중도 탈락 없이 과정을 마쳐야 합니다. 2. **훈련비지원 대상**: 국민내일배움카드로 훈련비를 지원받는 대상이어야 합니다. 이는 고용노동부에서 정한 기준에 따라 결정됩니다. 3. **훈련 장려금 신청**: 훈련 장려금을 받기 위해서는 훈련이 끝난 후 일정 기간 내에 장려금 신청을 해야합니다. 신청 방법과 기간은 고용노동부의 안내에 따릅니다. 4. **기타 조건**: 고용노동부에서 정한 기타 조건을 충족해야 합니다. 예를 들어, 일정 기간 내에 취업을 해야 하는 경우도 있을 수 있습니다. 자세한 조건과절차는 고용노동부나 국민내일배움카드 관련 공식 웹사이트에서 확인하시는 것이 좋습니다."
  },
  {
    "input": "AWS 사용료 지원은 어떤 방식으로 이루어지나요?",
    "status_code": 200,
    "response_text": "AWS 사용료 지원은 개인 계정을 생성하여 사용하는 방식으로 이루어집니다. 지원 기간은 2024년 7월 1일부터 2024년 8월 31일까지이며, 이 기간 내에 최대 10만원까지 지원됩니다."
  },
  {
    "input": "팀빌딩은 어떻게 진행되며, 팀원 모집 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "팀빌딩은 자율적으로 구성됩니다. 팀원 모집 방법은 다음과 같습니다: 1. 디스코드 풀스택-1기 게시판에 모집 공고를 업로드하여 공개 모집. 2. 구름 유니버스나 개인 DM을 통해 자유롭게 모집. 3. 모집 공고 작성 시별도의 제한 사항은 없으나, 스터디 목표와 활동 방식 등 기본적인 내용을 포함해야 합니다."
  },
  {
    "input": "교육 중 휴가를 신청하는 절차는 어떻게 되나요?",
    "status_code": 200,
    "response_text": "교육 중 휴가를 신청하려면 다음 절차를 따르시면 됩니다: 1. **사전 신청**: 휴가를 신청하려면 최소 3일 전에 통합신청센터에서 신청해야 합니다. 이후에 신청하면 휴가 반영이 불가합니다. 2. **수강철회 기간 이후**: 휴가 신청은수강철회 기간이 끝난 후부터 가능합니다. 3. **적치된 휴가 사용**: 적치된 휴가는 사용할 수 있지만, 다음 달 휴가를 미리 사용하는 것은 불가합니다. 이 절차를 따라 휴가를 신청하시면 됩니다."
  },
  {
    "input": "휴강일과 공휴일에는 어떤 교육이 진행되나요?",
    "status_code": 200,
    "response_text": "휴강일과 공휴일에는 강의가 진행되지 않습니다."
  },
  {
    "input": "팀 미션 발표회는 언제, 어떻게 진행되나요?",
    "status_code": 200,
    "response_text": "팀 미션 발표회는 8월 29일(목) 또는 8월 30일(금)에 온라인으로 진행될 예정입니다."
  },
  {
    "input": "출석율이 80% 미만일 경우 어떤 불이익이 있나요?",
    "status_code": 200,
    "response_text": "카카오 부트캠프에서 출석율이 80% 미만일 경우, 수료에 영향을 줄 수 있습니다. 일반적으로 부트캠프에서는 일정 출석율을 충족해야만 프로그램을 수료할 수 있으며, 출석율이 미달할 경우 수료증 발급이 불가하거나 추가 과제를 부여받을 수있습니다. 구체적인 불이익은 부트캠프의 규정에 따라 다를 수 있으므로, 정확한 정보는 부트캠프 운영진에게 문의하는 것이 좋습니다."
  },
  {
    "input": "사설 대회 참여로 인한 출석 인정이 가능한가요?",
    "status_code": 200,
    "response_text": "대회 참석 후 바로 채용으로 이어지는 경우에만 소요 일수만큼 출석 인정이 가능합니다. 그렇지 않은 경우에는 출석 인정이 불가합니다."
  },
  {
    "input": "교육 중 외출 또는 조퇴 시 출석 처리 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "교육 중 외출 또는 조퇴 시 출석 처리 방법은 다음과 같습니다: - 외출: 교육 시간 중간에 일정 시간 동안 참여가 불가한 경우 외출로 처리됩니다. - 조퇴: 교육 시간 중간부터 끝까지참여가 불가한 경우 조퇴로 처리됩니다. 또한, 총 교육 기간 중 지각, 조퇴, 외출이 3회 누적되면 1일 결석으로 처리됩니다. 입/퇴장 시간은 시스템에 자동으로 등록되며, 개인 불찰로 인한 수정은 불가합니다. 퇴장하기를 진행하지않으면 해당 1일은 결석으로 처리됩니다."
  },
  {
    "input": "인공지능 과정에서 프로젝트 비율이 높아진 이유는 무엇인가요?",
    "status_code": 200,
    "response_text": "인공지능 과정에서 프로젝트 비율이 높아진 이유는 여러분들께 더 많은 프로젝트 경험을 제공하고 개인 포트폴리오를 강화하기 위해서입니다."
  },
  {
    "input": "국민내일배움카드로 중도탈락 시 발생하는 페널티는 무엇인가요?",
    "status_code": 200,
    "response_text": "국민내일배움카드로 중도탈락 시 발생하는 페널티에 대해 정확한 정보를 제공하기 위해서는 관련 규정을 확인해야 합니다. 일반적으로 중도탈락 시에는 다음과 같은 페널티가 있을 수 있습니다: 1. **훈련비 환수**: 중도탈락한 경우 이미 지원받은훈련비를 환수당할 수 있습니다. 2. **지원 제한**: 일정 기간 동안 국민내일배움카드를 통한 훈련비 지원이 제한될 수 있습니다. 3. **불이익**: 중도탈락 기록이 남아 이후 훈련 과정 신청 시 불이익을 받을 수있습니다. 정확한 페널티 내용은 국민내일배움카드 운영기관이나 관련 규정을 통해 확인하는 것이 좋습니다."
  },
  {
    "input": "구름 EXP 미션은 어떻게 선택하고 수행하나요?",
    "status_code": 200,
    "response_text": "구름 EXP 미션을 선택하고 수행하는 방법은 다음과 같습니다: 1. **나의 팀 선택**: - EXP 좌측 하단의 \"나의 팀\"에서 나의 스터디 팀을 선택하거나, 빠른 검색에서 나의 스터디 팀 이름을 검색합니다. 2.**학습 계획 확인**: - 나의 팀 페이지에서 생성된 학습 계획을 확인합니다. 이 과정을 통해 구름 EXP에서 제공하는 PBL(Problem-Based Learning) 과제에 대한 학습 계획을 확인하고, 팀과 함께 미션을 수행할 수 있습니다."
  },
  {
    "input": "구글 Colab Pro+ 구독 취소 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "구글 Colab Pro+ 구독을 취소하려면 다음 단계를 따르세요: 1. Google Colab 웹사이트에 로그인합니다. 2. 화면 오른쪽 상단에 있는 사용자 아이콘을 클릭합니다. 3. \"구독 관리\" 또는 \"결제 및 구독\" 옵션을 선택합니다.4. Colab Pro+ 구독 항목을 찾아 \"구독 취소\" 버튼을 클릭합니다. 5. 안내에 따라 구독 취소 절차를 완료합니다. 구독을 취소하지 않으면 계속해서 구독료가 결제되므로, 필요하지 않다면 반드시 구독을 취소하시기 바랍니다."
  },
  {
    "input": "인공지능 커리큘럼 변경 내용은 무엇인가요?",
    "status_code": 200,
    "response_text": "인공지능 커리큘럼 변경 내용은 다음과 같습니다: 1. **교육 시간 증가**: 기존 364시간에서 784시간으로 교육 시간이 대폭 늘어났습니다. 2. **프로젝트 비율 증가**: 더 많은 프로젝트 경험을 제공하고 개인 포트폴리오를 강화하기 위해프로젝트 비율이 높아졌습니다. 3. **추가 지원**: 부족한 이론을 보완하기 위해 인프런 강의가 제공되며, 8월부터 카카오 멘토들이 배정될 예정입니다."
  },
  {
    "input": "중도포기서 작성 시 주의사항은 무엇인가요?",
    "status_code": 200,
    "response_text": "중도포기서 작성 시 주의사항은 다음과 같습니다: 1. **과정 담당 관리자와 사전 공유**: 중도포기서를 제출하기 전에 반드시 과정 담당 관리자와 사전에 공유가 완료되어야 합니다. 2. **일정 확인**: 작성한 중도포기일을 포함한 이후훈련에 참여한 이력이 사라지므로 신중하게 일정을 확인한 후 작성해야 합니다. 3. **PDF 파일 양식 사용 시**: PDF 파일 양식을 사용하는 경우, 워드 파일에 기재되어 있는 작성 방법을 참고하여 올바르게 작성해야합니다. 이 주의사항들을 잘 지켜서 중도포기서를 작성하시기 바랍니다."
  },
  {
    "input": "자격증 응시료 지원을 받기 위한 조건은 무엇인가요?",
    "status_code": 200,
    "response_text": "자격증 응시료 지원을 받기 위한 조건은 교육 기간 내에 시험에 응시 및 합격한 해당 교육 과정 수료자여야 합니다. 자세한 내용은 [자격증 응시료 지원 안내](https://goormkdx.notion.site/69990b896a41403a800ecdaac294b6bd) 링크를 참고해 주시기 바랍니다."
  },
  {
    "input": "부정출결이 적발되면 어떤 처벌이 따르나요?",
    "status_code": 200,
    "response_text": "카카오 부트캠프에서 부정출결이 적발될 경우, 일반적으로 다음과 같은 처벌이 따를 수 있습니다: 1. **경고**: 처음 적발될 경우 경고를 받을 수 있습니다. 이는 공식적인 기록에 남을 수 있으며, 재발 방지를 위한주의 촉구입니다. 2. **출석 점수 감점**: 부정출결로 인해 출석 점수가 감점될 수 있습니다. 이는 최종 평가에 영향을 미칠 수 있습니다. 3. **프로그램 퇴출**: 반복적으로 부정출결이 발생하거나 심각한 경우, 프로그램에서 퇴출될수 있습니다. 이는 매우 중대한 처벌이며, 이후의 학습 기회에 큰 영향을 미칠 수 있습니다. 4. **기타 제재**: 상황에 따라 다른 제재가 가해질 수 있습니다. 예를 들어, 특정 프로젝트나 활동에서 제외될수 있습니다"
  },
  {
    "input": "출석율 확인 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "Kakao Bootcamp의 출석율 확인 방법은 다음과 같습니다: 1. **온라인 출석 시스템**: 대부분의 부트캠프에서는 온라인 출석 시스템을 통해 출석을 체크합니다. 지정된 시간에 온라인 플랫폼에 로그인하여 출석을 확인할 수 있습니다. 2. **QR코드 스캔**: 특정 장소에 QR 코드를 배치하고, 참가자들이 QR 코드를 스캔하여 출석을 확인하는 방법도 있습니다. 3. **강사 확인**: 강사나 조교가 직접 출석을 확인하는 경우도 있습니다. 이 경우, 강의 시작 전에이름을 부르거나 출석부에 서명하는 방식으로 확인할 수 있습니다. 4. **자동 출석 체크 시스템**: 일부 부트캠프는 자동 출석 체크 시스템을 도입하여, 참가자들이 강의실에 들어오면 자동으로 출석이 체크되기도 합니다. 각 부트"
  },
  {
    "input": "인프런 강의 구매 시 할인율은 어떻게 적용되나요?",
    "status_code": 200,
    "response_text": "인프런 강의 구매 시 10% 할인 금액이 적용됩니다. 비즈니스 그룹의 경우 일괄 적용되는 할인율이 개인이 구매하는 경우보다 금액이 높을 수 있습니다."
  },
  {
    "input": "팀 미션 진행 시 퍼실리테이터의 역할은 무엇인가요?",
    "status_code": 200,
    "response_text": "팀 미션 진행 시 퍼실리테이터의 역할은 팀에게 적극적으로 도움을 제공하는 것입니다. 퍼실리테이터는 ZEP에 항상 상주해 있으며, 필요할 때 1:1 피드백도 제공합니다."
  },
  {
    "input": "출석 인정 신청서 작성 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "출석 인정 신청서를 작성하는 방법은 다음과 같습니다: 1. **입실 시간과 퇴실 시간 표기 불필요**: 하루 동안 출석 인정을 승인받는 과정이기 때문에 입실 시간과 퇴실 시간의 표기는 사용되지 않습니다. 2. **훈련생서명**: 훈련생 서명은 자필 서명으로 작성해야 합니다. 자필 서명이 어려운 경우, 전자 서명으로 정자체로 작성해야 합니다. 3. **증빙 서류 제출**: 출석 입력 요청 대장도 함께 작성하여 PDF 1개의 파일로 제출해야합니다. 이 지침을 따라 출석 인정 신청서를 작성하시면 됩니다."
  },
  {
    "input": "병가 시 필요한 증빙서류는 무엇인가요?",
    "status_code": 200,
    "response_text": "병가 시 필요한 증빙서류는 다음과 같습니다: 1. 병원 방문 날짜와 병원 직인이 포함된 서류 2. 간이 진단서 및 처방전은 적용이 불가합니다. 3. 대학병원 진료의 경우, 진료 확인서 대신 영수증 제출이가능합니다. 4. 치과 진료 및 피부과 시술 진료는 적용이 불가합니다."
  },
  {
    "input": "예비군 훈련 시 출석 인정 절차는 무엇인가요?",
    "status_code": 200,
    "response_text": "예비군 훈련 시 출석 인정을 받기 위해서는 입실시간과 퇴실시간을 표기하지 않고, 하루 동안 출석 인정을 승인받는 과정이 필요합니다. 또한, 훈련생 서명은 자필 서명으로 작성해야 합니다."
  },
  {
    "input": "면접 참여로 인한 출석 인정 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "면접 참여로 인한 출석 인정은 대회 참석 후 바로 채용으로 이어지는 경우에만 소요 일수만큼 출석 인정이 가능합니다. 만약 이후 채용의 이유로 수업 참석이 어려울 경우, 중도 포기 처리됩니다."
  },
  {
    "input": "졸업식 등 기타 사유로 출석을 인정받을 수 있나요?",
    "status_code": 200,
    "response_text": "네, 졸업식 등 중요한 사유로 출석을 인정받을 수 있습니다. 그러나 이를 위해서는 사전에 해당 사유를 증빙할 수 있는 자료를 제출하고, 담당자와 상의하여 승인을 받아야 합니다. 구체적인 절차와 필요 서류에 대해서는부트캠프 운영팀에 문의하시기 바랍니다."
  },
  {
    "input": "중도포기서 제출 방법은 무엇인가요?",
    "status_code": 200,
    "response_text": "중도포기서를 제출하려면 작성한 중도포기서와 취업확인서의 PDF 또는 원본 파일을 통합신청센터를 통해 제출해야 합니다. 구체적인 절차는 다음과 같습니다: 1. 통합신청센터에 접속합니다. 2. 중도포기신청 메뉴로 이동합니다. 3. 서류첨부를 통해 중도포기서와 취업확인서를 제출합니다."
  },
  {
    "input": "출석을 인정받기 위해 증빙서류를 어디에 제출해야 하나요?",
    "status_code": 200,
    "response_text": "출석을 인정받기 위해서는 증빙서류를 부트캠프 운영팀에 제출해야 합니다. 보통 운영팀의 이메일이나 지정된 온라인 포털을 통해 제출할 수 있습니다. 정확한 제출 방법과 이메일 주소는 부트캠프 시작 시 제공된 안내 자료나 운영팀에문의하여 확인하는 것이 좋습니다."
  },
  {
    "input": "훈련 장려금 지급 절차는 어떻게 진행되나요?",
    "status_code": 200,
    "response_text": "훈련 장려금 지급 절차는 다음과 같이 진행됩니다: 1. **단위 기간 종료 후 출석 정정 신청**: 훈련 장려금은 출석과 연관되어 있기 때문에, 출석 정정을 할 수 있는 기간이 제공됩니다. 이 과정은약 1주일이 소요됩니다. 2. **훈련 기관에서 대리 신청**: 각 단위 기간이 종료된 후, 훈련 기관에서 훈련 장려금을 대리 신청합니다. 3. **지급일**: 훈련 장려금은 단위 기간 종료 후 최소 1개월 이후에지급됩니다. 이 절차를 통해 훈련 장려금이 지급됩니다."
  },
  {
    "input": "출석 정정이 필요한 경우, 어떻게 신청하나요?",
    "status_code": 200,
    "response_text": "출석 정정이 필요한 경우, 다음과 같은 절차를 따르시면 됩니다: 1. **단위 기간 종료 이후 출석 정정 신청**: 출석은 훈련 장려금과 연관되어 있기 때문에, 출석 정정을 할 수 있는 기간을 제공합니다.이 과정은 약 1주일이 소요됩니다. 2. **출석 이의 신청한 내용 확인**: 제출한 증빙 자료 및 출석 데이터를 확인하는 업무가 진행됩니다. 이 과정은 약 2~3일이 소요됩니다. 3. **고용센터 출석 정정 공문요청 및 처리**: 출석 정정 건에 대한 수정 요청은 공문을 통해 요청 및 처리됩니다. 이 과정은 약 2~4일이 소요됩니다. 따라서, 출석 정정이 필요하신 경우, 해당 절차에 따라 신청하시면 됩니다."
  },
  {
    "input": "카카오 클라우드 관련 강의의 주요 주제는 무엇인가요?",
    "status_code": 200,
    "response_text": "카카오 클라우드 관련 강의의 주요 주제는 다음과 같습니다: 1. **클라우드 컴퓨팅 기초**: 클라우드 컴퓨팅의 기본 개념과 원리, 클라우드 서비스 모델(IaaS, PaaS, SaaS) 및 배포 모델(퍼블릭, 프라이빗, 하이브리드)에 대해 학습합니다. 2.**카카오 클라우드 플랫폼 소개**: 카카오의 클라우드 플랫폼 구조와 주요 기능, 플랫폼의 장점 및 사용 사례에 대해 다룹니다. 3. **인프라 서비스**: 카카오 클라우드에서 제공하는 가상 서버, 네트워크, 스토리지 등의 인프라 서비스에대해 학습합니다. 4. **데이터 서비스**: 데이터베이스, 빅데이터 분석, 데이터 저장소 등 카카오 클라우드의 데이터 관련 서비스에 대해 다룹니다. 5."
  },
  {
    "input": "팀 미션 발표 준비 시 유의사항은 무엇인가요?",
    "status_code": 200,
    "response_text": "팀 미션 발표 준비 시 유의사항에 대한 구체적인 정보는 제공된 문맥에 포함되어 있지 않습니다. 그러나 일반적으로 팀 미션 발표를 준비할 때 유의할 사항은 다음과 같습니다: 1. **역할 분담**: 팀원 간에역할을 명확히 분담하여 각자의 책임을 명확히 합니다. 2. **커뮤니케이션**: 팀원 간의 원활한 소통을 유지하여 진행 상황을 공유하고 문제를 해결합니다. 3. **시간 관리**: 발표 준비와 연습에 충분한 시간을 할애하고, 발표 시간을엄수합니다. 4. **자료 준비**: 발표 자료(슬라이드, 시연 등)를 체계적으로 준비하고, 시각적으로 명확하게 만듭니다. 5. **리허설**: 발표 전에 여러 차례 리허설을 통해 발표 내용을 숙지하고, 예상 질문에 대비합니다. 6. **퍼실리테이터의 도움**:제공된 문맥에 따르면, 퍼실리테이터가 ZEP에 상주해 있으므로, 필요 시 적극적으로 도움을 받는 것이 좋습니다. 이 외에도 팀 미션 발표와 관련된 구체적인 지침이 있다면, 해당 지침을 따르는 것이 중요합니다."
  },
  {
    "input": "구름 EXP 대시보드를 통해 제공되는 기능은 무엇인가요?",
    "status_code": 200,
    "response_text": "구름 EXP 대시보드를 통해 제공되는 주요 기능은 다음과 같습니다: 1. **코드 에디터**: 실시간으로 코드를 작성하고 실행할 수 있는 환경을 제공합니다. 2. **문제 풀이**: 다양한 프로그래밍 문제를 풀고, 자신의 실력을 테스트할수 있습니다. 3. **채점 시스템**: 작성한 코드의 정확성을 자동으로 채점해 주는 시스템을 갖추고 있습니다. 4. **통계 및 분석**: 자신의 학습 진행 상황과 성과를 시각적으로 확인할 수 있는 통계 및 분석도구를 제공합니다. 5. **커뮤니티 기능**: 다른 사용자들과 소통하고, 질문과 답변을 주고받을 수 있는 커뮤니티 기능을 지원합니다. 6. **학습 자료 제공**: 각종 튜토리얼, 강의 자료, 예제 코드 등을 통해 학습을 지원합니다.이러한 기능"
  },
  {
    "input": "ZEP 플랫폼에서 퍼실리테이터와 어떻게 소통하나요?",
    "status_code": 200,
    "response_text": "ZEP 플랫폼에서 퍼실리테이터와 소통하려면, ZEP에 항상 상주해 계시는 퍼실리테이터님에게 직접 메시지를 보내거나, 팀 미션 진행 시 적극적으로 도움을 요청하면 됩니다. 퍼실리테이터는 1:1 피드백도 제공하므로, 필요할 때 언제든지 소통할 수 있습니다."
  }
]

Expected behavior

PDF에 주어진 정보들에 대해서 카카오 부캠 정보를 적절히 검색 해야함

Solution

참고 사이트: https://wikidocs.net/231364 앤드류응 강의

jieun-lim commented 2 months ago

RAG 성능 테스트를 위한 질문 리스트업입니다.

데이터는 디스코드에 올려두었습니다

  1. 교육 중간에 탈락하면 페널티가 있어?
  2. 훈련 장려금은 얼마야?
  3. 출석 확인은 어떻게 해?
  4. 카카오 클라우드 교육 채널에 어떻게 로그인해?
  5. 인프런 강의 지원은 어떻게 받을 수 있어?
  6. 사원증은 언제 배부돼?
  7. 8월 교육 일정은 어떻게 돼?
  8. 팀 미션 세부 내용은 뭐야?
  9. ChatGPT Plus 지원 방법은 어떻게 돼?
  10. 교육 중도 포기 시 불이익이 있어?
  11. 출석 인정 기준은 무엇이야?
  12. 출석 입력요청대장은 어떻게 작성해?
  13. Colab Pro+ 지원 내용은 뭐야?
  14. 카카오테크 부트캠프 가는 길은?
  15. 클라우드 강의 일정은 어떻게 돼?
  16. 포기 사유가 취업일 경우 어떻게 해야 해?
  17. 예비군 훈련 시 출석 인정 서류는 무엇이야?
  18. 중도포기서 제출 방법은?
  19. 방학과 토요일 수업 안내는 어떻게 돼?
  20. 교육 중도 포기 시 국민내일배움카드 사용에 불이익이 있어?

대충 이정도 리스트업 해보았습니다.

jieun-lim commented 2 months ago

변경점

공통점

  1. 큰 공통주제 앞에 [title : ]을 붙임
    Title : Corab Pro+지원 내용

    오류 수정

  2. 정보를 찾지 못한 답변들은 데이터를 구조화시켰음.
  3. 요약 작업을 진행
  4. 중요한 텍스트 강조
  5. 훈련 장려금 기준:
    • 출석율 80% 이상: 최대 116,000원 (일 5,800원)
    • 출석율 80% 미만: 미지급
  6. K-디지털 트레이닝 특별훈련수당:
    • 출석율 80% 이상: 최대 200,000원
    • 출석율 80% 미만: 미지급 - 결석 시: 1일 결석마다 1만 원 차감
  7. 총 합계: - 1일 출석 시: 15,800원 (훈련장려금 + 특별훈련수당)
    • 계산식: 출석일수 X 15,800원 중요: 출석율 80% 이상을 유지해야 최대 혜택을 받을 수 있습니다.
      
      ## 확인해야 할 점
  8. 답변 성공률(ex_RAG실패했던 "중도 페널티", "GPT plus 지원" 등)
    {
    "input": "훈련 장려금은 얼마야?",
    "status_code": 200,
    "response_text": "죄송하지만, 현재 훈련 장려금에 대한 정확한 금액 정보를 가지고 있지 않습니다. 
    }
  9. 링크가 포함된 답변 가능 여부
    {
    "input": "카카오 클라우드 교육 채널에 어떻게 로그인해?",
    "status_code": 200,
    "response_text": "카카오 클라우드 교육 채널에 로그인하려면 아래 단계를 따라주세요:\n\n1. 제공된 링크로 접속합니다. (링크는 안내 메시지에 포함되어 있을 것입니다.)\n2. 본인의 카카오 계정으로 로그인합니다.\n\n로그인이 잘 되는지 확인해주시고, 만약 로그인이 안 되는 경우에는 스레드에 메시지를 남겨주시면 내일 오전까지 일괄 확인해드린다고 합니다. \n\n추가적인 도움이 필요하시면 다시 문의해주세요!"
    }
jieun-lim commented 2 months ago

0819 RAG_eval() 함수 수행 결과

문제점

  1. 웹 브라우저를 열고 다음 URL로 이동합니다: 카카오테크 부트캠프 바로가기
  2. 로그인 페이지가 나타나면, 카카오 계정으로 로그인합니다. 카카오 계정이 없다면, 먼저 계정을 생성해야 합니다.
  3. 로그인 정보를 입력하고 '로그인' 버튼을 클릭합니다.
  4. 로그인 후, 부트캠프 관련 정보를 확인하고 필요한 활동을 진행합니다.

만약 로그인이 안 되는 경우, 스레드에 메시지를 남기면 내일 오전까지 일괄 확인해드린다고 하니 참고하시기 바랍니다. Predicted Grade: GRADE: CORRECT

The student's answer provides a detailed step-by-step process for logging into the KakaoTech Bootcamp, which includes the true answer's key points: accessing the provided link and logging in with a Kakao account. The additional information does not conflict with the true answer.

Example 3: Question: What should participants do if they encounter issues logging in for the Kakao Cloud education? Real Answer: They should leave a message in the thread for batch verification. Predicted Answer: The provided context does not include specific instructions for participants who encounter issues logging in for the Kakao Cloud education. If you encounter such issues, it would be best to contact the support team or refer to any official communication from the organizers for further assistance. Predicted Grade: INCORRECT

Example 4: Question: What are the dates and times for the KakaoTech Bootcamp, and where will it be held? Real Answer: The KakaoTech Bootcamp will be held from August 6th (Tuesday) to August 13th (Tuesday) for six days, from 09:00 to 18:00. It will take place online via Zoom and offline at the Pangyo KakaoTech Bootcamp location. Predicted Answer: The KakaoTech Bootcamp will be held from August 6th (Tuesday) to August 13th (Tuesday), from 09:00 to 18:00 each day. It will take place both online (via Zoom) and offline at the KakaoTech Bootcamp in Pangyo. Predicted Grade: CORRECT

Example 5: Question: According to the document, which bus numbers can you take from 판교역 서편 정류장 to reach 메디포스트 정류장? Real Answer: You can take bus numbers 375 or 380 from 판교역 서편 정류장 to reach 메디포스트 정류장. Predicted Answer: You can take bus numbers 375 or 380 from 판교역 서편 정류장 to reach 메디포스트 정류장. Predicted Grade: CORRECT

Example 6: Question: How many bus stops are there between the starting point at 판교역 서편 정류장 and the destination at 메디포스트 정류장? Real Answer: There are 2 bus stops between the starting point at 판교역 서편 정류장 and the destination at 메디포스트 정류장. Predicted Answer: There are two bus stops between the starting point at 판교역 서편 정류장 and the destination at 메디포스트 정류장. Predicted Grade: CORRECT

Example 7: Question: Chat GPT Plus 구독 서비스의 월 이용료는 얼마입니까? Real Answer: Chat GPT Plus의 월 이용료는 $20입니다. Predicted Answer: ChatGPT Plus 구독 서비스의 월 이용료는 $20입니다. Predicted Grade: CORRECT

Example 8: Question: What types of subscription fees are supported under the 지원 대상 and how many times can each be supported? Real Answer: The 지원 대상 supports subscription fees for ChatGPT Plus, ChatGPT API, Claude, and Colab Pro+. ChatGPT Plus, ChatGPT API, or Claude can be supported a total of 6 times, while Colab Pro+ can be supported a total of 5 times. Predicted Answer: I'm sorry, but the provided context does not include information about the types of subscription fees supported under the 지원 대상 or the number of times each can be supported. Predicted Grade: INCORRECT

Example 9: Question: 지원 신청의 기한과 방법은 무엇인가요? Real Answer: 지원 신청의 기한은 2024년 8월 6일(화) 오후 3시까지이며, 신청 방법은 아래 제공된 구글폼 링크를 통해 구독료 지원 신청서를 제출하는 것입니다. Predicted Answer: 죄송합니다만, 제공된 정보에는 지원 신청의 기한과 방법에 대한 내용이 포함되어 있지 않습니다. 추가적인 정보를 확인해 보시거나 관련 부서에 문의해 보시는 것이 좋겠습니다. Predicted Grade: INCORRECT

The student's answer does not provide the specific details about the application deadline and method, which are clearly stated in the true answer.

jieun-lim commented 2 months ago

To Do

  1. 성능 테스트 코드 짜보기

    • [ ] 질문을 잘 생성하도록 문서 splitter 다시 생성해보기 : title 문단 단위로 스필리터 다시 생성해보기
  2. RAG 모델 향상

    • [ ] chunk splitter - title 단위
    • [ ] vector DB - faiss
    • [ ] 검색기 - reranker 적용하기
Oh-JunTaek commented 2 months ago

{ "카카오 부트캠프의 상세 주소를 알려주세요.": "카카오 부트캠프의 상세 주소는 다음과 같습니다:

경기도 성남시 분당구 판교역로 235 에이치스퀘어 N동 8층

추가적인 정보나 문의사항이 있으시면 카카오 부트캠프 공식 웹사이트를 참고하시기 바랍니다." , "카카오 부트캠프에 주차 지원이 되나요?": "카카오 부트캠프에서는 주차 지원이 제공되지 않습니다. 대중교통을 이용하거나 인근 유료 주차장을 이용해야 합니다. 부트캠프에 참여하기 전에 교통편을 미리 계획하는 것이 좋습니다." , "카카오 부트캠프에서 제공되는 교육 내용은 무엇인가요?": "카카오 부트캠프에서 제공되는 교육 내용은 카카오 클라우드 및 생성형 AI, 크램폴린 IDE에 대한 이론 강의 및 실습입니다." , "카카오 부트캠프에서 출석 인정 기준은 무엇인가요?": "카카오 부트캠프에서 출석 인정 기준은 다음과 같습니다: 1. 사설 대회 참여로 인한 출석 인정은 대회 참석 후 바로 채용으로 이어지는 경우에만 가능합니다. 이 경우 소요된 일수만큼 출석이 인정됩니다. 2. 이후채용의 이유로 수업 참석이 어려울 경우 중도포기 처리됩니다. 3. 졸업식, 국민취업지원제도 상담 등 위에 기재되지 않은 사유는 출석 인정이 불가합니다. 따라서 출석 인정이 가능한 경우는 매우 제한적이며, 주로 채용과 직접적으로관련된 경우에만 인정됩니다." , "카카오 부트캠프의 교육 시간표를 알고 싶어요.": "카카오 부트캠프의 교육 시간표는 다음과 같습니다: - 기간: 8/6(화) - 8/13(화) (6일) - 시간: 09:00 - 18:00 교육은 온라인(Zoom 강의실)과 오프라인(판교 카카오테크 부트캠프)에서 진행됩니다. 주제는 카카오 클라우드 및 생성형 AI,크램폴린 IDE이며, 이론 강의 및 실습으로 구성되어 있습니다." , "인프런 강의 신청 방법을 알려주세요.": "인프런 강의를 신청하는 방법은 다음과 같습니다: 1. 인프런 계정 로그인: 먼저, 인프런 웹사이트에 접속하여 제출한 인프런 계정으로 로그인합니다. 2. 강의 검색: 원하는 강의를 검색합니다. 인프런의 검색 기능을 사용하여 관심 있는주제나 강의를 찾아보세요. 3. 강의 선택: 수강하고자 하는 강의를 선택합니다. 강의 페이지에서 강의 내용을 확인하고, 수강 신청을 결정합니다. 4. 수강 신청: 강의 페이지에서 '수강 신청' 버튼을 클릭합니다. 부여된 크레딧을 사용하여강의를 신청할 수 있습니다. 5. 크레딧 사용 확인: 수강 신청 시 부여된 크레딧이 사용되는지 확인합니다. 개인 비용을 추가하여 강의를 구매할 수는 없으므로, 크레딧 내에서 강의를 선택해야 합니다. 이 과정을 통해인프런 강의를 신청할 수 있습니다. 추가로 궁금한 사항이 있으면 언제든지 문의해 주세요." , "인프런 크레딧 지원에 대해 설명해주세요.": "인프런 크레딧은 인프런에서 제공하는 강의를 수강할 때 사용할 수 있는 포인트 시스템입니다. 크레딧을 사용하면 강의를 할인된 가격에 수강할 수 있습니다. 인프런 크레딧은 다양한 방법으로 획득할 수 있습니다.

  1. 회원 가입: 신규 회원 가입 시 일정량의 크레딧을 받을 수 있습니다.
  2. 강의 구매: 강의를 구매할 때마다 일정 비율의 크레딧이 적립됩니다.
  3. 이벤트 참여: 인프런에서 진행하는 다양한 이벤트에 참여하여 크레딧을 받을 수 있습니다.
  4. 리뷰 작성: 수강한 강의에 대한 리뷰를 작성하면 크레딧이 적립됩니다.

크레딧은 인프런 웹사이트나 모바일 앱에서 확인할 수 있으며, 강의 결제 시 사용할 수 있습니다. 크레딧의 유효기간이 있을 수 있으므로, 사용 기한을 확인하는 것이 좋습니다." , "인프런 강의 수강 시 할인 혜택이 있나요?": "네, 인프런에서는 다양한 할인 혜택을 제공하고 있습니다. 주기적으로 진행되는 할인 이벤트나 프로모션 코드를 통해 강의를 할인된 가격에 수강할 수 있습니다. 또한, 특정 기간 동안 진행되는 특별 할인 행사나 시즌별 할인도 있으니 인프런 웹사이트나 뉴스레터를 통해 최신 정보를 확인해 보세요." , "인프런 강의 신청 기간은 언제인가요?": "인프런은 특정한 강의 신청 기간이 정해져 있지 않습니다. 대부분의 강의는 언제든지 신청할 수 있으며, 결제 후 바로 수강이 가능합니다. 다만, 일부 특별 강의나 이벤트 강의는 신청 기간이 정해져 있을 수 있으니, 해당 강의의 상세 페이지를 확인하는 것이 좋습니다." , "인프런 강의 신청에 제한이 있나요?": "인프런에서는 대부분의 강의에 대해 신청 제한이 없습니다. 원하는 강의를 자유롭게 선택하고 신청할 수 있습니다. 다만, 일부 특정 강의나 이벤트 강의의 경우 제한이 있을 수 있으니, 해당 강의의 상세 페이지를 확인하는 것이 좋습니다. 또한, 유료 강의의 경우 결제가 필요하며, 결제 후에 강의를 수강할 수 있습니다." , "클라우드 과정 자격증 지원 내용은 무엇인가요?": "클라우드 과정 자격증 지원 내용은 AWS, CK, A, CKAD, CKS, KCNA 등의 자격증을 포함합니다. 그 외 교육 과정과 연관이 있다고 판단되는 자격증의 경우에도 추가 지원이 가능합니다. 자세한 내용은 지원을 희망하는자격증 정보(명칭, 응시 정보, 비용 등)를 각 회차 별 게시판을 통해 교육 운영 관리자에게 문의해주시기 바랍니다." , "응시료 지원을 위한 제출 서류는 무엇인가요?": "응시료 지원을 위한 제출 서류는 병원방문 날짜와 병원직인이 포함된 서류를 제출해 주셔야 합니다. 간이 진단서 및 처방전만 제출 시 적용이 불가합니다. 대학병원 진료의 경우 진료확인서 대신 영수증 제출이 가능합니다. 다만,치과 진료 및 피부과 시술 진료는 적용이 불가합니다." , "자격증 응시료 지원 신청 방법을 알려주세요.": "자격증 응시료 지원 신청 방법은 다음과 같습니다:

  1. 지원 자격 확인: 먼저, 자격증 응시료 지원을 받을 수 있는 자격이 있는지 확인해야 합니다. 이는 각 기관이나 단체마다 다를 수 있으므로, 해당 기관의 홈페이지나 안내문을 참고하세요.

  2. 필요 서류 준비: 일반적으로 필요한 서류는 다음과 같습니다.

    • 응시료 영수증
    • 자격증 시험 접수 확인서
    • 신분증 사본
    • 지원 신청서 (해당 기관에서 제공하는 양식)
  3. 신청서 작성: 해당 기관의 홈페이지에서 지원 신청서를 다운로드하여 작성합니다. 작성 시 필요한 정보를 정확히 기입해야 합니다.

  4. 서류 제출: 준비한 서류를 해당 기관에 제출합니다. 제출 방법은 우편, 이메일, 온라인 제출 등 다양할 수 있으니, 해당 기관의 안내에 따라 제출하세요.

  5. 결과 확인: 서류 제출 후, 지원 신청 결과를 확인합니다. 이는 보통 이메일이나 문자 메시지로 통보됩니다.

  6. 지원금 수령: 지원 신청이 승인되면, 지정된 계좌로 지원금이 입금됩니다. 입금 시기를 확인하고, 문제가 있을 경우 해당 기관에 문의하세요.

각 기관마다 절차가 다를 수 있으므로, 정확한 정보는 해당 기관의 공식 홈페이지나 고객센터를 통해 확인하는 것이 좋습니다." , "응시료 지원 대상 자격증 목록을 알려주세요.": "응시료 지원 대상 자격증 목록은 기관이나 프로그램에 따라 다를 수 있습니다. 일반적으로 정부나 지방자치단체, 교육기관에서 지원하는 경우가 많습니다. 예를 들어, 한국의 경우 고용노동부나 지방자치단체에서 특정 자격증에 대해 응시료를 지원하는 프로그램이 있습니다. 대표적인 자격증으로는 다음과 같은 것들이 있습니다:

  1. 국가기술자격증 (예: 전기기사, 정보처리기사 등)
  2. 국가공인자격증 (예: 사회복지사, 보육교사 등)
  3. 어학 자격증 (예: 토익, 토플, HSK 등)
  4. IT 자격증 (예: 컴퓨터활용능력, 정보기술자격증 등)

각 기관의 지원 정책에 따라 다를 수 있으므로, 해당 기관의 공식 웹사이트나 공지사항을 참고하는 것이 좋습니다." , "응시료 지원 신청 기한은 언제인가요?": "응시료 지원 신청 기한은 각 시험이나 프로그램에 따라 다를 수 있습니다. 일반적으로 해당 기관의 공식 웹사이트나 공지사항을 통해 확인할 수 있습니다. 특정 시험이나 프로그램에 대한 정보를 알고 계시면, 더 정확한 답변을 드릴 수 있습니다." , "사원증 배부 일정이 어떻게 되나요?": "사원증 배부 일정은 회사마다 다를 수 있습니다. 일반적으로는 다음과 같은 절차를 따릅니다:

  1. 신규 입사자 교육 기간 중 배부
  2. 특정 날짜에 일괄 배부
  3. 부서별로 개별 배부

정확한 일정은 인사팀이나 해당 부서에 문의하는 것이 가장 좋습니다. 회사 내부 공지나 이메일을 통해 안내받을 수도 있습니다." , "사원증 배부 장소는 어디인가요?": "사원증 배부 장소는 보통 인사부서나 총무부서에서 담당합니다. 회사마다 다를 수 있으니, 정확한 위치는 회사 내부 공지나 인사부서에 문의해 보시는 것이 좋습니다." , "사원증으로 출입이 가능한 시점은 언제인가요?": "사원증으로 출입이 가능한 시점은 회사마다 다를 수 있습니다. 일반적으로는 회사의 운영 시간 동안 출입이 가능하며, 일부 회사는 24시간 출입이 가능하도록 설정하기도 합니다. 정확한 출입 가능 시간은 회사의 보안 정책이나 규정에 따라 다를 수 있으므로, 회사의 인사팀이나 보안팀에 문의하는 것이 좋습니다." }

주소를 옆건물로 알려주네요?????? 이 부분 체크해보겠습니다 test_results_20240827_212529.json

jieun-lim commented 2 months ago

요청 사항

Oh-JunTaek commented 2 months ago
  1. 데이터 최신화 후 질문보완을 다시 진행하겠습니다.
  2. 부트캠프 단어가 들어간 내용은 잘 답변했는데 사원증,은 아예 정보를 못찾은듯 했는데 이 부분은 데이터 정제가 잘 안된거 같아서 정제후 재시도 하겠습니다. 그 외에 교육관련도 데이터를 정제해야 할 것 같습니다. 분석결과 링크첨부가 된 부분은 링크 답변을 하지 않고 못찾았다고 반환하네요
  3. 데이터정제이슈까지 포함하면 적중률이 50% 가 살짝 안되는데 이부분은 데이터의 문제도 있어서 정제부터 한 번 하고오겠습니다. 그리고 예상답변이아닌 실제 결과물입니다 image ㄷELSE 표시된건 RAG 기반답변을 하지 못했다는 뜻입니다
Oh-JunTaek commented 2 months ago

데이터 정제 0828

수정된 사항

  1. 중복되는 내용 제거
  2. 중분류가 되는 내용은 따로 빼서 RAG성능 향상 기대
  3. 특정 시점을 나타내는 단어(ex_오늘, 내일) 제거
  4. RAG에 성공했으나 잘못된 정보를 제공한 데이터 수정 (교육장소 주소)
  5. 팀 프로젝트 관련 변동사항 반영
  6. 표를 활용해서 명확한 구분을 통해 RAG성능 향상 기대

추가된 사항

  1. 지문 등록 일자
  2. 동아리 지원 안내
  3. 해커톤 안내
  4. 디스코드 퀴즈봇 안내

추후 변경해야할 내용

  1. 아직 공지가 나오지 않은 내용 -> 팀 리빌딩. 팀 발표 정확한 날짜
  2. 8/28 동아리공지 이후 나올 공지내용들(아마 온라인전환관련내용)

ktb_data_08.pdf

Oh-JunTaek commented 2 months ago

데이터 추가 변경사항이 있습니다. 0828-20:12

  1. 방학관련 title 오타가 있어서 수정했습니다. title이다 보니 수정안하면 검색에 차질이 있을 것 같아서 핫픽스합니다. 코드변경은 따로 하실 필요 없도록 파일명은 그대로 유지했습니다.
  2. 그 외 짜잘한 정리
  3. 테스트 코드 세밀하게 작성했습니다
    • 페이지 별로 분류
    • 대분류를 물어보는 질문 부터 내용을 정확히 파악했는지 확인 가능한 질문까지 넣음.(ex- 지각 6번하면 어떻게 되는거야? ->결석2회로 처리되어야 함)
  4. 출근시간 관련해서는 일부러 추가 안했습니다. 오늘 올라온 공지가 해석하기에 따라 다르기도 하고 얘들 공지 신뢰를 할 수 없어서....넣을까요? pdf data : ktb_data_08.pdf input json : user_inputs2.json
Oh-JunTaek commented 2 months ago

2차 데이터 정제 후 테스트 결과

주요 체크 포인트

  1. 비슷한 듯 하지만 서로 다른 타입의 질문 방식과 디테일을 체크하는 요소들이 골고루 들어가있음. 자세한 것은 json파일 참고

결과

  1. ELSE - RAG에서 정보를 찾지 못하고 일반 GPT 답변을 한 항목 image

  2. RAG를 통해 PDF에서 정보를 얻어서 답변을 한 항목 image

  3. RAG를 했으나 미흡하거나 정확하지 않은 답변

    1. 대중교통 알려주세요 - 근처 정류장 정차 정보는 제공되었지만 그건 찾지 못함.(혹은 질문이 잘못됨) 그러나 대안과 주소를 알려주었음.
    2. 9시 6분 출석시 지각? - 답변: "네, 오전 9시 6분에 출석체크를 했으므로 지각입니다. 정상 출석 인정 시간은 08:50부터 09:10까지입니다." gpt가 pdf는 잘 가져왔는데 문맥을 이해 못함. 데이터 수정이 필요함. 저 시간 범위 안이면 지각이 아니란 것을 알게 해야 함.
    3. 아픈데 출석인정 - 병결관련 문항이 있는데 제대로 못읽음
    4. 지문등록 - 있는데 데이터가 너무 짧아서 그런가 못가져왔네요
    5. 출석률에 따른 수료 인정 - 일반적인 케이스를 가져옴. 데이터 기반이 아님
    6. 지각 6번하면 ? - 데이터는 읽었으나 계산을 못함 (결석2회가 된다는 결론이 나오지 않음)
    7. 각 과정별 지원 자격증응시료? - ai랑 클라우드는 답변 잘하는데 풀스택만틀림.. 이유가 뭘까요?
    8. 불합격 응시료 지원? - 틀린답변함. 지원못받는데 가능한 경우 있다고 답변함
    9. 코렙지원해줘? - "코렙은 지원하지 않습니다. Colab Pro+ 외 다른 서비스의 지원은 불가합니다." RAG는성공적이였으나 유도리가 부족했음.
    10. 리빌딩/동아리/해커톤 - 다 제대로 못가져옴

그런데 제가 수정된 data를 활용하지 않은 듯한 결과네요? ㅜ 이상하다아~~

data 및 파일

pdf : ktb_data_08.pdf result json : test_results_3.json input json : user_inputs3.json

결론 요약

  1. RAG 성공비율 약 68%(29/43)
  2. RAG 적중률 약 65%(19/29)
jieun-lim commented 2 months ago

흠 그냥 finetuning 을 하는게 나을까요? 질문에 너무 대답을 잘 못하는 것 같긴 하네요 ㅠㅠ

jieun-lim commented 2 months ago

근데 궁금한 점이 있는데,

  1. pdf에 마크 다운 문법은 왜 사용하신 건지 여쭤봐도 될까요?

    • e.g. 지원료 안내
  2. 테스트 코드 짜신 거 공유 가능할까요?