1. 활용편 틀 구상하기
- kotra - 정적 / 번개장터 - 동적 / 공공데이터포털 - API, 정적
- 공공데이터포털은 kotra나 번개장터와는 조금 다른 결이기에 해당 사이트 특성에 맞게 진행하는 것이 좋을 듯 함
- (회원가입이 되어있다는 전제)
- 공공데이터포털 간단 소개
- 원하는 데이터 검색
- OpenAPI 활용신청
- 사용 모듈 간단 설명(requests, json 등)
- Key, 파라미터값 수정하여 값 불러오기
- json, xml -> csv 파일로 변환
- MySQL DB와 연동
- kotra, 번개장터
- 사이트 소개
- 해당 사이트 크롤링 목적
- 크롤링 가능 여부 체크
- 사이트 살펴보기(크롤링 할 부분의 요소, selector, xpath 등 확인)
- 크롤링
- DB에 저장
1) 한 페이지 또는 단일 요소 크롤링
2) 전체 크롤링
2. 기본편 추가 이슈사항 확인하기
- CH2 MySQL
: python에서 MySQL 사용법 추가
- CH3 크롤링
: Action Chains 이후에 추가 예정
3. 이후 집필 일정 정리하기
6/19(월) ~ 6/25(일) 활용편 집필
6/22(목) 16시/18시 회의
~ 7/1(토) 활용편 수정 진행
~ 7/7(금) 기본편, 활용편 검토
4. GitHub 레파지토리 만들기
- Organization : DAS-Crawling
- Repository : Python Beginner's Crawling Challenge