1. 일시: 2023.05.24
2. 참석자: 강병주, 김민정, 송유림, 이지은, 이혜정, 정서영, 조준희
3. 회의 안건
DB 프로그램 선택: MySQL
MYSQL
- 무료로 사용가능
- 작동을 위한 서버, 로컬 설치 필요
- 복사하거나 내보낼 때 단일 파일로 압축 필요
- 사용자 관리 시스템이 있어 다중 사용자 액세스에 적합
- 데이터베이스 확장이 가능.
- 내장 보안 메커니즘 有(사용자 이름, 암호, SSH 인증 등)
- SQLite3와 비교했을 때 추가적인 설정이 필요함.
- 서버의 크기가 약 600MB
SQLite3
- 무료로 사용가
- Python 내장 데이터베이스로 별도의 서버나 설치 필요 X
- 정보를 단일 파일에 보관하므로 복제가 간단.
- 사용자 관리 기능이 부족함.
- 데이터베이스가 확장됨에 따라 필요 메모리가 증가하므로 성능 최적화가 어려움.
- 기본 제공 인증 방법이 없어 누구나 액세스할 수 있음.
- MYSQL과 비교했을 때 설정이 간단함.
- 라이브러리의 크기가 약 250KB
→ 이유: 실무에서 SQLite3보다 MYSQL을 더 많이 사용.
→ Colab 환경에서 MYSQL 연결 가능한지 확인 후 금요일 오후 4시 미팅을 통해 환경 재논의.
공통의 틀&코드 논의
정해야 할 것
- 기본편에서 사용할 TEST DB명
- 기본편(환경설정, 웹크롤링, 데이터전처리) 집필 → 추후 시간 정해서 함께 집필 예정
(글씨체, 변수명 등도 함께 작성할 때 정하면서 집필)
- 활용편의 경우, 각 예제마다 DB를 생성하게 되므로 추후 재논의.
(정적/동적 크롤링 예제의 경우 각자 조사 후 금요일 미팅 때 재논의)
동적 크롤링 예제 후보
- 검색어
- 주식
- 페이지 넘기기, 클릭, 검색어 입력 등의 기능을 중심으로 조사할 수 있음.
- 사이트의 웹 구조 참
⇒ 문제 상황 정의 및 해결책으로서의 크롤링이라면 금상첨화
책 제목 논의 및 후보군 좁히기
- 디스코드 내 라운지에서 이모지로 투표
- 인당 3표
- 답장 기능 활용하여 수정 가능
- 투표 기간: 기본편 집필 완료 전까지(임의)