💡

3차 회의(오전 7시)

날짜
May 24, 2023
태그
회의

1. 일시: 2023.05.24

2. 참석자: 강병주, 김민정, 송유림, 이지은, 이혜정, 정서영, 조준희

3. 회의 안건

1️⃣
DB 프로그램 선택: MySQL

MYSQL

  • 무료로 사용가능
  • 작동을 위한 서버, 로컬 설치 필요
  • 복사하거나 내보낼 때 단일 파일로 압축 필요
  • 사용자 관리 시스템이 있어 다중 사용자 액세스에 적합
  • 데이터베이스 확장이 가능.
  • 내장 보안 메커니즘 有(사용자 이름, 암호, SSH 인증 등)
  • SQLite3와 비교했을 때 추가적인 설정이 필요함.
  • 서버의 크기가 약 600MB
 

SQLite3

  • 무료로 사용가
  • Python 내장 데이터베이스로 별도의 서버나 설치 필요 X
  • 정보를 단일 파일에 보관하므로 복제가 간단.
  • 사용자 관리 기능이 부족함.
  • 데이터베이스가 확장됨에 따라 필요 메모리가 증가하므로 성능 최적화가 어려움.
  • 기본 제공 인증 방법이 없어 누구나 액세스할 수 있음.
  • MYSQL과 비교했을 때 설정이 간단함.
  • 라이브러리의 크기가 약 250KB
 
→ 이유: 실무에서 SQLite3보다 MYSQL을 더 많이 사용.
Colab 환경에서 MYSQL 연결 가능한지 확인 후 금요일 오후 4시 미팅을 통해 환경 재논의.
 
2️⃣
공통의 틀&코드 논의

정해야 할 것

  • 기본편에서 사용할 TEST DB명
  • 기본편(환경설정, 웹크롤링, 데이터전처리) 집필 → 추후 시간 정해서 함께 집필 예정
    • (글씨체, 변수명 등도 함께 작성할 때 정하면서 집필)
  • 활용편의 경우, 각 예제마다 DB를 생성하게 되므로 추후 재논의.
    • (정적/동적 크롤링 예제의 경우 각자 조사 후 금요일 미팅 때 재논의)

정적 크롤링 예제 후보

동적 크롤링 예제 후보

  • 검색어
  • 주식
  • 페이지 넘기기, 클릭, 검색어 입력 등의 기능을 중심으로 조사할 수 있음.
  • 사이트의 웹 구조 참
문제 상황 정의 및 해결책으로서의 크롤링이라면 금상첨화
3️⃣
책 제목 논의 및 후보군 좁히기
  • 디스코드 내 라운지에서 이모지로 투표
    • 인당 3표
    • 답장 기능 활용하여 수정 가능
    • 투표 기간: 기본편 집필 완료 전까지(임의)
    •  
📌
4차 회의 사전 과제

1. MYSQL 연결해보기

  • Colab으로 가능한지 확인
  • 불가능할 경우, JupyterLab으로 환경설정

2. 크롤링 예제 서치

  • 정적 크롤링 예제 사이트와 이유
  • 동적 크롤링 예제 사이트와 이유
    • (이지은님 토요일 공유 예정)

3. 4차 회의 안건

  1. Colab or JupyterLab 환경 설정 논의
  1. 크롤링 예제 논의
  1. 기본편 공동 집필 시간 논의