What! Studio : Day 1) <유저동향분석 시스템인 '유저보이스 2.0'에 Elasticsearch를 적용한 경험담> 감상 - 김웅룡
Created by JIN XIONGLONG [woongryong] on 4월 24, 2018
아직 ES 5 를 쓴다고 한다. 그래서 Mapping Type 아직 쓰고 있는데 어떻게 없앨지 고민이라고 한다. (어느 정대 대책은 이미 있지만).
스키마 관리에서 만큼은 듀랑고 장터 검색에서 사용하는 방식이 더욱 선진적인 것 같다 헤헤. (물론 우리가 이미 신버전 나오는 시대에 사용하기 시작한 원인도 있지만. 그리고 필자도 몰랐었다가 후에 팀원분이 알려주셔서 알게 되어 스키마 관리 선진화를 한거지만..)
Elasticsearch 쓰기 전에는 SphinX를 썼었다고 한다.
이 팀에서도 한글에 ngram 애널라이저를 쓴다고 한다. 좀 놀랐던 점은 min_gram: 1, max_gram: 1 설정을 쓴다는 점이었다. (min_gram은 이해. max_gram 은 아직 왜 이렇게 하는지 모르겠음.)
char_filter 중에 HTML stripper 가 (빌트인으로) 있다는걸 알았다.
한글자 단어 (e.g. "랙", "렉") 검색에 대한 일부 특이한 트릭키한 방법들을 소개하셨다. 기상천외했다. 해키쉬해보이지만 웬지 괜찮은 방법 같았고 효과도 좋았다. 해키쉬하지만 잘 망가질 것 같진 않았다. 하지만 제너럴화해서 보편적인 스킬 / 깨달음으로 승화시킬 수는 없는 방법들이었고, 구구절절 감상문에 다 담을 수도 없어서 생략하자.
총평
강연 주제와 아주 연관 있지는 않지만, 그냥 원래 하고 있던 생각을 연장시키는 계기였다:
한때는 검색엔진 하면 lucene 이었지만 요즘은 검색엔진 하면 Elasticsearch 다. (물론 후자가 전자를 내부적으로 사용한다.)
시대가 달라지면서 흔히 사용하는 추상레벨도 달라진 것 같다.
왓스튜디오 합류하고 난 뒤 얻은 2대 깨달음 중의 2번째: 튼튼한 추상화의 힘.
Document generated by Confluence on 5월 02, 2019 16:24