Kaggle Days Meetup - Seoul (2019) 참가 후기

- 5 mins

4월 18일에 kaggle days meeptup이 서울에서 열렸다 :)! 한국에 몇 명 없는 캐글 마스터 중 한 분인 명대우님의 경험을 공유하는 세션이 있어서 꼭 참석하고 싶었는데, 다행히 선발 인원에 들어갔다. 앞으로 이런 자리가 자주 열리고, 한국에서 캐글이 더 많이 보편화되었으면 좋겠다. ㅎㅎ
정해진 일정은 아래와 같았다.

스케쥴

행사는 SDS잠실 사옥에서 열렸는데, 동관을 찾기가 쉽지않아 헤맸었다. ㅠㅠ.. 그래서 앞부분은 좀 놓쳤지만, 다행히 키노트 스피치는 처음부터 끝까지 들을 수 있었다! 이 포스팅은 주로 키노트 스피치를 들으면서 정리한 내용을 공유할 목적으로 작성되었다.

키노트 스피치 (Kaggle Master 명대우님)

명대우님은 “End-to-End, Raw Input, Single Model”이 정석이라고 생각하신다고 했다. 이 말이 내가 추구하는 방향과도 비슷해서 공감이 많이 되었다. 특히 좋은 single model을 설계하는게 매우 중요하다고 생각하기 때문이다. (물론 kaggle에선 ensemble없이는 최상위권에 진입하기 힘들긴하다.ㅠ)

뒤늦게 competition에 참여하는 경우

요즘은 active 대회가 많기 때문에 뒤늦게 시작하는 경우가 많은데, 이럴경우 most vote나 best score kernel을, 그중에서도 single model을 선택하여 시작하는 걸 추천하셨다. 그 다음 discussion에서 score boost가 있는 항목(ex: external data, different losses, different input generator, post processing, CV, ensemble 등)들을 찾아 구현한다. (나도 뒤늦게 대회를 시작할 경우 이 과정을 거치는 편이다. 특히 discussion에는 중요한 힌트들이 곳곳에 숨어있기에 계속 주시할 필요가 있다.)

정석적인 프로세스

그러나 위에는 여유가 없을 때의 작전이고, 정석대로 풀어서 상위권에 올라가고 싶을 때 해야할 것은 다음과 같다고 하셨다.

말씀하시길 이상향은 “End-to-End, Raw Input, Single Model”이지만, 스코어를 올리기 위해 다른 트릭이나 팁을 사용하게 된다고 하시며 끝마치셨다. ㅋㅋ 정말 공감간다.ㅋㅋ

후기

이후 시간은 자신이 관심있는 주제별로, 네트워킹을 가지는 시간이었는데, 이미 시간이 너무 늦어서 나는 참석하지 못하였다. 주제가 주로 도메인으로 나눠져 있었는데, 캐글 밋업인 만큼 대회관련된 주제였으면 어땠을까 싶다. 키노트는 정말 알찬 내용이 가득했다. 정말 아낌없이 공유해주신걸 느꼈다. ㅠㅠ ㅎㅎ 앞으로도 이런 밋업이 자주 열렸으면 좋겠다!

Huiwon Yun

Huiwon Yun

아무것도 하지않으면 아무일도 일어나지 않는다.

comments powered by Disqus
rss facebook twitter github youtube mail spotify instagram linkedin google google-plus pinterest medium vimeo stackoverflow reddit quora