대외활동/데이크루 1기

[데이크루] 3주차 활동 일지

동하조하 2022. 2. 5. 17:23

데이크루 1기 3주차 활동이 마무리되었다. 

데이크루 활동을 통해 대회에 적극적으로 참여하고 싶었는데 2주에 한번씩은 대회에 코드 공유를 올리면서 잘 실천해나가고 있는 것 같다.

생각보다는 시간을 많이 투자해야하는데 그만큼 얻는 것도 많다.

3주차에는 데이콘 Basic의 '집값 예측 경진대회'에 참여해서 모델링해본 결과를 게시글로 올렸는데 꽤 많은 사람들이 보고 좋아요도 눌러주어서 뿌듯했다. 

대회가 마감된 이 시점에서 상위에 랭크된 몇몇 분들이 내 코드를 참고하셨다고 하는걸 보니 기분이 굉장히 좋았다. 

시간이 내서 그 분들이 어떻게 상위에 랭크하게 되었는지 살펴보면 많이 배울 수 있을 것 같다.

정형 대회는 다른 문제(자연어처리, 비전 등)보다 접근하기 더 쉬운 것 같다. 참여자 수만 보더라도 알 수 있었다. 

현재 자연어 처리 분야에서 대회 '한국어 문장 관계 분류 경진대회'도 열리고 있어서 참여하고 싶은데 이 분야는 완전 무지해서 접근하기가 쉽지 않다. BERT 무엇? 공부 좀 해서 코드 공유해보면 좋을 것 같다.

 

아래는 내가 3주차에 올린 게시글이다.

 

1) [집값 예측 경진대회]코드 공유 〈GBR + RF + RG + NGB + 파생변수 (public : 0.09509)〉

 

202.01.24~02.04 기간에 개최된 집값 예측 경진 대회에 참여하였다.

완공 및 리모델링 년도, 생활 면적, 부엌 및 지하실 품질 등 의 변수를 바탕으로 집값을 예측하는 정형 문제였다. 

기존 코드 공유를 통해 알게 된 여러 머신러닝 모델을 예측한 결과를 조합하는 방식을 사용하였는데 파생 변수를 만들어서 수행해보니 더 좋은 결과를 얻을 수 있었다. 

Kaggle 의 'House Prices' 같은 비슷한 종류의 대회가 많아서 참고할 자료도 많았던 것 같다. 

초반에만 열심히 해서 결국 순위권안에는 못 들어갔지만 좋은 경험이 된 것 같다.

 

https://dacon.io/codeshare/4304?utm_source=dacrew&utm_medium=427790&utm_campaign=dacrew_1

 

GBR + RF + RG + NGB + 파생변수 (public : 0.09509)

집값 예측 경진대회

dacon.io

 

2) 코드 공유 〈KNN Classifier로 MNIST 손글씨 분류하기〉

 

수업 과제하면서 만든 코드인데 KNN에서 거리 척도를 어떻게 설정하는지에 따라서 결과가 조금씩 다르게 나온다.

이 점이 흥미로워서 같이 공유해보면 좋을 것 같아서 게시글을 작성했다.

MNIST 같은 유명한 데이터셋을 가지고 여러 실습을 진행해보는 것도 도움이 될 것 같다. 

 

https://dacon.io/codeshare/4391?utm_source=dacrew&utm_medium=427790&utm_campaign=dacrew_1

 

KNN Classifier로 MNIST 손글씨 분류하기

 

dacon.io

 

3) 토크 〈뉴런의 편향(bias)에 대한 새로운 시각〉

 

수업 듣다가 뉴런의 편향이 어떻게 학습되는지에 대해서 흥미롭게 들은 부분이 있어서 이를 정리해보았다.

기존에 수학적인 의미로만 알던 것을 실제 활용적인 면에서 데이터셋의 어떠한 특징을 편향이 대변하고 있는지 정리해볼 수 있었다.

 

https://dacon.io/forum/405903?utm_source=dacrew&utm_medium=427790&utm_campaign=dacrew_1

 

뉴런의 편향(bias)에 대한 또 다른 시각

 

dacon.io

 

* 본 포스팅은 데이콘 서포터즈 “데이크루" 1기 활동의 일환입니다.