[후기글] DEVIEW 2017 DAY2
난생 처음 DEVIEW에 가보다
매년 DEVIEW 시즌이면 항상 이래저래 일이 생기거나 신청이 늦어 10년동안 한차례도 참석해 본적이 없었다. DEVIEW는 네이버가 주관하는 국내 최대 개발자 컨퍼런스 행사로 올해로 10주년을 맞았다. DAY1은 아쉽게 놓쳤지만 DAY2에 참석한 소감과 발표된 내용에 대한 간단 리뷰를 작성해 보려고 한다. 세션은 주관적인 취향에 의해 선택된 것이므로 몸이 여러개라면 전 트랙을 돌며 다 듣고 싶었지만 몸이 하나인 관계로 몇몇 세션에 대한 리뷰글을 적어 보려 한다.
DAY2 세션 구성 관련
필자는 DAY2만 갔기 때문에 DAY1의 내용은 잘 모른다. DAY2에는 인공지능, 딥러닝, 빅데이터, 분산처리 등등 다양한 주제들이 발표되었다. 필자가 먹고 살기 위해 하는 일과 아주 유사하다고 생각되는 분야를 듣기 위해 세션 선택에 심혈을 기울였으나, TRACK을 잘 못 입장하여 다소 거리가 먼 주제들도 몇몇 듣게 되었다. 그리고 세션 발표 주제가 drop된 것인지 특정 시간대에는 모든 TRACK이 다 활성화 되지 않아 아쉬웠다.
Clova Music
허겁지겁 입장한 TRACK에선 예상했던 주제와 다른 내용이;; 아뿔싸 옆에 TRACK이네? 호기롭게 맨앞까지 진출하여 다시 돌아 나가기 뻘쭘하여 세션을 들어보기로 결정 Clova Music 추천에 대해 이야기 하고 있다.
집에 인공지능 스피커 하나쯤은 누구나 있으시잖아요? 저도 집에 하나 있어요 인공지능스피커에서 원하는 음악을 듣기 위해서는 인공지능 스피커가 알아 들을 수 있는 문장으로 말해야 해요 feat. 필자
아직까진 그렇게 지능적이지 않은 인공지능 스피커 집에서는 거의 스피커 역할로 쓰고 있지만 인공지능 기술과 결합하여 더 나은 서비스들이 많이 제공될것이라고 기대해 본다. 이번 세션에서는 Clova AI가 내장된 인공 지능 스피커에서 play pattern을 통해 어떻게 추천할 것인가와 이를 최적화 하여 서비스 하는 방법에 대해 말하고 있다. - 까지만 자료에서 보았고 트랙 찾느라 입장은 다음 내용부터 해서 앞부분을 듣지 못하였다.
하이라이트 추출 - 음원 서비스에서 미리 듣기를 하면 앞에서부터 1분 play하다가 뚝 끊키기 마련, mel-spectrogram을 이용하여 딥러닝 CRAN으로 학습하고 장르별 하이라이트를 추출하여 데모를 보여주었다. 개인적으로 음원 유료사용자이기에 감흥은 별로 없었으나 미리 듣기 서비스에 적절한 하이라이트 부분이 나온다면 구매를 촉진할 수도 있겠구나 라는 생각을 하였다. 이외에도 감성 모델링에 대한 부분을 약간 다루었으나 Research차원에서 작성된거라 서비스까지는 좀 기다려 봐야 할거 같다.
https://www.slideshare.net/deview/221-dj-clova-music
Neural Machine Translation (NMT) 동작의 시각화 및 분석 방법
papago서비스의 NMT과 같은 문장 생성 모델을 시각화 하여 이해하고 분석하는 방법에 대한 소개이다. 뉴럴넷은 수많은 벡터 연산을 하지만 숫자로만 채워져 있기 때문에 동작 방식을 이해하기는 어렵다. 이를 위한 인터랙티브 시각화 방법과 데모를 소개하였다. 개인적으로 잘 모르는 분야지만 NMT가 어떻게 구성되었고 내부적 동작 매커니즘을 이해하기는 충분하였다.
https://www.slideshare.net/deview/222neural-machine-translation-nmt-80852324
NSML: 상상하는 모든 것이 이루어지는 스마트한 클라우드 머신러닝 플랫폼
연구자들은 독립적인 개발공간을 원한다. 연구자별로 사용하는 알고리즘이나 데이터 볼륨 그리고 요구 자원들이 상이하기 때문에 자원을 효율적으로 할당 하고 회수하고 관리해주는 플랫폼이 요구된다. NSML은 연구환경을 컨테이너화 하여 자원을 isolation하고 내부적으로 자원을 스케줄링 한다. 데이터셋 등록, 학습, 서빙에 대해 CLI를 제공하여 딥러닝 연구자는 정말 연구에 필요한 알고리즘만 구현하면 될 수 있도록 지원하고 있다. 실험결과는 kaggle과 같은 리더 보드에 집계된다고 하니 승부욕이 있는 개발자는 https://research.clova.ai/nsml-alpha 에 도전해 보아도 좋을거 같다.
https://www.slideshare.net/deview/224nsml-80881317
빅데이터를 위한 분산 딥러닝 플랫폼 만들기
네이버에서는 분산 딥러닝 적용을 위한 C3 DL이라는 GPU 플랫폼을 개발해서 운영하고 있다고 한다. 분석환경을 컨테이너화 하여 분석자가 환경을 선택하여 구성할 수 있도록 하고 자원 스케줄링은 YARN으로 수행한다. apache slider를 이용하여 분석 작업을 submit하고 tensorflow에 대해서도 docker overlay network을 활용하여 분산학습을 지원하고 있다고 한다. 하둡 스케줄링으로 딥러닝을 결합한 이유가 처음에는 의아하였으나 데이터 전처리(Spark)나 대용량 학습 모델 저장 및 로드 재처리 등을 하둡 기반으로 한다고 하면 이점이 있겠구나 하는 생각은 들었다.
https://www.slideshare.net/deview/225-80884659
인공지능 추천 시스템 AiRS 개발기: 모델링과 시스템
최근에 지인이 추천시스템을 문의한적이 있어서 관심가는 주제였다. 머신러닝과 딥러닝에서의 추천 알고리즘에 대한 소개와 추천모델 평가 그리고 대규모 추천시스템 구축과 관련된 내용이 언급되었다. 다양한 오픈소스들이 사용되고 있었으며 앞에 발표되었던 C3를 포함한 다양한 네이버 기술셋들이 접목되어 있다. 개인적으로는 기대하는 세션이였으나 방대한 주제만큼이나 접목된 기술 소개로만 끝났다. 사실 궁금한건 문제해결이나 추천서비스의 프로세스를 어떻게 개선했는지 인데 그런 부분이 언급되지 않아 무척이나 아쉬웠다.
https://www.slideshare.net/deview/airs-80886207
마치며
DAY2밖에 참석하지 못하여 OTL 다소 부분적인 느낌이겠지만 DAY1에 비해 DAY2의 경우 외부 발표 세션이 적은 편이였다. DEVIEW 발표 자료는 꼬박꼬박 보는 편인데 기존 DEVIEW에서 발표되었던 주제들이 중복되어 발표되는 느낌을 받았다. 특정 기술셋에 대한 소개와 나열보다는 깊이있는 주제 발표가 있었으면 하는 아쉬움이 남았다. 아쉬움이 남는 만큼 내년 행사는 좀 더 기술적이고 deep dive할 수 있는 주제들로 꾸려지지 않을가 하는 바램을 가져본다.