코딩하는 임초얀

[SLASH23] 토스 개발자 컨퍼런스 Day 2 (Track B) 본문

Chats

[SLASH23] 토스 개발자 컨퍼런스 Day 2 (Track B)

초얀 2023. 6. 9. 15:22
 

토스 개발자 컨퍼런스 SLASH23

6.8-6.9 이틀 동안 진행되는 온라인 세션을 통해 토스 서비스, 그 이면의 이야기를 소개합니다.

toss.im

The Hidden Side of Technology
빠르고 편리한 서비스 경험 너머, 최고의 안정성까지 사수하기 위한 토스팀의 치열한 고민과 도전 스토리를 공개해요. 토스 서비스, 그 이면의 이야기를 함께 즐겨주세요.

직군에 따라 유튜브 라이브 스트리밍 TRACK을 나누어 진행해요.
TRACK A : Security, Server
TRACK B : Android, Data, iOS

머신러닝으로 더 똑똑하게 증권 뉴스 제공하기

"토스증권은 어떻게 사용자가 필요한 투자 정보를 쏙쏙 뽑아 전달할까요? 수많은 정보 중 사용자에게 꼭 필요한 정보를 선별, 전달하기 위해 구축한 '3가지 머신러닝 모델'을 소개합니다." (Data)

by. 토스증권 Data Scientist 조중현

 

1. 종목 매칭 모델
- 유저들은 자기 투자 종목과 관련된 뉴스만 본다. 뉴스가 어떤 종목과 관련 있는지 매칭을 잘 해야함
- 언론사로부터의 매칭은: 모든 뉴스에 대해 매칭을 제공해주지 않음. '배럴 당 x달러'를 수영복 브랜드 배럴로 매칭해서 줌
- 자체 매칭 모델 구축이 필요.
- 3000개의 label로 classification. 여러 pretrained 중 bert가 제일 성능이 좋았음. class 별 loss weightening을 해서 imbalance를 해결,
- 단점: 연준 자이언트스텝, 야구 삼진 이런 걸 종목명에 그대로 매칭ㅠㅠ
- 해결: 학습 데이터셋을 늘리는 방향으로. 이때까지는 종목이 하나도 매칭되지 않는 뉴스는 학습에 사용할 수 없었음.
- 모델이 판단하기 어려운 hard negative sample을 많이 구해왔음. 종목별 pred prob가 비슷비슷한 걸 hard negative sample로 사용.
- acquisition function
- active learning
- 신규 상장 종목에 대해서도 계속 학습해야함: 자동 학습 workflow를 구축: argo workflow

2. 뉴스 중요도 측정 모델
- 흔히 유저데이터 기반으로 추천함. crt : 시간이 좀 걸림
- 발행된 즉시 추천될수록 활용도가 높음
- 뉴스만을 이용해 중요도를 어떻게 판단할 것인가?
- 각 뉴스의 중요도 = 발행 이후 언급된 종목들의 중요도 변동량
- 발생 시점 이후의 주가 변동률을 예측하는 regression model을 구축. bert 기반.
- 문제: 신진상장&그동안 하락만 했던 종목은 하락한다고만 응답하는 imbalance. 이것도 개선함
- score를 활용해 중요한 뉴스 랭킹을 잘 매겻음

3. 해외 뉴스 번역 모델 구축
- 해외 주식 투자 정보는 해외 원문 뉴스를 번역해서 제공해야함
- 번역에 특화된 pretrained: mBART50을 선택(페이스북꺼)
- 데이터셋은 AIhub에서. 그대로는 안 씀: 'snowflake'는 눈송이가 아니라 종목 이름이고 BofA는 아메리카은행인데 A의 B라고 번역ㅠㅠ
- 영어 금융 뉴스에 나오는 고유명사를 잘 학습해야하는데.. 이미 갖고 있던 방대한 data에서 informative한 데이터를 잘 추출하는 걸 목표로 잡음
- 이렇게 얻은 추가 데이터셋으로 추가학습했더니 score도 높아졌고 보기에도 잘 됨
- 추가 데이터셋을 최대한 효율적으로 선택하여 성능을 효율적으로 올렸음


Live Q&A: 토스 개발 문화에 대한 오해와 진실

"남다른 회사, 유별난 조직. 외부에서 토스를 바라보는 시선에는 오해와 환상이 가득합니다. 토스에서 개발자로 일한다는 것은 어떤 모습, 또 어떤 의미일까요? 겉으로 보이는 모습, 그 이면의 진짜 이야기를 실시간으로 만나보세요." (Live Q&A)

by. ?? 김형규, ?? 김희철, ?? Server 박재현, 토스뱅크 Frontend 박지혜, ?? Backend 왕상호, ?? Frontend 진유림

 

Q. 면접 썰

 

Front 박지혜

- 1년 x개월 전 입사

- 기술면접, 문화면접.

- 편안한 분위기

- 기술면접: 탈탈 털렸다 (x) 생각보다 굉장히 편안한 분위기. 아이스브레이킹 등. 이력서를 기반으로 이전 회사에서 어떤 일을 했는지, 그 기술 스택을 왜 선택했는지, 그래서 뭘 했는지 등

- 문화면접: 평소에 갖고 있는 생각, 이 상황에서는 어떤 생각을 하고 어떤 리액션을 취하는지.

 

진유림

- 수다떠는 느낌 맞음ㅇㅇ

 

서버 박재현

- 면접위원 많이 들어감

- 편하게 개발 얘기. 어떤 개발을 했는지, 문제 해결을 어떻게 해결했는지, 요구사항을 어떻게 파악하고 어떻게 만들어갔는지

- 어떤 지식을 알고 있는지에 관한 문제는 안 냄

- 이런 문제는 어떻게 해결하시겠나요? 이런 거 물음

- 이력서 꼼꼼히 보고, 면접문제도 다 준비해서 들어감

 

Q. 토스는 경력자 위주로 채용한다? ㄴㄴ. 선호받는 주니어 개발자는?

 

??

- 나도 2년반정도인 주니어 상태에서 입사함

- 토스는 굉장히 제품 중심의 팀. 제품의 성공에 집중함. 개발자든 PO든 다.

- 개발을 잘 하는 사람보다는 문제를 잘 정의하고 잘 해결하는 사람을 원한다

- 사일로 구성원과 잘 협업할 수 있는 사람.

- 어떻게 어필할 수 있나?

- 나 같은 경우 예전 직장에서의 제품 디자인이나 기획에서 참여한 부분. 어떤 문제 때문에 개선하려고 했고 그에 따라 어떤 문제가 있었는지 등.

 

Q. 제품 중심으로 여러 직군이 섞여서 일하는데, 개인적인 성장이나 같은 직군끼리의 교류?

 

BE 상호

- 성장이란 개인의 의지 + 환경이라고 생각함.

- 토스에서 환경적인 지원을 많이 해줌.

- 스터디도 자유롭게 할 수 있음

 

Front 박지혜

- 사내스터디도 있고

Comments