** Lesson learned: 어떤 일을 실행/실패/성공하고 난 뒤 그 과정에서 무엇을 배웠나요.*

개요

기록

인사이트 강연

내 인공지능에 맞는 데이터 설계하고 구축하기 | Upstage AI Data Manager | 한지윤

모델을 학습하기 위하여 필수적인 데이터. 그러나 내가 원하는 데이터가 바로 준비된 경우는 거의 없죠. 내가 만들고자 하는 서비스에 필요한 데이터를 어떻게 만들어야 하는지 이야기합니다.

발표 주요내용

  1. 나에게 필요한 데이터의 정의하기
  2. 데이터 설계에 필요한 것들
  3. 데이터 구축 가이드 만들기
  4. 데이터 구축의 실제 : MATTER 사이클

발표자료

내 인공지능에 맞는 데이터 설계하고 구축하기.pdf

Q&A

Q. 기존에 있는 데이터를 가져다쓸 때 라이선스를 고려해야한다는 얘기를 들은 적이 있는데, 저작권문제가 있는 데이터를 쓰고 싶을 때 어떻게 해결할 수 있을까요?

Q. 데이터 구축까지 끝나고 데이터 검수과정에서 품질에 큰 문제가 생기면 그럴 땐 어떻게 대처를 해야하나요?

Q. 속담의 의미를 풀어서 쓰는 것을 작업자에게 부탁하고 싶은데요 . (e.g. 산 넘어 산의 의미를 풀어서 써주세요 -> 해도 해도 어렵다). 크라우드 소싱을 플랫폼을 활용해 수집을 할지, 아니면 구글 설문지를 만들어 수집을 할지 고민 중입니다. 전자의 겅우 대규모 수집으로 인해 퀄리티를 관리하는 것이 힘들 것이라는 점, 비용이 많이 들것이라는 점을 걱정하고 있고, 후자의 경우 비용과 퀄리티는 괜찮겠으나 대규모 수집이 힘들 것이라는 점을 걱정하고 있습니다. 어떤 접근을 취하는 것이 좋을지 조언을 주실수 있을까요?