서초50플러스센터 ‘데이터 라벨러 과정’ 눈길
4차 산업혁명 시대에 자주 듣는 말이 인공지능(AI), 사물 인터넷, 빅데이터, 클라우드 컴퓨팅 등이다. 그중에서도 ‘인공지능(AI)’은 인간의 학습 능력과 추론 능력, 지각 능력, 자연언어의 이해 능력 등을 컴퓨터 프로그램으로 실현하는 기술을 말한다.
‘알파고’를 통해 전 세계의 관심을 끌기도 하였는데 클라우드 컴퓨팅 환경의 급속한 발전과 빅데이터가 뒷받침된 딥러닝(Deep learning)이 구현되면서 4차 산업혁명의 핵심 요소가 되었다.
▲ 수강생들이 데이터 라벨링을 배우고 있다. ⓒ 50+시민기자단 김덕출 기자
데이터 라벨링이란?
그런데 이 인공지능(AI)은 학습할 수 있는 일종의 정답지인 데이터가 필수적인데 이것을 만드는 기술을 ‘데이터 라벨링(Date labelling)’이라고 한다. 예를 들면 사진 속의 꽃이 무슨 꽃인지 인공지능(AI)이 배울 수 있도록 사진마다 장미꽃, 나팔꽃, 해바라기꽃 등 데이터를 만들어 넣는 것이다.
최근 이 데이터 라벨링을 하는 직업이 각광을 받고 있는데 서초50플러스센터에서 데이터 라벨링을 하는 사람, 즉 데이터 라벨러를 양성하는 과정을 개설하여 인기를 끌고 있다.
▲ 데이터 라벨러 양성과정 소개 ⓒ 서초50플러스센터
데이터 라벨러가 되면 언제 어디서나 인터넷이 되는 곳이라면 업무가 가능하다. 그래서 IT관련 빅데이터 분야에서 일하고 싶거나 데이터 라벨러로 활동해 보고 싶은 수강생들이 서초50플러스센터의 ‘데이터 라벨러 양성과정’에 들어와 열심히 배우고 있다.
데이터 라벨링 과정은?
이 과정은 오프라인 강의로 진행되며 9월 20일부터 10월 13일까지 화·목요일 총 8회 진행되었다. 인공지능 데이터 및 소프트웨어 테스트 전문 사회적 기업인 ㈜테스트웍스의 지원으로 회당 3시간씩 수업이 이뤄졌다.
인공지능(AI)의 학습용 데이터 구축과정은 ① 데이터 수집, ② 데이터 정제, ③ 데이터 라벨링, ④ 데이터 검수 절차를 거치게 된다. ‘데이터 라벨러 양성과정’은 이 프로세스에 맞춰 기초적인 데이터 수집, 데이터 정제, 데이터 라벨링을 가르치며 11월에 열리는 심화과정에서는 데이터 검수를 하는 ‘리뷰어’까지 가르친다고 한다. 그 과정을 모두 이수하고 나면 데이터 라벨러로 활동할 수 있다. 좀 더 숙련되면 검수를 하는 리뷰어로 활동하거나 데이터 라벨링을 테마로 강사 활동도 할 수 있게 된다고 한다.
▲ 수강생들의 데이터 라벨링 평가시험 안내문 ⓒ 50+시민기자단 김덕출 기자
기자가 방문한 10월 13일은 과정의 마지막 날이었다. 이날은 지금까지 배운 내용의 복습과 피드백을 하였으며 마지막으로 수강생들의 처리 수준을 점검하는 평가가 있었다. 18명의 수강생 모두 긴장된 모습으로 시험 준비를 하고 있었다.
수강생 대다수가 IT관련 업무 경력이 있거나 IT에 관심이 많은 이들이지만 시험이라는 현실 앞에서는 부담을 느끼는 듯 인터뷰 요청에도 관심이 없을 만큼 학습에 집중하고 있었다.
강의를 진행한 ㈜테스트웍스의 김민정 선임매니저는 “수강생 모두 수업에 빠지지 않고 열심히 학습하고 있다. 4차 산업혁명 시대에 인기 있는 직업이 되고 있어 디지털 노마드를 꿈꾸는 분들이 남녀 구분 없이 배우고 있다. 기술만 숙련되면 스마트폰과 PC로 집에서 부업을 하거나 직장인들의 제2의 직업이 될 수 있기에 점점 관심이 늘어나고 있다”라고 말했다.
▲ 서초50플러스센터의 데이터 라벨링 수업ⓒ 50+시민기자단 김덕출 기자
점차 수요가 늘어나는 데이터 라벨링
의료, 헬스케어, 자율주행, 교육 등 많은 산업 분야에서 AI를 활용하고 있기 때문에 인공지능 학습 데이터의 수요는 점점 늘어날 전망이다. 그래서 데이터 라벨링에 대한 관심과 수요가 급증하는 추세라고 한다.
▲ 서초50플러스센터 송승현 PM ⓒ 50+시민기자단 김덕출 기자
‘데이터 라벨러 양성과정’을 담당하고 있는 서초50플러스센터의 송승현 PM은 “컴퓨터 작업을 좋아하거나 IT 신직업에 대해서 관심이 많은 분의 참여를 기대한다. 데이터 라벨러는 잠깐 유행하다가 사라지는 직업이 아니라 점차 인기도 올라가게 될 것이다. 단어 자체가 좀 생소해서 주저하시는 분도 있는데 강좌를 수강하게 되면 데이터 라벨러로 활동할 수 있도록 지원해드리겠다”라고 말했다.
정부에서도 전문화된 데이터 라벨러 양성 및 지원 사업들을 하고 있을 정도로 데이터 라벨링은 그 비중이 점차 증가하고 있다. 서초50플러스센터 홈페이지를 방문하면 자세한 내용을 확인할 수 있으니 IT에 관심 있는 분들의 적극적인 참여를 기대해 본다.
50+시민기자단 김덕출 기자 (kimchool@naver.com)