최근 주목받는 ‘데이터 라벨러’라는 직업이 있다. 전업으로 뛰는 사람도 있지만, 부업으로 하는 사람이 많다. 직장인, 주부, 대학생의 신흥 알바로 인기이다. ‘데이터 라벨링’은 인공지능 AI가 학습하도록 데이터에 이름을 붙여주는 작업이다. 예로 그림이나 영상에서 사물이나 사람 등을 객체별로 따주고 그것에 라벨을 붙인다. AI 시대에 나타난 새로운 일자리이다.
▲ 많은 사람이 높은 관심을 보인 데이터 라벨링 사업 설명회.
강서50플러스센터는 일자리 창출의 하나로 데이터 라벨링 기업 ㈜지케스와 연계하여 일자리를 지원하고 있다. 8월 말에 1차, 9월 말에 2차로 사업을 소개하고 신청을 받았다. 1차에는 30여 명이 신청하여 현재 데이터 라벨링 작업을 하고 있다. 2차 사업 설명회에도 30명이 넘는 인원이 참석하여 높은 관심을 보였다.
인공지능 AI는 요즈음 어디서나 쉽게 만나는 세상이다. 카드를 분실하고 신고하면 사람이 아닌 AI가 응대한다. 처음 대하는 사람은 서비스가 좀 불친절해졌다고 느낀다. 사람이 아니고 기계이기 때문이다. 요즈음 카드사뿐 아니라 대부분 고객센터는 AI가 활동하고 있다. 네이버에서 음성으로 물어보면 AI가 내 목소리를 알아듣고 검색해 준다. 참 신기한 세상이다.
이제까지 컴퓨터는 인간이 만든 알고리즘을 통해 데이터를 초고속으로 처리하고, 결과를 알려줬다. 그러나 사람처럼 뜻을 이해하고, 축적하여 새로운 결론을 도출해내지는 못했다. 방대한 양의 데이터를 빠르게 처리할 뿐이었다. 세월이 흐르면서 사람이 생각하고 판단하는 것처럼, 컴퓨터도 할 수 있도록 개발하기 시작했다. 인공지능 AI가 등장하기 시작한 것이다.
사람은 자라면서 일상생활이나 학교에서 배운 걸 바탕으로 문제를 인식하고 판단한다. 이세돌과 바둑을 두어서 이긴 알파고는 ‘바둑 두기’와 ‘바둑 더 잘 두기’라는 학습을 통하여 만들어진 AI이다. 이세돌은 바둑만 잘 두는 게 아니라 다른 생활도 잘한다. 그러나 알파고는 바둑만 잘 둔다. 이런 면에서 AI는 아직 한계가 있다.
AI가 발전하려면 데이터 학습을 계속해야 한다. 사람이 초, 중, 고, 대학을 다니면서 지식이 쌓이듯이 인공지능도 계속 데이터를 학습해야 한다. 인공지능이 학습하는 데이터는 그냥 되는 게 아니라 기계가 인식하도록 라벨을 달아주어야 한다. 이것을 데이터 라벨링이라고 한다.
AI는 처음에 의자가 무엇인지 모른다. 의자를 인공지능이 읽을 수 있도록 이름을 달아준다. 의자도 둥근 의자, 회전의자, 철제 의자 등 종류가 많다. 이런 걸 AI에게 학습시킨다. 그래야 AI가 의자 같은 게 보이면 유추해서 판단한다. 현재 핫이슈인 자율주행은 AI가 필수적인데 도로 차선 표시, 신호등, 표지판 등 도로상에서 나타날 수 있는 모든 걸 AI에게 인식시켜야 사고 내지 않고, 운행할 수 있다.
▲ 자율주행을 하기 위한 데이터 라벨링의 예.
AI 학습에 필요한 데이터는 연료처럼 계속 공급해 주어야 변하는 세상에서 AI가 제 역할을 할 수 있다. AI도 가만히 놔두면 더 발전하지 못하고 멍청해지는 모양이다. 그래서 문서, 사진, 영상, 음성 등 자료를 수집하고, 이를 학습할 수 있도록 이름을 붙여주는 라벨링이 계속 이루어져야 한다.
최근 신흥 부업으로 뜨는 데이터 라벨링은 AI가 발전하면서 라벨링 작업도 계속 증가하고 있다. 통계청에 따르면 2021년 데이터 라벨러가 100만 명이 넘었다고 한다. 이 중 46%는 전업 라벨러인 것으로 추정한다. 새로운 직업이 탄생하고 있다.
데이터 라벨러의 수입은 어느 정도가 될까? 이게 제일 궁금하다. 사업 설명회에서 이에 대한 질문이 많았다. 데이터 라벨링 작업은 보통 장당으로 비용을 계산한다. 한 시간에 50장 정도 처리하는데, 이 회사는 장당 304원을 준다고 한다. 처음에는 1시간 반 정도 걸리지만, 능숙해지면 점점 빨라진다. 컴퓨터 앞에 앉아서 집중하는 작업이므로 2시간 이상 지속하기 힘들다. 마우스를 계속 클릭하면서 해야 하므로 손목 부담이 크다. 고급 작업은 단가가 올라간다.
▲ 실제 데이터 라벨링 하는 방법을 보여주고 있다.
일하는 시간이 자유롭고, 간섭받지 않으며, 원하는 만큼 할 수 있어 괜찮은 부업으로 알려져 있다. 일하는 방법은 데이터 라벨링 하는 회사에 회원으로 가입하고, 국민내일배움카드를 신청하여 교육받는다. 국민내일배움카드는 국가에서 교육비를 지원하는 제도이다. 데이터 라벨링은 매뉴얼만 잘 익혀도 할 수 있을 정도로 어렵지 않다. 데이터 라벨링 하는 회사는 인터넷에서 검색하면 나온다.
50+시민기자단 남영준 기자 (bransontiki@naver.com)