HERI 칼럼

인공지능은 무얼 먹고 사나? [아침햇발]

HERI 2023. 03. 08
조회수 1050
스케일에이아이(AI), 디파인드에이아이, 사마 같은 거대 데이터 라벨링 회사는 아프리카 국가 등 전세계를 대상으로 플랫폼을 통해 노동자를 모집해 데이터 수집과 태깅 작업을 의뢰한다. 사진은 사마의 직원이 근무하는 모습. 사마 누리집
스케일에이아이(AI), 디파인드에이아이, 사마 같은 거대 데이터 라벨링 회사는 아프리카 국가 등 전세계를 대상으로 플랫폼을 통해 노동자를 모집해 데이터 수집과 태깅 작업을 의뢰한다. 사진은 사마의 직원이 근무하는 모습. 사마 누리집

이봉현 경제사회연구원장 겸 논설위원

 대화형 인공지능(AI) ‘챗지피티’가 신통해 보여서였을까? 컴퓨터 과학을 깊이 모르는 필자는 인공지능이 인터넷에 있는 방대한 정보를 교재 삼아 스스로 똑똑해지는 줄 알았다. ‘기계학습’이니 ‘강화학습’이니 하는 말들도 인공지능이 척척 알아서 배운다는 인상을 줬다. 그런데 자료를 찾아 읽어보니 그런 건 아니었다. 어떤 인공지능이 개발돼 일반인에게 공개할 수준이 되려면 데이터를 통해 ‘한땀 한땀’ 가르치는 사람의 노동이 반드시 필요했다. 데이터를 수집해 인공지능이 알아듣게 가공하고, 알고리즘을 거쳐 나온 답을 평가해 되먹여 주는 일이다. 정제된 데이터가 없는 인공지능은 유능할 수 없었다.

챗지피티도 개발사인 오픈에이아이가 통상적인 챗봇 교육법 외에 알엘에이치에프(RLHF)라는 인간의 피드백을 통한 강화학습 방법을 적용했다. 소셜미디어, 검색, 자율주행, 물류 자동화 등 여러 영역에서 활용되는 알고리즘도 사람이 가공한 방대한 데이터를 배워야 돌아간다. 그런 일들 중 데이터 라벨링은 데이터를 수집하고 특정 영역에 태그를 달아 분류하는 일이다. 사진 속 물체가 고양이인지 개인지 이름을 달아 반복학습을 시키면 인공지능의 유추 능력이 커진다. 콘텐츠 모더레이션은 혐오표현 같은 부적절한 데이터를 걸러내고, 인공지능이 낸 답의 적절성을 평가해, 인간이 원하는 패턴을 익히게 하는 일이다. 그러지 않으면 데이터에 얼룩진 인간의 편향을 따라 했던 인공지능 챗봇 ‘이루다’의 문제가 반복된다.

데이터 처리를 사람이 하기에, 인공지능에는 사회의 그늘이 드리워져 있다. 데이터 가공은 메커니컬 터크나 사마 같은 플랫폼업체가 구글, 메타, 아마존 같은 거대 기업에서 하청을 받아 운영하는 크라우드형 플랫폼 노동을 통해 이뤄진다. 이들 업체는 수백만건의 데이터를 몇백건 단위로 잘게 쪼개 플랫폼에 올려놓고 전세계에서 작업자를 모집한다. 인터넷 덕분에 가능해진 이런 대규모 플랫폼 노동이 없었다면 인공지능은 1990년대 수준에서 답보했을 것이란 분석도 있다. 그런데 이 과정에서 노동의 파편화, 노동 조건의 열악화, 제3세계 저임 노동력 착취와 같은 문제가 발생한다.

최근 미국 시사 주간지 <타임>은 오픈에이아이가 챗지피티를 덜 위험하게 하기 위해 아프리카 케냐인들을 활용한 사례를 다뤘다. 2021년 샌프란시스코에 본사를 둔 하청업체 사마를 통해 고용된 케냐 노동자들은 인터넷에서 뽑아낸 수만개의 폭력적인 텍스트를 9시간 단위로 교대 근무하며 라벨링 작업을 했다. 아동 성 학대, 살인, 고문, 수간, 근친상간 등의 내용이 대부분이었다. 챗지피티가 이런 유해한 콘텐츠의 패턴을 학습해서 스스로 걸러내도록 훈련할 목적이었다. 이런 콘텐츠에 지속해서 노출된 일부 노동자는 환각과 트라우마를 호소하기도 했다. 그러고서 케냐 노동자가 받은 임금은 시간당 1.3~2달러였다. 사마 외에도 다양한 온라인 크라우드소싱 플랫폼이 우간다, 케냐, 인도, 베네수엘라 등에서 수백만명의 노동자를 모집해 단조롭고 유해한 데이터 가공이나 평가를 맡긴다.

인공지능의 영역이 확장될수록 이런 노동의 수요는 커간다. 국내에서도 데이터 라벨링을 하기 위해 관련 업체에 등록한 사람이 2021년에 100만명이 넘었다고 한다. 2021년 한국노동연구원 이정희 선임연구위원 등이 조사한 데 따르면, 이들의 80%가 대졸 이상의 학력을 갖고 있고, 절반 넘는 이들은 본업이 있으면서 추가 소득을 위해 데이터 라벨링을 하고 있었다. 보수는 작업당 20원부터 시작해 단계적으로 오르는데, 2021년 당시의 최저임금(시급 8720원)을 확보하기 위해 초보자는 1시간에 436개, 10초에 1.2개꼴로 데이터에 태그를 달아야 했다.

챗지피티는 교육, 예술, 출판 등 다양한 지식 영역에 존재론적 질문을 던졌다. 하지만 인공지능의 토대가 열악한 노동이란 사실은 묻혀 있다. 언젠가 데이터 처리마저 인공지능이 대신할지 모르나, 그 전까지는 ‘디지털 인형 눈알 붙이기’ ‘유령노동’이라 불리는 이런 작업이 계속될 것이다. 물론 이러 일들이 육아·가사·학업 도중에 짬을 내서 수입을 얻으려는 이들에게 유연한 일자리를 제공한다고 볼 수도 있다. 하지만 노동권 보호에서 벗어난 저임금·초단기·단순반복 일자리가 늘어나는 걸 외면하고 인공지능의 가능성만을 말하는 것은 부조리하다. 과학기술이 띄우는 분홍빛 애드벌룬과 함께, 사람에게 드리워진 그늘도 놓치지 않는 균형 잡기가 필요하다.

bhlee@hani.co.kr


한겨레에서 보기 : https://www.hani.co.kr/arti/opinion/column/1082614.html

서비스 선택
댓글
로그인해주세요.
profile image
powered by SocialXE
List of Articles

[유레카] 챗지피티와 세가지 소원

국제 투자은행 골드만삭스는 최근 보고서에서 생성형 인공지능 기술이 미국과 유럽에서 일자리 3억개를 대체할 것이며, 미국 노동자들의 직무 약 70%에 영향을 줄 것이라고 전망했다. 보고서에 따르면, 현재 노동자의 60%는 19...

  • HERI
  • 2023.04.13
  • 조회수 935

윤석열 정부 1년, 기업들은 평안하십니까? [아침햇발]

윤석열 대통령이 지난 4일 충청남도 삼성디스플레이 아산캠퍼스에서 이재용 삼성전자 회장과 유기발광다이오드(OLED) 모듈라인을 돌아보면서 설명을 듣고 있다. 대통령실사진기자단 곽정수ㅣ한겨레경제사회연구원 선임기자 “대통령께서...

  • HERI
  • 2023.04.10
  • 조회수 1084

챗지피티 시대, 궁극의 생존기술은? [유레카]

대화형 인공지능 ‘챗지피티’(ChatGPT)에 대한 경탄과 불안이 번지고 있다. 챗지피티로부터 안전해 보이는 직업이 없는 까닭이다. 한편 ‘프롬프트 엔지니어’라는 신종 직업도 주목받고 있다. ‘프롬프트’(prompt)는 컴퓨터가 명...

  • HERI
  • 2023.03.29
  • 조회수 1303

유학생은 한국 대학의 ‘봉’인가 [아침햇발]

교육부는 지난해 11월 지방자치단체와 손잡고 외국인 대학생 유치를 위해 온라인 한국유학박람회를 열었다. 한국 대학에서 공부하는 외국인 학생은 2004년 교육부가 ‘스터디 코리아 프로젝트’를 시작한 이래 꾸준히 증가해, 지난...

  • HERI
  • 2023.03.29
  • 조회수 886

윤 정부는 ‘지배구조 개선’을 말할 자격 없다 [아침햇발]

윤석열 대통령이 1월30일 열린 금융위원회 업무보고에서 KT, 포스코 등 공기업에서 민영화된 기업들을 향해 “소유가 분산돼 지배구조에 도덕적 해이가 일어날 경우에는 절차와 과정을 공정하고 투명하게 해줘야 한다”고 정부의...

  • HERI
  • 2023.03.15
  • 조회수 730

인공지능은 무얼 먹고 사나? [아침햇발]

스케일에이아이(AI), 디파인드에이아이, 사마 같은 거대 데이터 라벨링 회사는 아프리카 국가 등 전세계를 대상으로 플랫폼을 통해 노동자를 모집해 데이터 수집과 태깅 작업을 의뢰한다. 사진은 사마의 직원이 근무하는 모습. ...

  • HERI
  • 2023.03.08
  • 조회수 1050

‘더글로리’와 다른 현실의 학폭 해결법 [유레카]

학교폭력을 다룬 드라마 <더 글로리>는 실제 상황이었다. 2018년 당시 서울중앙지검에서 윤석열 지검장과 함께 근무한 정순신 인권감독관이 ‘학폭 가해자’ 아들의 강제 전학을 막기 위해 동원한 ‘끝장 소송’은 드라마 작가의...

  • HERI
  • 2023.03.08
  • 조회수 1118

‘금융 대통령’ 이복현 [아침햇발]

윤석열 대통령(왼쪽)과 이복현 금감원장. 연합뉴스 곽정수 | 한겨레경제사회연구원 선임기자 이원조 전 국회의원은 5·6공 시대 ‘금융계 황제’로 군림한, 관치금융의 상징이었다. 친구인 전두환·노태우 두 대통령을 등에 업고 국가...

  • HERI
  • 2023.02.17
  • 조회수 1075

챗지피티는 누구나 쓸 수 있는 ‘거짓말 제조기’? [유레카]

챗지피티. 김재욱 화백 챗지피티(ChatGPT)가 두달여 만에 월 사용자 1억명에 도달해 가장 빠르게 보급된 기술로 불리며 국내에서도 월 20달러 유료 서비스가 시작됐다. 챗지피티는 거대 언어모델 인공지능으로, 인류가 쌓은 지식...

  • HERI
  • 2023.02.17
  • 조회수 1360

정치 바람 안 타는 에너지요금 결정기구 필요하다 [아침햇발]

전기·가스요금도 한국은행 금융통화위원회 처럼 독립적, 전문적인 기구에서 결정하자는 목소리가 커지고 있다. 한은 금통위에서 통화정책방향을 결정하는 회의를 하고 있다. 한은 제공 이봉현 | 경제사회연구원장 겸 논설위원 최근...

  • HERI
  • 2023.02.13
  • 조회수 927

챗지피티 시대엔 ‘헛소리 탐지능력’이 필수 [유레카]

‘글쓰는 인공지능’ 챗지피티 시대의 필수능력. 김재욱 화백 2016년 3월 이세돌-알파고 대국이 예고편이라면, 지난해 11월30일 공개된 오픈 에이아이(Open AI)의 ‘챗지피티’(ChatGPT)는 인공지능 시대의 본격 개막 신호다. 거...

  • HERI
  • 2023.01.26
  • 조회수 1291

윤석열표 에너지 정책, ‘세마리 토끼’ 다 놓친다 [아침햇발]

게티스이미지뱅크 이봉현 ㅣ경제사회연구원장 겸 논설위원 윤석열 정부가 재생에너지 발전 목표를 낮춘 것은 세계적 추세와 정확히 반대로 가는 것이자 한국 경제의 미래를 갉아먹는 일이다. 국제사회에 약속한 탄소 중립 목표를...

  • HERI
  • 2023.01.13
  • 조회수 1319

디지털 시대에 필요한 ‘새해 계획’ [유레카]

시간 절약 기술과 ‘타임 푸어’. 김재욱 화백 새해를 맞아 다짐하는 계획 중에는 알찬 시간 사용법이 빠지지 않는다. 1000년 전 송나라 주희는 “늙기는 쉬워도 배움을 이루기는 어려우니, 한순간도 가벼이 보내지 말라”고 ...

  • HERI
  • 2023.01.03
  • 조회수 945

황당한 ‘통계조작’ 거짓말…진짜 사기단은 국힘과 보수언론

[아침햇발] 국민의힘 정진석 비상대책위원장이 22일 오전 국회에서 열린 비상대책위원회의에서 문재인 전 대통령을 향해 통계조작 의혹에 대해 국민에 사과할 것을 요구하고 있다. 왼쪽부터 주호영 원내대표, 정 비대위원장, 성일...

  • HERI
  • 2022.12.26
  • 조회수 1245

[아침햇발] 은행알을 삶아 농약을 만들었다 / 이봉현

땅은 훌륭한 탄소저장고다. 유엔식량농업기구(FAO)에 따르면 초지 1㎡당 연간 최대 40g의 탄소를 흡수할 수 있다. 특히 콩을 재배하는 초지는 탄소흡수량이 39% 증가한다. 화학비료를 사용하지 않으면 농지의 탄소 흡수 기능은 ...

  • HERI
  • 2022.12.19
  • 조회수 1276

윤 대통령의 ‘가짜뉴스’ 장사 [유레카]

윤석열 대통령과 가짜뉴스. 김재욱 화백 윤석열 대통령이 ‘가짜뉴스’를 직접 입에 올리는 일이 늘고 있다. 윤 대통령은 지난달 18일 출근길 회견에서 “엠비시(MBC)에 대한 전용기 탑승 배제는 우리 국가 안보의 핵심 축인 ...

  • HERI
  • 2022.12.13
  • 조회수 1124

[아침햇발] 이재용 회장의 ‘약속’이 진심이라면 / 곽정수

이재용 삼성전자 회장이 지난 10월28일 광주광역시에 위치한 삼성전자 협력회사 디케이를 방문해 생산라인을 돌아보고 있다. 회장 승진 이후 첫 방문지로 협력업체를 선택한 것은 상생경영 의지를 보여주기 위한 포석으로 보인다...

  • HERI
  • 2022.11.30
  • 조회수 1037

윤 대통령은 존슨이 선물한 ‘처칠 팩터’ 내팽개쳤나 [아침햇발]

윤석열 대통령 당선자가 지난 5월9일 서울 통의동 대통령직인수위원회 집무실에서 어맨다 밀링 영국 국무장관으로부터 보리스 존슨 당시 영국 총리가 직접 쓴 책 <처칠 팩터>를 전달받고 있다. 공동취재사진 이봉현 ㅣ 경제사회...

  • HERI
  • 2022.11.25
  • 조회수 1175

[유레카] ‘머스크의 트위터’ 성패보다 중요한 것 / 구본권

머스크의 트위터. 김재욱 화백 2006년 7월 등장한 트위터는 스마트폰 시대와 맞물려 인류의 정보 이용 방식을 바꾼 소셜미디어다. 휴대전화 문자의 글자수 한도처럼 140자까지만 글을 쓸 수 있는 단문메시지 공유서비스로 출발했...

  • HERI
  • 2022.11.21
  • 조회수 1092

[아침햇발] 윤석열의 ‘무능 리스크’ / 곽정수

윤석열 대통령과 김건희 여사가 31일 오전 서울광장에 마련된 이태원 사고 사망자 합동분향소를 방문, 조문을 위해 이동하고 있다. 연합뉴스 곽정수 | 한겨레경제사회연구원 선임기자 이태원에서 안타까운 참사가 일어난 지 나흘...

  • HERI
  • 2022.11.02
  • 조회수 1250