HERI 뉴스
AI 이미지처리 비약적 발전
사진·동영상에 자동 자막, 설명
텍스트 입력하면 이미지로 구현

인간 수준의 ‘이해’ 도달에 성큼
검색 고도화, 창작 활성화 기대
“경제적·윤리적 영향 연구 필요”
AI, 텍스트-그림 교차인식

오픈AI가 올해 초 공개한 인공지능 도구 달리(DALL·E)는 텍스트를 입력하면 의미를 이해해, 그림으로 표현해낸다. 달리에 “발레복을 입고 개를 산책시키는 아기 무”를 입력한 결과, 만들어진 그림의 일부. 오픈AI 제공.
오픈AI가 올해 초 공개한 인공지능 도구 달리(DALL·E)는 텍스트를 입력하면 의미를 이해해, 그림으로 표현해낸다. 달리에 “발레복을 입고 개를 산책시키는 아기 무”를 입력한 결과, 만들어진 그림의 일부. 오픈AI 제공.

사람처럼 글과 그림을 통합적으로 인식하고 처리할 수 있는 인공지능이 등장했다. 올해 초 미국의 비영리 인공지능 연구조직인 오픈에이아이(Open AI)가 개발한 인공지능은 텍스트를 입력하면 그에 해당하는 그림을 그려내는 능력을 선보였다. 오픈에이아이는 지난 8월 사람이 일상언어로 명령어를 내리면 인공지능이 자동으로 코딩을 하는 소프트웨어 개발도구 ‘코덱스’를 공개하기도 했다. 오픈에이아이가 개발한 인공지능 기반의 자연어 처리모델(GPT-3)을 활용한 이들 도구는 컴퓨터가 명시적인 작업지시 수행을 넘어서 사람처럼 말의 내용과 맥락을 이해하는 수준에 다가갔음을 보여준다. 지금까지 그림과 글에 담겨 있는 의미를 이해하고 다른 형태로 표현하는 능력은 인간만 지닌 고차원적인 인지능력으로 여겨졌지만, 인공지능의 도전이 시작된 셈이다.

달리(DALL·E)에 “아보카도 모양의 의자”라는 텍스트를 제시했을 때, 만들어진 이미지의 일부. 오픈AI 제공
달리(DALL·E)에 “아보카도 모양의 의자”라는 텍스트를 제시했을 때, 만들어진 이미지의 일부. 오픈AI 제공

■ AI, 사진설명 자동완성


컴퓨터 이미지 인식능력은 2012년 이미지넷 대회에서 캐나다 토론토대의 제프리 힌튼 교수가 심화신경망 방식의 인공지능을 선보인 이후 비약적 발전을 거듭했다. 개와 고양이 식별과 같은 해묵은 과제를 해결한 것은 물론, 사람보다 뛰어난 ‘시력’을 과시하며 얼굴인식 잠금해제 등으로 실용화됐다. 스마트폰의 사진관리 도구는 수많은 사진에서 등장인물과 배경 등 내용에 따라 자동 분류하고 태그를 달아주는 기능을 제공한다. 구글은 2016년 자사의 머신러닝 시스템인 텐서플로를 활용해 인공지능이 사진설명을 자동으로 작성하는 기능을 오픈소스 소프트웨어 공유플랫폼인 깃허브에 공개했다. 사람이 일일이 사진을 보고 설명을 입력할 필요가 없어졌다. 구글은 2019년 이를 스마트폰에서 동영상에 자동으로 자막을 달아주는 ‘라이브캡션’ 기능으로 출시했다. 마이크로소프트(MS)는 지난해 10월 자사의 사진설명(캡션) 자동입력 정확도를 2배 높여 사람 수준으로 업그레이드했다고 발표했다. 이 기능은 시각장애인을 위한 앱에 탑재된 데 이어 엠에스의 워드, 파워포인트 등 오피스 도구에 적용될 예정이다. 

달리(DALL·E)에 “기린처럼 생긴 거북”을 입력했을 때 만들어진 이미지의 일부. 오픈AI 제공
달리(DALL·E)에 “기린처럼 생긴 거북”을 입력했을 때 만들어진 이미지의 일부. 오픈AI 제공

■ 문장 입력하면 AI가 그림생성

오픈에이아이는 지난 1월 문장을 입력하면 인공지능이 자동으로 그림으로 구현해내는 ‘달리(DALL·E)’를 공개했다. 인공지능 자연어처리모델과 이미지인식 기술을 활용해 이전에 학습한 적 없는 이미지도 입력된 문장만으로 그려낸다. 방대한 텍스트-이미지 데이터세트를 학습하고 문장에서 이미지를 만들어내도록 훈련됐다. ‘달리’는 초현실주의 화가 살바도르 달리와 픽사의 애니메이션 월·이(WALL·E)를 합성해 만든 이름이다. 달리는 홈페이지에서 영어로 텍스트를 입력하면 이를 다양한 그림으로 구현한 사례를 예시했다. ‘아보카도 모양의 의자’나 ‘녹색 셔츠, 노란 바지를 입고 파란 모자와 빨간 장갑을 낀 아기 펭귄 이모지’를 입력하면 이를 구현한 다양한 이미지 샘플이 제시됐다. 달리는 ‘발레복을 입고 개를 산책시키는 아기 무’, ‘기린처럼 생긴 거북’처럼 등 실재하지 않는 경우를 제시한 문장도 다양한 형태로 구현했다. 오픈에이아이는 블로그에서 “서로 다른 아이디어를 결합해 사물을 합성해낼 수 있으며 현실에 존재하지 않는 것도 구현 가능하다”며 “이런 기능을 예상하지 못했고 훈련 방식을 수정한 바 없다”고 말했다.

인공지능 개발자 파시 라샤드는 최근 달리처럼 문장을 입력하면 인공지능이 이미지로 구현해주는 서비스를 개발해 정보기술매체 <미디엄>에 공개했다. 라샤드가 개발한 ‘텍스트투아트닷컴(Text2Art.com)’ 사이트에 접속하면 누구나 영어 문장 입력만으로 인공지능이 만든 이미지를 얻을 수 있다.

마이크로소프트가 2020년 10월 공개한 사진설명 자동입력 기능은 “산꼭대기에 서 있는 남자”라고 제공된 기존 설명이 “서핑보드를 갖고 있는 남자”라고 개선됐다. 마이크로소프트 제공
마이크로소프트가 2020년 10월 공개한 사진설명 자동입력 기능은 “산꼭대기에 서 있는 남자”라고 제공된 기존 설명이 “서핑보드를 갖고 있는 남자”라고 개선됐다. 마이크로소프트 제공

■ 어디에 활용될까

시각장애인들에게 요긴할 도구로 기대받고 있다. 텍스트-이미지 교차 구현이 고도화하면 동영상 찾기 등 검색 품질과 방법도 획기적으로 달라진다. 현재 구글 렌즈처럼 이미지 안의 텍스트 등 특정요소를 검색해주는 기능은 크게 개선된다. 네이버웹툰은 최근 인공지능을 이용해 웹툰에 자동으로 색깔을 입혀주는 ‘웹툰 AI페인터’ 베타 서비스를 내놓았다. 앞으로 달리와 같은 기능을 접목시켜 고도화하면 웹소설을 웹툰으로 전환하는 길이 열려 창작의 문턱이 크게 낮아질 수 있다.

네이버웹툰은 2021년 10월 인공지능을 이용해 웹툰에 자동으로 색깔을 입혀주는 ‘웹툰 AI페인터’ 베타 서비스를 공개했다. 네이버웹툰 제공.
네이버웹툰은 2021년 10월 인공지능을 이용해 웹툰에 자동으로 색깔을 입혀주는 ‘웹툰 AI페인터’ 베타 서비스를 공개했다. 네이버웹툰 제공.

오픈에이아이는 문장 입력만으로 이미지를 만들어내는 달리에 대해 “중요하고 광범한 사회적 영향을 끼칠 수 있다”며 “달리와 같은 도구가 특정 업무나 직업에 끼칠 경제적 영향, 결과물의 편향 가능성, 장기적 차원의 윤리적 문제 등 사회적 과제에 대해 연구할 계획”이라고 블로그에서 밝혔다.

인공지능이 사람처럼 이미지와 문장을 통합적으로 인식하고 자유롭게 교차 구현할 수 있게 된다는 것은 인간 인지능력에 한층 접근했음을 알려준다. 컴퓨터는 정교하고 빠른 연산능력에서 인간을 압도했지만, 인간과 같은 ‘이해’는 불가능했다. 인공지능이 글과 그림에 대한 통합처리 기능을 통해 일종의 맥락 이해 능력을 보인다는 것은 편리함과 함께 이로 인한 새로운 사회적 문제의 발생도 예고한다.

구본권 사람과디지털연구소장 starry9@hani.co.kr

서비스 선택
댓글
로그인해주세요.
profile image
powered by SocialXE
List of Articles

코로나시대의 ‘디지털 건강’ 어떻게 지킬까

1월18일 온라인 컨퍼런스 “코로나 끝나도 사용시간 안줄 것” 디지털시대 문제 참여·해결 모색 코로나19로 인해 디지털 미디어 이용시간이 크게 늘어나면서 부작용이 함께 커지고 있는 상황에서 ‘디지털 웰빙’을 주제로 한 온...

  • HERI
  • 2022.01.12
  • 조회수 46

치매치료약·민간우주여행, 2021년 ○○기술에 꼽혔다

아듀헬름은 20년 만에 처음 시판된 알츠하이머 치료제로, 미 식품의약청(FDA) 허가 과정을 비롯해 약효·가격 등에서 논란을 불렀다. 주사제인 아듀헬름은 1년 약값이 5만6400달러(약 6800만원)으로 책정됐으나 효과성에 대한 논란이...

  • HERI
  • 2022.01.10
  • 조회수 60

‘불확실성’ 파는 미래예측, 누구의 이익 대변하나

‘뷰카(VUCA)’ 시대의 인기상품 ‘미래예측’ 메타버스·스마트홈·전기차 등 올해 생활 침투할 기술트렌드 해마다 1월 미국 라스베이거스에서 열리는 소비자가전전시회(CES)는 미래를 상상하게 하는 다양한 기술과 상품이 선보이는 ...

  • HERI
  • 2022.01.10
  • 조회수 65

진보 지식인들 “이-윤 부동산 공약, 시장 자극할 불쏘시개”

지식선언네트워크, ‘대선과 부동산’ 토론 윤석열·이재명 감세·규제완화 강력 비판 공급부족론 오류…이명박·박근혜보다 많아 가격 급등은 초저금리·대출규제 미비 탓 세금 과다론, 자산불평등 개선 의지 의문 시장안정·주거복지 ‘큰...

  • HERI
  • 2022.01.05
  • 조회수 105

기업 10곳 중 7곳, ESG 경영 “보통 이하” 자평

대한상의·생산성본부, 기업 300곳 설문조사 10곳 중 7곳 ESG “중요하다” 응답과 대비 국내 기업 열 곳 중 일곱은 환경·사회·지배구조를 중시하는 이에스지(ESG) 경영이 중요하다고 생각하는 것으로 나타났다. 하지만 역시 열곳...

  • HERI
  • 2021.12.29
  • 조회수 213

지식인선언네트워크, 이재명·윤석열 ‘부동산 공약’ 평가한다

새해 5일 ‘대선 부동산 정책’ 토론회 보유세·양도세 ‘부자 감세’ 점검 관심 주택공급·개발이익 환수 대책도 논의 윤석열 후보와 이재명 후보. 그래픽 박민지 진보성향 지식인의 모임인 ‘지식인선언네트워크’가 2022년 대선의...

  • HERI
  • 2021.12.29
  • 조회수 213

메타버스 알고리즘에도…진실 깨우칠 매트릭스의 ‘빨간 약’ 필요할까

가상현실 가까워진 세상에 매트릭스 네번째 ‘리저렉션’ 개봉 알고리즘의 힘 커진 디지털 세상의 면면 따져봐야 1999년 개봉한 <매트릭스>에서 모피어스는 주인공 네오에게 안락한 시뮬레이션의 세계(파란 알약)와 고통스러운 진실의...

  • HERI
  • 2021.12.27
  • 조회수 264

“차기정부, 대통령 주재 ‘제조업 혁신전략 회의’ 신설해야”

정만기 KIAF 회장, 제조업 위기 극복 위한 6대 과제 건의 ’네거티브 규제’로 전환…규제 1개 만들면 기존 2개 폐지 진입제한 규제 없애되 경쟁 저해 감시·단속은 강화해야 정만기 한국산업연합포럼 회장 차기정부는 제조업 ...

  • HERI
  • 2021.12.22
  • 조회수 267

산림 사회적경제기업이 코로나를 이겨내는 법

코로나로 산림 사회적경제기업도 매출 타격 커 컨텐츠 개발, 연구소 설립 등 연구개발 투자와 다양한 협업사업 통한 판로 확대가 코로나 극복 열쇠로 산림 사회적금융 확대 등 질적 성장 위한 공공지원 필요 산림 분야 사회적...

  • HERI
  • 2021.12.21
  • 조회수 294

“‘소득보장 기반 복지’로 불평등 해결 실마리 찾아야”

참성장의 시대를 열자-④ LAB2050-한겨레경제사회연구원 공동기획 지난 12월10일에 열린 ‘참성장포럼’에서 (왼쪽부터)이원재 LAB2050 대표, 이승윤 중앙대 사회복지학과 교수, 홍장표 한국개발연구원 원장, 남기업 토지+자유연구소 소...

  • HERI
  • 2021.12.21
  • 조회수 276

“농산어촌에도 ‘지역 상생형 일자리’ 모델 접목을”

15일 ‘농산어촌 유토피아’ 9번째 토론회 마강래 “농촌-베이비부머-중기 3자 상생” 송미령 “5도2촌 다주택자 종부세 등 완화” 인구감소 면지역·저가주택 세제 지원 제안 성주인 “별도 공간계획으로 난개발 막자” 15일 서울 ...

  • HERI
  • 2021.12.15
  • 조회수 401

강철규 전 공정위원장 경쟁촉진상 수상

한국경쟁포럼 선정…오는 15일 시상식 한국경쟁포럼(회장 신현윤)은 15일 '경쟁촉진상'의 두번째 수상자로 강철규(75·사진) 서울시립대 명예교수를 선정했다고 밝혔다. 한국경쟁포럼은 2005년 국내 경쟁법·정책 발전에 이바지하기 위해 ...

  • HERI
  • 2021.12.14
  • 조회수 312

상생으로 지역경제 위기 넘는다

군산 등 8개 상생형 일자리 지역경제 살리기 위한 조건 12월8일 서울 웨스틴조선호텔에서 열린 상생형 지역 일자리 포럼에서 한 참가자가 군산형 일자리에 대해 발표하고 있다. 일자리위원회 제공 2017년 현대중공업 군산조선소 ...

  • HERI
  • 2021.12.13
  • 조회수 355

‘돌봄’요구하는 디지털캐릭터, 공감 도우미? 훼방꾼?

아이들 게임기로 출시됐지만 게임문화·가상현실 큰 영향 “사용자와 유대감 형성하도록 돌봄 게을리하면 죄책감 설계” “인간의 감정적 취약점 이용한 인간성 훼손 우려” 비판 등장 인공지능·메타버스 확대 따라 가상-현실 뒤섞임...

  • HERI
  • 2021.12.13
  • 조회수 287

작은 협동의 경험을 큰 협동으로

<다시, 협동조합을 묻다> 김기태·강민수 지음/북돋움/1만8000원 다가오는 2022년은 협동조합기본법이 제정된 지 꼭 10년이 되는 해다. 협동조합기본법에 따라 설립된 협동조합은 전국에 2만1000여개에 달한다. 농수축협 등 8개 개별법...

  • HERI
  • 2021.12.09
  • 조회수 304

풀뿌리 협동조합 ‘사회주택’에도 종부세 중과, 왜?

공동 소유하고 관리하는 사회주택 자본이익 실현보다 공동체 의미 큰데 개정된 종부세제로 조합원 부담 커져 일부 주택협동조합은 해산까지 사회주택의 지속가능한 실험 위한 법적 안전망·제도적 장치 마련 시급 소다마을 주민들은...

  • HERI
  • 2021.12.08
  • 조회수 344

사회적경제연대회의, 7년째 국회 계류 ‘사회적경제기본법’ 제정 촉구

문 대통령·이재명 후보 법 제정 의지 밝혔음에도 집권 여당인 더불어민주당에서 방관한다며 비판 6일 성명 통해 법 제정 위한 적극적 노력 촉구 문재인 대통령이 지난 1일 서울 광진구 그랜드워커힐 호텔에서 열린 ‘제33차 세...

  • HERI
  • 2021.12.06
  • 조회수 332

양질의 일자리가 지속가능개발 목표 달성한다

[제33차 세계협동조합대회] 정체성 실천: 보람있는 일자리 세션 협동조합 통해 비공식 노동자들 조직화 역량 강화와 정체성 찾는 노력 필요 협동조합도 디지털 환경 변화에 대응해야 재숙련 교육 제공과 새로운 비즈니스 발굴 ...

  • admin
  • 2021.12.06
  • 조회수 188

‘불평등 완화’ ‘지속가능발전’ 열쇠쥔 협동조합 모델에 주목

[제33차 세계협동조합대회] 2일차 ‘협동조합 정체성 헌신’ 세션 소외계층 일자리 창출, 노동 성과 공유하는 협동조합 가치 금융, 의료복지 사각지대 놓인 취약계층 접근성 높이고 난민, 지역주민 포용하는 수평·협력의 핵심주체...

  • admin
  • 2021.12.06
  • 조회수 184

“대전환 시대, 협동조합 고유의 민주·평등 구조가 혁신 일으킬 것”

제33차 세계협동조합대회 이틀째 대변혁 시기에 협동조합 정체성 주목 거버넌스·문화 오히려 위기 대처 유연해 “협동조합의 성과는 사회적 성과 공동체 정체성 집중·홍보해야” “협동조합은 사회에서 늘 선도적 역할 지역사회와 ...

  • admin
  • 2021.12.06
  • 조회수 185