HERI 뉴스
AI 이미지처리 비약적 발전
사진·동영상에 자동 자막, 설명
텍스트 입력하면 이미지로 구현

인간 수준의 ‘이해’ 도달에 성큼
검색 고도화, 창작 활성화 기대
“경제적·윤리적 영향 연구 필요”
AI, 텍스트-그림 교차인식

오픈AI가 올해 초 공개한 인공지능 도구 달리(DALL·E)는 텍스트를 입력하면 의미를 이해해, 그림으로 표현해낸다. 달리에 “발레복을 입고 개를 산책시키는 아기 무”를 입력한 결과, 만들어진 그림의 일부. 오픈AI 제공.
오픈AI가 올해 초 공개한 인공지능 도구 달리(DALL·E)는 텍스트를 입력하면 의미를 이해해, 그림으로 표현해낸다. 달리에 “발레복을 입고 개를 산책시키는 아기 무”를 입력한 결과, 만들어진 그림의 일부. 오픈AI 제공.

사람처럼 글과 그림을 통합적으로 인식하고 처리할 수 있는 인공지능이 등장했다. 올해 초 미국의 비영리 인공지능 연구조직인 오픈에이아이(Open AI)가 개발한 인공지능은 텍스트를 입력하면 그에 해당하는 그림을 그려내는 능력을 선보였다. 오픈에이아이는 지난 8월 사람이 일상언어로 명령어를 내리면 인공지능이 자동으로 코딩을 하는 소프트웨어 개발도구 ‘코덱스’를 공개하기도 했다. 오픈에이아이가 개발한 인공지능 기반의 자연어 처리모델(GPT-3)을 활용한 이들 도구는 컴퓨터가 명시적인 작업지시 수행을 넘어서 사람처럼 말의 내용과 맥락을 이해하는 수준에 다가갔음을 보여준다. 지금까지 그림과 글에 담겨 있는 의미를 이해하고 다른 형태로 표현하는 능력은 인간만 지닌 고차원적인 인지능력으로 여겨졌지만, 인공지능의 도전이 시작된 셈이다.

달리(DALL·E)에 “아보카도 모양의 의자”라는 텍스트를 제시했을 때, 만들어진 이미지의 일부. 오픈AI 제공
달리(DALL·E)에 “아보카도 모양의 의자”라는 텍스트를 제시했을 때, 만들어진 이미지의 일부. 오픈AI 제공

■ AI, 사진설명 자동완성


컴퓨터 이미지 인식능력은 2012년 이미지넷 대회에서 캐나다 토론토대의 제프리 힌튼 교수가 심화신경망 방식의 인공지능을 선보인 이후 비약적 발전을 거듭했다. 개와 고양이 식별과 같은 해묵은 과제를 해결한 것은 물론, 사람보다 뛰어난 ‘시력’을 과시하며 얼굴인식 잠금해제 등으로 실용화됐다. 스마트폰의 사진관리 도구는 수많은 사진에서 등장인물과 배경 등 내용에 따라 자동 분류하고 태그를 달아주는 기능을 제공한다. 구글은 2016년 자사의 머신러닝 시스템인 텐서플로를 활용해 인공지능이 사진설명을 자동으로 작성하는 기능을 오픈소스 소프트웨어 공유플랫폼인 깃허브에 공개했다. 사람이 일일이 사진을 보고 설명을 입력할 필요가 없어졌다. 구글은 2019년 이를 스마트폰에서 동영상에 자동으로 자막을 달아주는 ‘라이브캡션’ 기능으로 출시했다. 마이크로소프트(MS)는 지난해 10월 자사의 사진설명(캡션) 자동입력 정확도를 2배 높여 사람 수준으로 업그레이드했다고 발표했다. 이 기능은 시각장애인을 위한 앱에 탑재된 데 이어 엠에스의 워드, 파워포인트 등 오피스 도구에 적용될 예정이다. 

달리(DALL·E)에 “기린처럼 생긴 거북”을 입력했을 때 만들어진 이미지의 일부. 오픈AI 제공
달리(DALL·E)에 “기린처럼 생긴 거북”을 입력했을 때 만들어진 이미지의 일부. 오픈AI 제공

■ 문장 입력하면 AI가 그림생성

오픈에이아이는 지난 1월 문장을 입력하면 인공지능이 자동으로 그림으로 구현해내는 ‘달리(DALL·E)’를 공개했다. 인공지능 자연어처리모델과 이미지인식 기술을 활용해 이전에 학습한 적 없는 이미지도 입력된 문장만으로 그려낸다. 방대한 텍스트-이미지 데이터세트를 학습하고 문장에서 이미지를 만들어내도록 훈련됐다. ‘달리’는 초현실주의 화가 살바도르 달리와 픽사의 애니메이션 월·이(WALL·E)를 합성해 만든 이름이다. 달리는 홈페이지에서 영어로 텍스트를 입력하면 이를 다양한 그림으로 구현한 사례를 예시했다. ‘아보카도 모양의 의자’나 ‘녹색 셔츠, 노란 바지를 입고 파란 모자와 빨간 장갑을 낀 아기 펭귄 이모지’를 입력하면 이를 구현한 다양한 이미지 샘플이 제시됐다. 달리는 ‘발레복을 입고 개를 산책시키는 아기 무’, ‘기린처럼 생긴 거북’처럼 등 실재하지 않는 경우를 제시한 문장도 다양한 형태로 구현했다. 오픈에이아이는 블로그에서 “서로 다른 아이디어를 결합해 사물을 합성해낼 수 있으며 현실에 존재하지 않는 것도 구현 가능하다”며 “이런 기능을 예상하지 못했고 훈련 방식을 수정한 바 없다”고 말했다.

인공지능 개발자 파시 라샤드는 최근 달리처럼 문장을 입력하면 인공지능이 이미지로 구현해주는 서비스를 개발해 정보기술매체 <미디엄>에 공개했다. 라샤드가 개발한 ‘텍스트투아트닷컴(Text2Art.com)’ 사이트에 접속하면 누구나 영어 문장 입력만으로 인공지능이 만든 이미지를 얻을 수 있다.

마이크로소프트가 2020년 10월 공개한 사진설명 자동입력 기능은 “산꼭대기에 서 있는 남자”라고 제공된 기존 설명이 “서핑보드를 갖고 있는 남자”라고 개선됐다. 마이크로소프트 제공
마이크로소프트가 2020년 10월 공개한 사진설명 자동입력 기능은 “산꼭대기에 서 있는 남자”라고 제공된 기존 설명이 “서핑보드를 갖고 있는 남자”라고 개선됐다. 마이크로소프트 제공

■ 어디에 활용될까

시각장애인들에게 요긴할 도구로 기대받고 있다. 텍스트-이미지 교차 구현이 고도화하면 동영상 찾기 등 검색 품질과 방법도 획기적으로 달라진다. 현재 구글 렌즈처럼 이미지 안의 텍스트 등 특정요소를 검색해주는 기능은 크게 개선된다. 네이버웹툰은 최근 인공지능을 이용해 웹툰에 자동으로 색깔을 입혀주는 ‘웹툰 AI페인터’ 베타 서비스를 내놓았다. 앞으로 달리와 같은 기능을 접목시켜 고도화하면 웹소설을 웹툰으로 전환하는 길이 열려 창작의 문턱이 크게 낮아질 수 있다.

네이버웹툰은 2021년 10월 인공지능을 이용해 웹툰에 자동으로 색깔을 입혀주는 ‘웹툰 AI페인터’ 베타 서비스를 공개했다. 네이버웹툰 제공.
네이버웹툰은 2021년 10월 인공지능을 이용해 웹툰에 자동으로 색깔을 입혀주는 ‘웹툰 AI페인터’ 베타 서비스를 공개했다. 네이버웹툰 제공.

오픈에이아이는 문장 입력만으로 이미지를 만들어내는 달리에 대해 “중요하고 광범한 사회적 영향을 끼칠 수 있다”며 “달리와 같은 도구가 특정 업무나 직업에 끼칠 경제적 영향, 결과물의 편향 가능성, 장기적 차원의 윤리적 문제 등 사회적 과제에 대해 연구할 계획”이라고 블로그에서 밝혔다.

인공지능이 사람처럼 이미지와 문장을 통합적으로 인식하고 자유롭게 교차 구현할 수 있게 된다는 것은 인간 인지능력에 한층 접근했음을 알려준다. 컴퓨터는 정교하고 빠른 연산능력에서 인간을 압도했지만, 인간과 같은 ‘이해’는 불가능했다. 인공지능이 글과 그림에 대한 통합처리 기능을 통해 일종의 맥락 이해 능력을 보인다는 것은 편리함과 함께 이로 인한 새로운 사회적 문제의 발생도 예고한다.

구본권 사람과디지털연구소장 starry9@hani.co.kr

서비스 선택
댓글
로그인해주세요.
profile image
powered by SocialXE
List of Articles

“사회적 경제도 세대간 인식격차…이상적 가치로만 안돼”

【17회 사회적경제 정책포럼】 사회적 경제 청년 종사자의 끊임없는 이탈 원인은 과중 업무에 비해 낮은 처우와 열악한 노동환경 세대 간 이질적 경험이 공동체 해석의 차이 만들어 오늘날엔 취향 중심으로 쉽게 뭉쳤다 흩어지지...

  • HERI
  • 2021.12.02
  • 조회수 35

“협동조합은 위기의 시대 대안될 수 있어…정체성 더 강화해야”

제33차 세계협동조합대회 개막 사회적 책임 추구하는 협동조합 불평등 심화 속 대안으로 부각 문 대통령 참석 ‘연대·협력’ 격려 “협동조합의 지속가능성 담보 위해 정부와의 협력 파트너십 필요” 1일 서울 광진구 워커힐호텔...

  • HERI
  • 2021.12.02
  • 조회수 42

“소외된 여성 노동자 자립 위해 사회적 연대·협력이 필수"

[제33차 세계협동조합대회] 협동조합 정체성에 헌신 세션 기조강연자 인터뷰 엘라 바트 인도여성자영업협회 설립자 가난하고 소외된 여성노동자 권리 위해 첫 여성노동조합이자 협동조합 조직 예금자 9만명 여성협동조합은행도 설립...

  • HERI
  • 2021.12.01
  • 조회수 46

“협동조합 DNA에는 지속가능성 녹아 있어”

[제33차 세계협동조합대회] 협동조합 정체성 강화 세션 핀란드 최대 소매유통업체 에스그룹 240만 조합원…국민 두명 중 한명 꼴 지속가능 전략과 경영전략 통합운용 자국산 식료·동물복지·인권·환경 중시 핀란드 생활협동조합인 에...

  • HERI
  • 2021.12.01
  • 조회수 44

이성희 농협 회장 “협동조합, 양극화와 불평등 문제 해결의 대안”

[제33차 세계협동조합대회] 협동조합 정체성 점검 세션 이성희 농협중앙회 회장 인터뷰 “협동조합은 연대·협력의 민주적 공동체 차별화된 경쟁력은 조합 정체성으로부터 세계 10위 협동조합으로 성장한 농협 농업인 조합원 연대·역...

  • HERI
  • 2021.12.01
  • 조회수 42

협동조합도 브랜드 시대, 사회적 가치로 특화 전략

[제33차 세계협동조합대회] 협동조합 정체성 점검 세션 세계 8위 경제규모 GDP와 맞먹는 전 세계 300대 협동조합 매출 규모 글로벌 브랜드로 자리매김한 선키스트, 데니쉬 크라운 모두 협동조합 ‘사람중심기업’ 협동조합 가치...

  • HERI
  • 2021.12.01
  • 조회수 41

협동조합 정체성에 깊이를 더하다

[제33차 세계협동조합대회] 12월1~3일 서울 워커힐호텔서 열려 1895년 설립 국제협동조합연맹(ICA) 주관 50여개 나라 300여개 회원단체들 참여 ‘협동조합 정체성’ 점검·강화·헌신·실천 4가지 주제, 5개 소주제로 24개 세션 구성 ...

  • HERI
  • 2021.12.01
  • 조회수 40

협동조합의 ‘정체성’ 충실해야 혁신·경쟁력 생겨

[제33차 세계협동조합대회] 협동조합 정체성 강화 세션 4차혁명·기후위기·감염병시대 맞아 자발·개방 등 정체성 ‘7대 원칙’ 재정립 몬드라곤, 2008년 위기 때도 해고 회피 재교육 이후 재배치…고용확대 목표 달성 ‘팀 아카데미...

  • HERI
  • 2021.12.01
  • 조회수 39

여기, 노후에도 존엄하게 살 수 있는 마을이 있다

[제33차 세계협동조합대회] 협동조합 정체성 실천 세션 고령화 시대 ‘돌봄’ 민간시장에 의존 수익 위주·공공성 훼손 우려 커져 공동체 중심 ‘대인 돌봄’ 모델 확산 94년 첫 의료사협…안성 등 전국 확산 지역 건강공동체로...

  • HERI
  • 2021.11.30
  • 조회수 61

“협동조합은 위기의 시대에 가장 복원력 뛰어난 기업”

【제33차 세계협동조합대회】 아리엘 과르코 ICA 회장 인터뷰 협동조합 3억개 일자리 창출 G20보다 많고 전세계 10% 차지 사람 중심 경제의 경쟁력 보여줘 코로나 이후 삶의 방향 제시 요즘 유행하는 ESG 성공하려면 이윤창출...

  • HERI
  • 2021.11.30
  • 조회수 73

‘사람위한 좋은 기술’…서약하고 시상하고

프 마크롱, ‘좋은 기술 정상회의’ “안전장치 없으면 인권 위협” 서약 캠페인 이어 ‘디지털세’ 결실 다이슨·구글 등 기업도 시상행사 ‘사람친화적’ ‘인도적 기술’ 독려 국내엔 ‘휴먼테크놀로지 어워드’ ‘인도적 기술’...

  • HERI
  • 2021.11.29
  • 조회수 64

‘080’만 누르면 어디든 빠르고 편하게…하루 850만명이 쓴다

휴먼테크놀로지 어워드 2021 대상/ KT 080 콜 체크인 080 전화, 080 콜, 코로나, QR코드, / 게티이미지뱅크 코로나19 장기화에 따라 확진자 역학조사 및 동선관리를 위해 출입기록을 등록하는 서비스에도 진화가 이루어지고 있다...

  • HERI
  • 2021.11.29
  • 조회수 54

'사람 친화적’ 기술·서비스, 코로나와 공존의 길 열었다

올해의 키워드 ‘코로나 적정기술’ 방문자 출입기록 의무화되고 온라인 교육·미팅 일상화하고 배달수요 폭증하는 변화된 세상 너무 높지도, 낮지도 않은 수준으로 ‘인간적인 삶’ 가능하게 도와준 비대면시대 새로운 기술·서비스들...

  • HERI
  • 2021.11.29
  • 조회수 63

“수도권 쏠림 막으려면 단일 행정구역 넘어 초광역적 협력해야”

제2회 ‘대한민국도시포럼’ 유엔해비타트·한겨레 공동개최 ‘메가시티 리전’ 주제로 균형발전과 자치분권 모색 “수도권 일극집중 체제 한계, 다극 거점형 공간 구축 필요” 25일 서울 용산구 드래곤시티 호텔에서 제2회 대한민국...

  • HERI
  • 2021.11.26
  • 조회수 211

“기록적인 ‘수도권 쏠림현상’ 지속가능한 해법 함께 찾아야죠”

[짬] 유엔해비타트 한국위원회 최기록 회장 최기록 회장이 지난 11일 서울 여의도 사무실에서 도시와 청년의 범주에서 유엔해비타트 한국위원회의 역할에 대해 설명하고 있다. 사진 김슬아 한겨레경제사회연구원 보조연구원 “우리...

  • HERI
  • 2021.11.25
  • 조회수 195

“메타버스는 인터넷의 미래” 저커버그 ‘도박’ 성공할까

페이스북, ‘메타버스 기업’ 선언 PC통신→인터넷→모바일 진화처럼…“메타버스는 다음 단계” 새로운 인터넷 기대에 페이스북의 ‘곤경탈출 수법’ 비난도 마크 저커버그는 2021년 10월28일 ‘페이스북 커넥트’ 행사에서 홍보 영상...

  • HERI
  • 2021.11.15
  • 조회수 505

중고차판매 ‘생계형 적합업종’ 판단 2년째 ‘낮잠’

자동차산업연합회 포럼 동반위 “부적합” 의견…중기부 처리시한 넘겨 소비자단체 “하루 217건, 1억1천만원 사기피해” 소비자 피해상담도 연평균 6천건 이상 쏟아져 소비자-판매상-완성차-부품사 ‘4자 상생안’ 필요 중고차 판매장 ...

  • HERI
  • 2021.11.08
  • 조회수 725

문장 입력하면 ‘그림 완성’ 인공지능 신세계 연다

AI 이미지처리 비약적 발전 사진·동영상에 자동 자막, 설명 텍스트 입력하면 이미지로 구현 인간 수준의 ‘이해’ 도달에 성큼 검색 고도화, 창작 활성화 기대 “경제적·윤리적 영향 연구 필요” AI, 텍스트-그림 교차인식 오픈...

  • HERI
  • 2021.11.08
  • 조회수 637

진보 학자들 “선진국보다 낮은 보유세 높여야” 윤석열·홍준표 ‘보유·양도세 인하’ 공약에 반대

29일 서울사회경제연구소 ‘부동산 심포지엄’ 이재명 후보의 ‘국토보유세’ 신설과 일맥상통 선진국보다 높은 거래세는 인하 제안 “기본·청년원가·쿼터주택 공급물량 한계” 전체 무주택자의 주거비용 안정화 필요 “집값 안정은 ...

  • HERI
  • 2021.10.28
  • 조회수 999

“데이터 정보 독점막고 공공재로 활용해야”

<2021 아시아미래포럼> 세션6 플랫폼 노동의 건강권, 데이터 주권 플랫폼 노동자들 질병비율 높아 건강기록 데이터화해 관리 필요 ‘플랫폼 노동의 건강권, 데이터 주권 그리고 경제 주권’ 세션에서 배중철 한국교통안전공단 경남...

  • HERI
  • 2021.10.26
  • 조회수 700