코쿠닝

애플 생성형 AI 이미지 편집 기능 MGIE 출시 본문

하루 경제

애플 생성형 AI 이미지 편집 기능 MGIE 출시

언제나삼 2024. 2. 15. 01:00
반응형

애플에서 생성형 AI 이미지 편집 기능인 MGIE 출시를 하였다. 그렇다면 MGIE는 무엇이고 어떠한 기술이 일상생활에 적용될 것으로 보이는지 알아보자.

애플 apple 생성형 ai MGIE 이미지 편집 기능 출시
apple 로고

 

1. MGIE 란?


MGIE(MLLM-Guided Image Editing)은 거대언어모델 (LLM)을 활용하여 이미지 편집을 지원하는 기술이다. 이 기술은 이미지 편집 과정에서 사용자가 텍스트로 원하는 수정 사항을 설명하면, LLM이 이를 이해하고 해당 이미지를 수정하는 방법을 제안하거나 직접 편집을 수행한다.

 

여기서 거대언어모델이란 이번에 구글지도에 사용된 생성형 AI 기술로서, 기계학습과 자연어 처리 기술을 활용하여 많은 양의 텍스트 데이터를 분석하고 이해하여 다양한 언어처리 기능을 수행한다.

 

 

 

2. 애플의 MGIE (MLLM-Guided Image Editing) 출시


애플이 이미지 편집을 지원하는 MGIE 인공지능 AI 모델을 출시하였다. 위에 설명과 같이 자연어 명령을 통하여 다양한 이미지 편집에 최적화된 유용한 도구라는 평가이다. 

 

보도에 따르면 MGIE의 개발은 애플과 캘리포니아 대학 산타바바라(UC) 캠퍼스 연구집과 함께 공동연구한 결과이며, 이번 관련 논문은 AI 분야 최고 권위 학회인 표현학습국제학회 ICLR에서 승인 및 발표되었다고 한다. 

 

 

애플 구글 트위터 및 기타 다양한 회사들이 생성형 ai 기능을 활용하고 있다.
다양한 IT 회사들

 

 

3. MGIE를 통한 기대되는 기술


가. MLLM을 기반으로 하는 MGIE

멀티모달 언어 모델(MultiModal Language Model, MLLM)은 자연어 처리와 컴퓨터 비전 기술을 결합한 인공지능 모델이다. 이 모델은 텍스트뿐만 아니라 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 입력으로 받아들이고 이를 이해하며 처리할 수 있다.

 

나. MGIE 기대되는 이미지 기술

MLLM은 대표적으로 이미지나 비디오와 관련된 텍스트 설명을 이해하는 능력을 갖추고 있다. 예를 들어, MLLM은 이미지나 비디오에 대한 텍스트 설명을 분석하여 이를 이해하고, 특정 작업을 수행하기 위해 이를 활용할 수 있다.

 

기본적으로 일반적인 포토샾의 기능, 이미지 품질의 최적화, 얼굴에 대한 특정 영역 편집 등 다양한 향상이 가능하다. 무엇보다 사용자가 명령어를 입력하면 사용자의 니즈에 맞는 커스터마이징 이미지를 제공 및 생성하게 될 것으로 보인다. 이는 앞으로 다양한 산업군에 필요한 편집 시나리오에 서비스가 제공될 것으로 보인다.

반응형