본문 바로가기
오늘의 이야기

Open AI, 텍스트를 동영상으로 변환하는 AI 'SORA' 공개

by 아둘파파 2024. 2. 17.

안녕하세요. 오늘은 Open AI에서 공개한 AI 영상 프로그램 Sora에 대해서 알아보려고 합니다.

Open AI사는 Chat GPT를 개발한 회사로 23년 공개한 Chat GPT의 파괴력이 상당했습니다. 이번에는 Sora를 공개하여 24년에도 상당한 파괴력을 일으킬 것으로 보입니다. 향후 Chat GPT V5도 공개될 것이라고 하는데, 정말 2024년은 AI의 전성기가 될 것 같다는 생각이 다시 한번 듭니다.

먼저, AI Sora가 생성한 AI 영상을 한번 보고 시작하겠습니다.

↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

AI SORA가 생성한 영상

 

블로그 내용은 아래 Open AI의 research에서 가져왔습니다.

↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

Open AI research 

 

Video generation models as world simulators

We explore large-scale training of generative models on video data. Specifically, we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios. We leverage a transformer architecture that oper

openai.com

오픈 AI가 최신 기술로 텍스트를 동영상으로 변환하는 AI 시스템 '소라(Sora)'를 공개했습니다. 이 시스템은 최대 1분 길이의 동영상을 빠르게 제작할 수 있으며, 다양한 캐릭터와 감정을 표현할 수 있는 매력적인 기능을 제공합니다.

소라는 텍스트 입력만으로 동영상을 생성할 수 있을 뿐만 아니라 기존의 이미지나 동영상을 활용하여 새로운 작품을 만들어내기도 합니다. 또한, 사용자의 프롬프트를 정확히 해석하고 물리적 세계에서의 상황을 이해하여 적절한 동영상을 생성합니다.

제작하는 원리는 세상에 공개된 모든 동영상을 검색된 텍스트에 맞춰서 가상 인코더로 분석하여 영상을 재생성하도록 되었습니다. 아래 그림 참고.

이러한 소라의 기술적 혁신과 다양한 활용 가능성은 많은 이들의 관심을 끌고 있습니다. 특히, 오픈 AI는 이미 챗GPT와 같은 성공적인 프로젝트를 통해 기술적 우위를 입증하고 있으며, 소라를 통해 더욱 넓은 시장에 진출할 것으로 기대됩니다.

아직 AI는 TV의 발전과정으로 생각한다면 흑백TV 정도의 수준이라고 합니다. 실력이 형평 없다는 의미가 아니고, 앞으로 발전이 무궁무진하다는 이야기입니다.

이미지 랜더링을 고배율할 수록 더 높은 품질의 영상을 구현함

 

텍스트 몇 줄로 고화질 영상을 생성할 수 있다면, 앞으로 콘텐츠 제작물에 있어서 엄청난 파장을 가져올 것은 분명합니다. 우리가 생각하는 유튜버나 PD, 영화 제작자 등등.. 영상 기술을 많이 가지고 있지 않더라도 자기가 생각하는 상상만으로 AI와 대화형식으로 영상 제작이 가능하다는 이야기입니다.

텍스트로 구현한 영상물 Open ai의 Sora

 

AI 영상 생성을 할 수 있는 제작툴은 굉장히 많습니다. 기존의 영상 생성 AI들은 그림 수준이나 조잡한 영상 or 라이브러리에서 가져온 영상으로 제작하는 수준이었습니다. 하지만, Open ai에서 공개한 Sora의 1분짜리 영상은 정말 잘 만들어진 영상 작품으로 보였습니다.

앞으로 AI의 성장이 얼마나 더 발전할지 기대반 걱정반 앞서는 부분입니다.

댓글