최근 공개된 메타(Meta)의 'VideoJAM'은 생성형 AI 영상 기술에서 동작 일관성과 물리적 사실성을 높이는 연구로 주목받고 있다.
VideoJAM이 적용된 영상의 움직임을 보고 AI 기술이 어디까지 발전할 것인가에 대해 굉장히 놀랍기까지 했다.
해서 이 글에서는 VideoJAM이 무엇이고, 기존 AI 모델과 어떤 차이점이 있는지, 그리고 향후 생성형 AI 시장에 미칠 영향에 대해 분석해보려고 한다.
1. Meta VideoJAM이란?
VideoJAM은 기존 AI 영상 생성 모델이 가진 동작 불안정성과 물리적 비일관성을 개선하는 연구 프로젝트이다. 쉽게 말해, AI가 생성한 영상에서 손과 발이 어색하게 움직이거나, 공이 허공에서 멈추는 등의 문제를 해결하는 것이 목표다.

VideoJAM의 핵심 특징
- 프레임 간 연결 최적화 ➜ 영상 속 사물과 인물의 움직임이 더 자연스러움
- 모션 일관성 개선 ➜ 신체 동작이 부드럽고 물리 법칙을 준수함
- AI 영상 생성 모델과 결합 가능 ➜ 단독 사용이 아닌, 기존 모델을 보완하는 역할

📌 VideoJam은 단독으로 텍스트에서 영상을 생성하는 AI가 아니다. 기존 AI 영상 생성 모델(ex. Runway Gen-3, Kling, Sora)의 프레임 간 동작 품질을 높이는 프레임워크다.
2. 기존 AI 모델과의 차이점
1) 기존 AI 영상 생성 모델의 한계
- 대부분의 AI 영상 생성 모델은 짧은 영상만 만들 수 있음
- 프레임 간 연결이 부자연스러워, 움직임이 어색하게 끊기는 경우가 많음
- 신체 동작이 물리 법칙을 따르지 않음 (ex. 공이 허공에 멈추거나, 사람이 벽을 통과함)
2) Meta VideoJAM의 차별점
(1) 자연스러운 움직임 구현
- 기존 모델은 개별 프레임을 조합하는 방식이라 움직임이 부자연스러웠지만, VideoJAM은 동작 자체를 학습하여 더 부드러운 영상을 만들어낸다.


✅ 예 1 : 발레리나 점프 동작이 끊기지 않고 자연스럽게 이어짐
✅ 예2 : 손에 쥐고 있는 스피너만 회전하는 등의 물리적 사실성 유지
(2) 프레임 간 연결 최적화
- VideoJAM은 실시간 피드백 시스템을 도입하여 이전 프레임과 다음 프레임을 자연스럽게 연결한다.
3. 성능 비교 | VideoJAM vs 기존 모델
모델 | 움직임 자연스러움 | 화질 | 데이터 효율성 |
VideoJAM | 92.4 | 73.4 | ⭐️⭐️⭐️⭐️ |
Sora | 68.5 | 75.4 | ⭐️⭐️ |
Kling 1.5 | 63.8 | 76.8 | ⭐️ |
Runway Gen3 | 77.3 | 73.2 | ⭐️⭐️⭐️ |
📌 82%의 사용자가 VideoJAM이 더 자연스러운 움직임을 보여준다고 평가함
4. VideoJAM의 활용 가능성
1) 영상 제작 비용 절감
- 기존 영상 제작에는 카메라 장비, 조명, 편집 인력 등이 필요했지만, AI 기술을 활용하면 저비용으로도 고품질 영상 제작 가능
- 1인 크리에이터도 전문가급 영상 제작 가능
2) 마케팅 및 광고 활용
- AI가 자동으로 동작이 부드러운 영상 광고를 생성할 수 있음
- Meta가 향후 인스타그램, 페이스북 광고 기능에 VideoJAM을 적용할 가능성 존재 (공식 발표 X, 연구 단계)
3) 게임 및 영화 산업 활용
- AI 기술을 활용해 게임 캐릭터의 움직임을 더 자연스럽게 구현 가능
- 영화/애니메이션에서 AI가 자동으로 배경과 캐릭터를 부드럽게 움직이게 할 수 있음
5. 현재 한계점 및 해결 과제
- 복잡한 물리적 장면 구현 어려움 : 액체 흐름, 폭발 효과 등에서 비현실적인 표현 발생 가능성
- 상용화 일정 미정 : VideoJAM은 연구 단계이며, Meta가 일반 사용자를 위한 제품으로 출시할 계획을 공식 발표한 적 없음
📌 즉, VideoJAM은 연구 프로젝트일 뿐, 현재 Meta의 상용 AI 영상 생성 모델이 아님
6. 결론 | 앞으로 주목해야 할 점
📌 AI 영상 제작 기술이 대중화되는 시대, 기획자의 역할도 변화할 것 같다.
📌 VideoJAM의 지속적인 발전과 Meta의 상용화 일정 주시 필요
📌 현재는 연구단계지만, 향후 영상 AI 시장의 새로운 표준이 될 가능성이 큼
VideoJAM은 기존 AI 영상 생성 기술의 동작 품질을 개선하는 혁신적인 연구로, AI 영상 생성 모델이 더욱 현실적인 모션을 구현하는 데 기여할 가능성이 높다. 다만, 아직 연구 단계이므로 실제 상용화 시점과 적용 방식은 지켜봐야 한다.
참고 링크
VideoJAM
VideoJAM: Joint Appearance-Motion Representations for Enhanced Motion Generation in Video Model
hila-chefer.github.io
Meta AI Introduces VideoJAM: A Novel AI Framework that Enhances Motion Coherence in AI-Generated Videos
Despite recent advancements, generative video models still struggle to represent motion realistically. Many existing models focus primarily on pixel-level reconstruction, often leading to inconsistencies in motion coherence. These shortcomings manifest as
www.marktechpost.com

'기획자의 툴 활용법 > AI 도구 활용법' 카테고리의 다른 글
미드저니 개인화하여 사용하는 법 | 무드보드와 프로필 활용 가이드 (0) | 2025.02.12 |
---|---|
챗GPT 일정 예약 기능 사용법 | 자동화된 일정 관리 활용 가이드 (0) | 2025.02.11 |
챗GPT vs 미드저니 | AI 이미지 생성 비교 분석 (0) | 2025.02.08 |
미드저니 AI로 일관된 캐릭터 생성하는 방법 (0) | 2025.02.06 |
SKT 사용자라면 지금 꼭 써야 할 퍼플렉시티(Perplexity) Pro 무료 혜택 (0) | 2025.02.04 |