오늘도 공부
Seedance 2.0 프롬프트, 예쁜 문장보다 중요한 것은 구조다 본문
AI 영상 생성이 점점 쉬워졌다고들 말합니다. 텍스트 몇 줄만 입력하면 그럴듯한 장면이 나오고, 짧은 숏폼 영상도 빠르게 뽑아낼 수 있습니다. 하지만 실제로 여러 번 만들어본 사람이라면 금방 느끼게 됩니다. 아이디어가 좋아도 결과가 쉽게 흔들리고, 화면이 깨지고, 인물이 달라지고, 카메라가 뜻대로 움직이지 않는다는 것을요.
많은 초보자들이 여기서 이렇게 생각합니다.
“프롬프트를 더 길게 써야 하나?”
“더 멋있는 표현을 넣어야 하나?”
“cinematic, epic, stunning 같은 단어를 더 많이 넣어야 하나?”
그런데 실제로는 반대인 경우가 많습니다. 문제는 문장의 화려함이 아니라 프롬프트의 구조에 있습니다.
제가 정리한 핵심은 단순합니다. Seedance 2.0은 단순한 텍스트 입력형 영상 생성기가 아니라, 이미지·영상·오디오·텍스트를 함께 다루는 멀티모달 연출 도구에 가깝습니다. 그래서 결과를 안정적으로 만들고 싶다면, 시처럼 쓰기보다 촬영감독처럼 지시해야 합니다.
이 글에서는 그 구조를 브런치용으로 차분하게 풀어보겠습니다. 단순 요약이 아니라, 바로 실전에 옮길 수 있도록 예제까지 함께 정리합니다.
왜 Seedance 프롬프트는 일반 텍스트 프롬프트와 다르게 접근해야 할까
Seedance 계열 프롬프트에서 중요한 건 “무엇이 멋져 보이는가”가 아니라 “모델이 무엇을 오해하지 않게 할 것인가”입니다.
예를 들어 아래 두 문장을 비교해보겠습니다.
좋지 않은 예
A beautiful cinematic woman in an epic room with amazing lighting
이 문장은 읽으면 그럴듯해 보입니다. 하지만 실제 생성 모델 입장에서는 불명확합니다.
- 여성이 어떻게 생겼는지 알 수 없습니다.
- 무엇을 하고 있는지 알 수 없습니다.
- 카메라가 움직이는지 고정인지 알 수 없습니다.
- 조명이 어떤 종류인지 알 수 없습니다.
- “beautiful”, “cinematic”, “epic”은 감상어이지 지시어가 아닙니다.
더 좋은 예
[Subject]
late 20s woman, short dark curls, small silver hoop earring, black turtleneck
[Action]
she slowly turns toward the window and pauses
[Camera]
slow push-in from medium shot, stable camera
[Style]
golden hour lighting, cinematic film tone, 35mm, warm amber tone
[Constraints]
avoid jitter, avoid bent limbs, maintain face consistency, avoid temporal flicker
이 프롬프트는 길이가 아주 길지 않아도 훨씬 명확합니다.
- 누구인지 보이고
- 무엇을 하는지 보이고
- 카메라가 어떻게 움직이는지 보이고
- 어떤 빛인지 보이고
- 무엇을 피해야 하는지도 보입니다.
즉, 프롬프트의 핵심은 문학성이 아니라 구조적 명확성입니다.
Seedance 프롬프트의 핵심 구조: 5-Layer Prompt Stack
실전에서 가장 중요한 구조는 다음 다섯 요소로 정리할 수 있습니다.
- Subject
- Action
- Camera
- Style
- Constraints
이 순서는 단순한 목록이 아니라, 모델이 장면을 이해하는 우선순위를 잡아주는 장치로 볼 수 있습니다.
1) Subject: 화면의 중심을 먼저 고정하기
가장 먼저 해야 할 일은 무엇이 프레임의 중심인가를 확실히 적는 것입니다.
예를 들어 “a woman”이라고만 쓰면 모델은 평균적인 여성을 상상합니다. 그런데 아래처럼 구체화하면 결과가 훨씬 안정됩니다.
late 20s woman, tight dark curls, small silver hoop earring, fitted black turtleneck, pale skin, calm expression
이 문장에서 고정되는 요소는 다음과 같습니다.
- 연령대
- 헤어스타일
- 액세서리
- 의상
- 피부 톤
- 표정
이런 세부를 적는 이유는 “더 멋있게 보이게 하려는 것”이 아니라, 모델이 빈칸을 마음대로 채우지 못하게 하려는 것입니다.
2) Action: 감정이 아니라 움직임을 지시하기
AI 영상에서 많은 분들이 자주 하는 실수가 있습니다. 감정을 써놓고 동작을 생략하는 것입니다.
예를 들면 이런 식입니다.
she looks sad
이건 사람이 보면 이해할 수 있지만, 모델은 애매하게 받아들일 수 있습니다. 반면 아래처럼 바꾸면 훨씬 명확해집니다.
she lowers her head slowly, pauses, then reaches toward the old photo with hesitation
즉, “슬프다”를 직접 말하기보다 슬픔이 드러나는 행동을 쓰는 편이 좋습니다.
3) Camera: 피사체 움직임과 카메라 움직임을 분리하기
이 부분이 실제 품질 차이를 크게 만듭니다.
예를 들어 이런 문장은 흔들리기 쉽습니다.
spinning camera around a dancing person
누가 도는 걸까요? 카메라인가요, 사람인가요, 둘 다인가요? 모델은 이 문장을 모호하게 처리할 가능성이 큽니다.
더 좋은 방식은 분리하는 것입니다.
subject action: the dancer spins slowly
camera: fixed framing
혹은
subject action: the dancer remains centered and turns gently
camera: slow orbit around the subject
이렇게 쓰면 무엇이 움직이고 무엇이 고정되는지가 분명해집니다.
4) Style: 특히 조명을 구체적으로 적기
많은 분들이 style을 “cinematic” 같은 한 단어로 끝냅니다. 하지만 이건 너무 추상적입니다.
Seedance 스타일 프롬프트에서는 조명이 특히 중요하게 작동하는 경우가 많습니다. 예를 들면 아래와 같습니다.
- golden hour
- rim light
- overcast daylight
- soft key from 45 degrees
- volumetric fog
- motivated lighting from practical source
즉 “멋진 조명”이 아니라, 빛이 어디서 어떻게 들어오는지를 적어야 합니다.
5) Constraints: 무엇을 망치지 말아야 하는지 미리 적기
좋은 결과는 멋진 형용사보다 실패 방지 문구에서 나오는 경우가 많습니다.
대표적인 예시는 다음과 같습니다.
avoid jitter
avoid bent limbs
avoid identity drift
avoid temporal flicker
maintain face consistency
stable picture
sharp clarity
이런 문구는 특히 인물, 액션, 빠른 카메라 움직임, 숏츠 영상에서 중요합니다.
카메라 키워드는 왜 중요한가
AI 영상이 어색해지는 가장 큰 이유 중 하나는 카메라 지시가 불분명하기 때문입니다.
실전에서 자주 쓰는 카메라 키워드를 정리하면 다음과 같습니다.
고정 계열
- fixed / locked-off: 카메라 정지
- static wide: 넓은 고정 쇼트
- locked tripod: 삼각대처럼 흔들림 없는 고정
이동 계열
- push-in / dolly in: 앞으로 들어감
- pull-out / dolly out: 뒤로 빠짐
- pan left/right: 좌우 회전
- tracking shot / follow: 피사체를 따라감
- orbit / arc: 피사체 주위를 돎
- crane up/down: 수직 상승/하강
- gimbal: 부드럽고 안정적인 이동
- handheld: 일부러 자연스러운 흔들림
속도 수식어
- slow
- gentle
- smooth
- controlled
- barely
- gradual
여기서 중요한 것은 fast를 남발하지 않는 것입니다. 너무 많은 요소가 동시에 빨라지면 지터나 깨짐이 쉽게 생길 수 있습니다. 그래서 빠르게 만들고 싶은 것이 있더라도, 하나만 빠르게 하고 나머지는 안정화하는 편이 좋습니다.
조명과 스타일은 어떻게 써야 할까
많은 프롬프트가 style 부분에서 막힙니다. 예쁜 느낌을 쓰고 싶지만, 너무 추상적으로 쓰면 결과가 흔들립니다.
좋지 않은 예
cinematic, epic, beautiful lighting
더 좋은 예
golden hour lighting, cinematic film tone, 35mm, warm amber tone, soft rim light
좋은 style 문장은 보통 다음 요소를 포함합니다.
- 조명 종류
- 색감
- 필름 질감
- 콘트라스트 특성
- 분위기 앵커
예를 들어,
overcast daylight, soft diffused shadows, documentary-style handheld framing
이 문장은 자연광 다큐 느낌을 만들어내는 데 도움이 됩니다.
반대로,
chiaroscuro lighting, crushed blacks, warm practical lamp glow, cinematic 35mm
이렇게 쓰면 더 강한 영화적 대비가 만들어질 가능성이 높습니다.
멀티샷 타임코드 방식이 중요한 이유
짧은 15초 영상도 한 덩어리로 쓰기보다, 시간 구간별로 나누어 설계하면 훨씬 안정적인 결과를 얻을 수 있습니다.
예를 들면 이런 식입니다.
[0-4s]
shot size: wide shot
camera: static
subject action: woman stands by the desk looking at an old photograph
lighting: warm window light
[4-8s]
shot size: medium shot
camera: slow push-in
subject action: she reaches toward the photograph and hesitates
lighting: golden hour highlights on face and hand
[8-12s]
shot size: close-up
camera: continued gentle push-in
subject action: fingertips stop just before touching the photo
lighting: soft warm side light
[12-15s]
shot size: close-up hold
camera: static hold
subject action: she touches the photo and exhales softly
lighting: steady amber light, shallow falloff
이 방식의 장점은 분명합니다.
- 장면 전개가 생깁니다.
- 카메라가 중간에 제멋대로 바뀌는 일이 줄어듭니다.
- 감정의 흐름을 단계적으로 설계할 수 있습니다.
- 숏츠에서 특히 중요한 “도입 → 상승 → 클라이맥스”가 자연스러워집니다.
실전에서는 다음 흐름이 가장 무난합니다.
- 0–4초: 세계를 보여주는 wide shot
- 4–8초: 인물과 상황을 좁혀가는 medium shot
- 8–12초: 감정이 최고조로 가는 close-up
- 12–15초: reveal 또는 hold
즉, wide → medium → close → closest/reveal 구조입니다.
멀티모달과 @ 레퍼런스 시스템은 어떻게 써야 할까
이 부분은 Seedance형 워크플로우에서 특히 중요합니다. 텍스트만으로 모든 걸 설명하기보다, 참조 자산의 역할을 분명히 나누는 것이 훨씬 강력할 수 있습니다.
예를 들면,
- @Image1 = 캐릭터 기준 이미지
- @Image2 = 배경/환경 기준 이미지
- @Video1 = 카메라 움직임 레퍼런스
- @Audio1 = 배경음악 또는 타이밍 기준
이렇게 역할을 명시해두면 모델이 평균화해서 처리하는 문제를 줄일 수 있습니다.
또 하나 좋은 방식은 첫 프레임 + 마지막 프레임 전략입니다.
예를 들어,
- 시작: 조용한 방에 서 있는 인물
- 끝: 우주 공간으로 떠오른 같은 인물
이 두 이미지를 기준으로 주면, 그 사이의 변화 과정을 텍스트로 설계하기 쉬워집니다.
초보자가 가장 자주 하는 실수
이론을 이해해도, 실제로는 아래 실수를 많이 합니다.
1) 추상어를 너무 많이 쓰는 경우
epic, amazing, beautiful, cinematic, powerful, awesome
이런 단어는 대부분 감상문에 가깝습니다. 지시문으로는 효율이 떨어집니다.
2) 인물을 너무 대충 쓰는 경우
a woman in a room
이러면 얼굴, 의상, 나이, 체형, 헤어, 인상 모두 흔들릴 수 있습니다.
3) 피사체와 카메라를 한 문장에 섞는 경우
spinning around quickly while the camera is moving dynamically
4) 제약 문구를 빼는 경우
처음에는 멋진 묘사만 적고 끝내기 쉽습니다. 하지만 실제로 결과를 망치는 건 흔들림, 왜곡, 얼굴 변화, 노출 깜빡임 같은 문제입니다.
5) 실패했을 때 프롬프트를 전부 갈아엎는 경우
가장 비효율적인 방식입니다. 카메라, 조명, 스타일, 액션을 한 번에 바꾸면 무엇이 문제였는지 알 수 없습니다.
가장 좋은 방식은 다음과 같습니다.
- 기본 버전 2~3개 생성
- 카메라만 바꾸기
- 조명만 바꾸기
- style만 바꾸기
- constraints를 강화하기
즉 한 번에 한 변수만 바꾸기입니다.
실전 예제 1: 감정 장면 프롬프트
아래는 가장 기본적인 감정 장면 예제입니다.
[Subject]
late 20s woman, short dark curls, silver hoop earring, black turtleneck
[Action]
she stands by the desk, looks at an old photograph, slowly reaches toward it, hesitates, then touches it gently
[Camera]
slow push-in from medium shot, stable framing
[Style]
golden hour lighting, cinematic film tone, 35mm, warm amber tone, shallow depth of field
[Constraints]
avoid jitter, avoid bent limbs, maintain face consistency, avoid temporal flicker, stable picture, sharp clarity
이 예제에서 중요한 것은 감정이 아니라 감정을 드러내는 동작을 넣었다는 점입니다.
실전 예제 2: 제품 광고 프롬프트
제품 광고는 특히 카메라와 조명이 중요합니다.
[Subject]
a luxury perfume bottle with clear glass body and metallic cap on a dark reflective surface
[Action]
the bottle remains still while light moves across the glass surface, revealing texture and reflection
[Camera]
gentle slow push-in, macro framing, smooth controlled movement
[Style]
dramatic rim light, premium commercial look, shallow depth of field, dark minimal background
[Constraints]
avoid jitter, avoid distortion, no stretching, avoid temporal flicker, stable picture, sharp clarity, clean edges
제품은 스스로 움직이지 않기 때문에, 빛과 카메라가 액션을 대신 만든다고 이해하면 좋습니다.
실전 예제 3: 세로 숏츠용 우주 전투 프롬프트
세로 9:16 숏츠에서는 전장을 가로로 넓게 펼치기보다, 주인공 전투기를 중앙축에 고정하고 아래에서 위로 치고 올라가는 흐름이 잘 맞습니다.
15-second cinematic vertical space battle sequence, 9:16 aspect ratio
[0-4s]
shot size: ultra wide vertical shot
camera: slow push-in
subject action: the hero starfighter rises from the lower frame toward a massive battle above
lighting: cold planetary backlight, red laser streaks, blue engine trails
[4-8s]
shot size: medium vertical chase shot
camera: rear tracking centered on the starfighter
subject action: the fighter ascends between debris while enemy ships fire from behind
lighting: flashing weapon bursts, engine reflections on debris
[8-12s]
shot size: close action shot
camera: fast but controlled side-to-rear follow
subject action: the hero ship turns sharply and destroys one enemy fighter
lighting: intense explosion bloom, hot orange wreckage glow
[12-15s]
shot size: vertical climax shot
camera: dramatic pull-out
subject action: the hero ship charges upward while a giant flagship explodes behind it
lighting: massive explosion backlight, flickering reflections across nearby ships
style: cinematic film tone, premium sci-fi blockbuster, strong vertical depth
constraints: avoid jitter, avoid distortion, no stretching, avoid temporal flicker, stable picture, sharp clarity
여기서 중요한 것은 “스타워즈풍”이라는 감상어가 아니라, 세로 프레임에 맞춘 구도 설계와 액션 흐름입니다.
실전 예제 4: 꿈에서 우주로 이어지는 변환 장면
시작 이미지와 끝 이미지 연결 테스트용으로도 좋은 구조입니다.
15-second cinematic vertical transformation sequence, 9:16
[0-4s]
shot size: ultra wide vertical shot
camera: slow push-in
subject action: a young woman stands in the center of a quiet bedroom at night
lighting: soft moonlight, cool blue room shadow
[4-8s]
shot size: medium vertical shot
camera: smooth upward follow
subject action: papers and objects begin to float, walls dissolve into stars
lighting: stronger blue-violet glow, subtle cosmic reflections
[8-12s]
shot size: close action shot
camera: controlled push-in
subject action: the woman lifts upward as fragments of the bedroom drift apart
lighting: intense portal bloom, glowing particles, bright rim light
[12-15s]
shot size: vertical climax shot
camera: pull-through into space
subject action: the woman fully rises into outer space, leaving the bedroom behind
lighting: radiant cosmic blue-white streaks, dreamy backlight
style: cinematic dreamlike sci-fi, magical realism, strong depth layering
constraints: avoid jitter, avoid distortion, avoid temporal flicker, maintain face consistency
이런 구조는 첫 프레임과 마지막 프레임을 연결하는 테스트에도 적합합니다.
1. 문제 제기부터 시작하기
“왜 AI 영상은 자꾸 흔들릴까?”
“왜 내 프롬프트는 멋지게 써도 결과가 불안정할까?”
이런 질문으로 시작하면 독자가 바로 들어옵니다.
2. 답을 구조로 제시하기
길게 설명하기보다,
- Subject
- Action
- Camera
- Style
- Constraints
이 다섯 요소를 글의 뼈대로 삼는 것이 좋습니다.
3. 추상어 vs 구조화 예시를 꼭 넣기
독자 입장에서는 “왜 cinematic만 쓰면 안 되지?”가 가장 먼저 생깁니다. 그러니 나쁜 예 / 좋은 예 비교를 꼭 넣는 것이 좋습니다.
4. 예제를 짧고 바로 복붙 가능하게 넣기
사람들은 원칙보다 예제를 더 빨리 가져갑니다.
5. 마지막에 반복 실험 원칙을 붙이기
결론을 아래처럼 마무리하면 좋습니다.
좋은 프롬프트는 시처럼 멋지게 쓰는 것이 아니라, 촬영감독처럼 명확하게 지시하는 데서 나온다. 그리고 실패했을 때는 더 길게 쓰는 것이 아니라, 한 번에 한 변수만 고쳐야 한다.
마무리
AI 영상 프롬프트를 잘 쓴다는 것은 화려한 수식어를 많이 붙이는 일이 아닙니다. 오히려 반대입니다. 무엇을 보여줄지, 누가 움직일지, 카메라가 어떻게 따라갈지, 빛이 어디서 들어올지, 무엇을 망치지 말아야 할지를 차분하게 적는 일에 가깝습니다.
특히 Seedance 2.0처럼 멀티모달 특성이 강한 도구를 다룰 때는, 텍스트만으로 모든 걸 해결하려 하기보다 이미지·영상·오디오를 함께 쓰고 역할을 명시하는 방향이 더 자연스럽습니다.
결국 중요한 것은 하나입니다.
프롬프트를 예쁜 문장으로 쓰지 말고, 장면 설계서처럼 써라.
이 한 줄만 기억해도, 영상 결과는 꽤 달라질 수 있습니다.
바로 복붙해서 쓸 수 있는 마지막 템플릿
[Subject]
[Action]
[Camera]
[Style]
[Constraints]
혹은 15초 멀티샷이라면,
[0-4s]
shot size:
camera:
subject action:
lighting:
[4-8s]
shot size:
camera:
subject action:
lighting:
[8-12s]
shot size:
camera:
subject action:
lighting:
[12-15s]
shot size:
camera:
subject action:
lighting:
style:
constraints:
이 두 가지 구조만 제대로 익혀도, 대부분의 장면은 훨씬 안정적으로 설계할 수 있습니다.
'Seedance2' 카테고리의 다른 글
| warrior 액션 장면 프롬프트 (Seedance2) (1) | 2026.04.19 |
|---|---|
| 지구에서 캐릭터까지 내려오는 멋진 프롬프트 (0) | 2026.04.19 |
| Seedance2.0에 시네마틱 프롬프트 만들기 튜터리얼 #2 (0) | 2026.04.16 |
| Seedance를 위한 프롬프트 설계 튜터리얼 #1 (1) | 2026.04.16 |
| Seedance 2.0 손그림 애니메이션 테스트 (0) | 2026.04.16 |
