Recent Posts
Recent Comments
반응형
«   2026/05   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
Archives
Today
Total
관리 메뉴

오늘도 공부

Seedance 2.0 프롬프트, 왜 자꾸 애매하게 나올까 본문

Seedance2

Seedance 2.0 프롬프트, 왜 자꾸 애매하게 나올까

행복한 수지아빠 2026. 4. 23. 10:15
반응형

잘 되는 사람들은 “설명”하지 않고 “연출”한다

AI 영상 생성 툴을 처음 만지기 시작하면 누구나 비슷한 경험을 합니다.
머릿속에는 분명 멋진 장면이 있었는데, 결과물은 어딘가 애매합니다. 인물은 예쁜데 행동이 이상하고, 분위기는 좋은데 카메라가 산만하고, 전체적으로 “거의 맞는 것 같은데 결정적으로 부족한 영상”이 나옵니다.

많은 사람이 이 문제를 모델 성능 탓으로 돌리지만, 실제로는 프롬프트 구조의 문제인 경우가 많습니다. 업로드하신 가이드의 핵심도 바로 이것입니다. Seedance 2.0은 긴 설명문보다, 촬영팀에게 전달하는 지시서 같은 프롬프트를 더 잘 따른다는 점입니다. 다시 말해, 소설처럼 묘사하는 방식보다 감독처럼 연출하는 방식이 더 잘 먹힙니다.

이 차이를 이해하면 결과물이 달라집니다.
“한 여자가 슬픈 표정으로 비 오는 거리에서 걸어간다”라고 쓰는 것과,
“medium side shot, slow dolly follow, late 20s woman, black coat, wet hair, walking alone through a rainy alley, restrained expression, cold blue streetlight, steady pace, no morphing”이라고 쓰는 것은 완전히 다릅니다.

앞 문장은 장면의 감정을 말합니다.
뒤 문장은 장면의 촬영 방법을 말합니다.

Seedance 2.0은 바로 후자에 더 강합니다.


Seedance 2.0을 잘 쓰려면 먼저 생각을 바꿔야 한다

이 도구를 “텍스트를 넣으면 영상이 나오는 상자”처럼 다루면 결과가 흔들리기 쉽습니다. 업로드하신 정리문에서도 Seedance는 텍스트 하나만으로 모든 것을 상상하게 두는 방식보다, 여러 입력을 함께 써서 장면을 고정하는 방식에 더 강하다고 설명합니다. 예시로는 이미지, 비디오 클립, 오디오, 텍스트 지시문이 함께 언급됩니다. 핵심은 모델에게 모든 걸 동시에 발명하게 하지 말라는 뜻입니다.

왜냐하면 텍스트만 대충 넣으면 모델은 동시에 너무 많은 일을 해야 하기 때문입니다.
인물 정체성도 정해야 하고, 카메라 움직임도 만들고, 조명과 템포와 액션도 함께 조립해야 합니다. 이 과정에서 가장 먼저 무너지는 것은 대개 일관성입니다.

그래서 Seedance 프롬프트를 쓸 때는 질문이 달라져야 합니다.

“내가 무엇을 상상하고 있지?”가 아니라
“이 장면을 찍는다면 촬영팀에게 무엇을 먼저 말해야 하지?”가 되어야 합니다.

이 한 끗 차이가 품질 차이를 만듭니다.


정리하면 프롬프트는 세 가지를 분리해서 써야 한다

그럼 Seedance 2.0 프롬프트를 세 덩어리로 나눠 설명합니다.

첫째는 Camera입니다.
이 장면을 어떤 샷 크기로 볼지, 카메라가 어떻게 움직일지, 어떤 렌즈 느낌일지, 구도를 어떻게 잡을지 정하는 영역입니다.

둘째는 Motion입니다.
무슨 행동이 벌어지는지, 속도는 어떤지, 몇 초 동안 진행되는지, 전환은 어떻게 연결될지 정하는 영역입니다.

셋째는 Subject입니다.
화면의 주인공이 누구인지, 외형은 어떤지, 어떤 감정 상태인지, 환경과 어떤 관계를 맺고 있는지 정하는 영역입니다.

이 구성이 중요한 이유는 아주 단순합니다.
대부분의 초보 프롬프트는 이 세 가지가 뒤섞여 있기 때문입니다.

예를 들어 이런 문장을 봅시다.

아름답고 영화적인 장면, 한 여자가 슬프게 비를 맞으며 걷고 카메라는 멋지게 움직인다.

겉보기에는 그럴듯합니다.
하지만 실제로는 거의 아무것도 결정되지 않았습니다.

  • 여자는 몇 살인지
  • 어디에 있는지
  • 어떤 옷을 입었는지
  • 카메라는 wide인지 close-up인지
  • 움직임은 pan인지 dolly인지 orbit인지
  • 걷는 속도는 어떤지
  • 전체 장면은 정적인지 격한지

이런 정보가 비어 있으면, 모델은 그 빈칸을 자기 식으로 채웁니다.
그 결과가 우리가 흔히 보는 “어딘가 AI스러운 애매한 영상”입니다.


그래서 실전에서는 5단계 구조로 쓰는 게 가장 안정적이다

업로드하신 가이드에서는 Seedance를 예측 가능하게 만드는 핵심 구조로 다음 순서를 제시합니다.

Subject → Action → Camera → Style → Constraints

이 순서는 단순한 팁이 아니라, 실제로 장면을 고정하는 사고 순서에 가깝습니다.
무엇을 찍는지 정하지 않은 상태에서 카메라부터 정하면 흔들리고, 행동이 정해지지 않은 상태에서 스타일만 넣으면 공허해집니다. 반대로 이 순서대로 가면, 장면의 중심축이 생깁니다.

이제 각각을 조금 더 깊게 보겠습니다.


1. Subject: 가장 먼저 고정해야 하는 것은 “누구를 보여줄 것인가”다

Seedance에서 가장 먼저 흔들리는 것은 대개 인물입니다.
얼굴이 미묘하게 바뀌고, 머리 길이가 달라지고, 같은 사람인데 컷마다 다른 사람처럼 보입니다. 이걸 줄이려면 Subject를 아주 구체적으로 써야 합니다.

가이드에서도 좋은 Subject는 막연한 명사가 아니라, 장면의 중심축을 분명하게 주는 설명이라고 말합니다. 나이대, 헤어스타일, 옷차림, 액세서리, 화면 내 위치, 표정 같은 요소가 포함될수록 안정적입니다. 예시로 “a woman”보다 “late 20s woman, tight dark curls, small silver hoop earring, black turtleneck, centered in frame, neutral expression” 같은 식이 훨씬 낫다고 설명합니다.

이 차이는 큽니다.

나쁜 프롬프트:

a woman

조금 나아진 프롬프트:

late 20s Korean woman, straight black hair tucked behind the ears, charcoal long coat, no accessories, centered in frame, tired eyes, restrained expression

앞 문장은 대상만 있습니다.
뒤 문장은 정체성의 기준점이 있습니다.

영상 생성에서 기준점이 없다는 것은, 계속 떠다닌다는 뜻입니다.


2. Action: 행동은 많을수록 좋은 게 아니라, 하나일수록 좋다

초보 프롬프트의 두 번째 문제는 행동을 너무 많이 넣는 것입니다.

“걸으면서 돌아보고 손을 뻗고 웃다가 멈추고 바람에 머리카락이 날리고 카메라는 돌고 조명이 변하고…”

사람은 이 문장을 읽고 장면을 상상할 수 있지만, 모델은 이 모든 동작을 한 번에 충족하려다 리듬이 깨질 수 있습니다.

가이드에서도 주요 행동 1개, 보조 미세 움직임 1~2개 정도가 가장 좋다고 강조합니다. 핵심 동작 하나를 정하고, 그 위에 작은 움직임만 얹는 방식입니다. 예를 들면 “걸어간다”가 메인 액션이고, “머리카락이 조금 흔들린다”와 “눈을 한 번 깜빡인다” 정도가 서브입니다.

예를 들어 보겠습니다.

나쁜 예:

she walks, turns, smiles, looks back, reaches forward, then runs

좋은 예:

she walks slowly toward the camera, with slight hair movement from the wind, and one subtle glance to the right

좋은 프롬프트는 “많이 시키는 프롬프트”가 아니라
“무엇이 중심 동작인지 분명한 프롬프트”입니다.


3. Camera: 결과물의 수준 차이는 카메라 지시에서 크게 벌어진다

영상 생성에서 가장 과소평가되는 부분이 카메라입니다.
많은 사용자가 Subject와 Style에는 신경을 쓰지만, Camera는 “cinematic movement” 같은 한마디로 넘깁니다. 그런데 가이드에서는 바로 이 부분을 특히 중요하게 봅니다. Seedance는 카메라 지시를 꽤 강하게 반영하므로, 뭉뚱그려 쓰기보다 한 가지 메인 카메라 움직임을 명확히 정하는 것이 좋다고 설명합니다. 추천 예시로는 slow push-in, orbit around subject, pan left-to-right, dolly follow, locked tripod 등이 제시됩니다. 그리고 한 번의 생성에서는 메인 카메라 움직임 하나를 정하고 끝까지 밀라고 조언합니다.

이 말은 실전에서 아주 중요합니다.

예를 들어 다음 둘을 비교해보면 차이가 분명합니다.

애매한 프롬프트:

cinematic camera movement

명확한 프롬프트:

medium side shot, slow dolly follow from left to right, 50mm lens, steady movement, no handheld shake

첫 문장은 분위기만 말합니다.
둘째 문장은 실제 촬영팀이 이해할 수 있는 지시입니다.

Seedance는 두 번째를 더 잘 따릅니다.


4. Style: “영화적으로”라고 쓰지 말고, 실제 픽셀을 바꾸는 요소를 써야 한다

스타일을 쓸 때도 흔한 오해가 있습니다.
많은 사용자가 “cinematic”, “beautiful”, “epic”, “stunning” 같은 단어를 붙이면 자동으로 결과가 고급스러워질 것이라고 생각합니다. 하지만 업로드하신 가이드에서는 이런 단어들이 오히려 결과를 흐릴 수 있다고 지적합니다. 특히 fast, epic, amazing, beautiful, stunning, lots of movement, cinematic 단독 사용 같은 표현은 화면에 무엇을 만들어야 하는지 구체적으로 알려주지 못한다고 설명합니다.

즉, 스타일은 느낌 단어가 아니라 시각 단어로 써야 합니다.

예를 들면 이런 식입니다.

soft studio key light, subtle rim light, shallow depth of field, desaturated palette, light film grain, glossy reflections on the product surface

이 문장은 실제로 화면을 바꿉니다.
빛, 심도, 색감, 질감, 반사 같은 요소를 건드리기 때문입니다.

반대로 아래 문장은 멋져 보이지만 지시력이 약합니다.

beautiful cinematic premium style

이건 스타일이 아니라 감탄문에 가깝습니다.


5. Constraints: 모델이 멋대로 하지 못하게 막는 문장이 필요하다

가이드에서 특히 중요한 부분이 Constraints입니다.
많은 사람이 프롬프트를 “하고 싶은 말”만 채우고 끝내는데, 실제로 안정성을 높이는 데 큰 역할을 하는 것은 “하지 말아야 할 것”과 “유지해야 할 것”을 분명히 적는 것입니다.

업로드하신 정리문에서도 Constraints는 모델에게 어디까지 자유롭게 해도 되는지, 무엇은 절대 바꾸면 안 되는지를 알려주는 역할이라고 설명합니다. 예시로는 얼굴 안정성 유지, morphing 없음, 흔들림 없음, 정체성 유지, 왜곡 없음, 전환 부드럽게 같은 제약이 반복해서 나옵니다.

예를 들면 이런 문장이 Constraint입니다.

10 seconds, smooth steady motion, keep face and outfit consistent, no morphing, no extra limbs, no sudden camera shake

이 문장은 화려하지 않지만 굉장히 중요합니다.
왜냐하면 Seedance가 잘못하기 쉬운 실수를 미리 막아주기 때문입니다.

좋은 프롬프트는 상상력을 자극하는 문장만 있는 프롬프트가 아니라,
실수를 방지하는 안전장치까지 포함한 프롬프트입니다.


결국 프롬프트는 “문장”이 아니라 “설계”다

여기까지를 한 문장으로 줄이면 이렇습니다.

Seedance 2.0은 좋은 문장보다 좋은 장면 설계를 더 잘 따른다.

그래서 프롬프트를 쓸 때는 문장을 잘 쓰려고 애쓰기보다, 장면을 설계해야 합니다.

  • 누가 나오는지
  • 무엇을 하는지
  • 카메라는 어떻게 보는지
  • 빛과 색은 어떤지
  • 무엇을 절대 바꾸면 안 되는지

이 다섯 가지가 분리되어 있으면 결과가 좋아질 확률이 높아집니다.


실전 예제 1

감성적인 한국 콘서트 무대 장면 프롬프트

예를 들어 “감성적인 한국 콘서트 영상”을 만들고 싶다고 해봅시다.
많은 사람이 처음에는 이렇게 씁니다.

A beautiful emotional Korean concert with a female singer and a lot of audience, cinematic and amazing, dramatic lights, emotional mood.

이 프롬프트는 분위기만 있고 구조가 없습니다.
그래서 결과가 랜덤하게 흔들릴 가능성이 큽니다.

같은 장면을 구조적으로 다시 쓰면 이렇게 됩니다.

wide audience-facing concert shot, slow crane up from the back of the venue, 85mm telephoto compression, a Korean female singer in her early 30s standing center stage in a long black dress, holding a wireless microphone, singing steadily without exaggerated mouth visibility, thousands of audience lights filling the dark arena, soft warm spotlight on the singer, cool blue ambient light over the crowd, gentle haze in the air, slow and deliberate pacing, 10 seconds, smooth continuous motion, keep the singer identity consistent, no sudden zoom, no chaotic camera shake

이 프롬프트가 더 좋은 이유는 분명합니다.

Subject가 있고,
Action이 있고,
Camera가 있고,
Style이 있고,
Constraints가 있습니다.

즉, Seedance가 따라야 할 장면 설계도가 생긴 것입니다.


실전 예제 2

제품 광고 프롬프트는 왜 “멋지게”보다 “식별 가능하게”가 중요할까

가이드에는 제품 광고 템플릿도 포함되어 있습니다. 손에 든 제품, 깔끔한 배경, 제품을 프레임 안으로 들고 와서 살짝 회전, slow push-in, 부드러운 스튜디오 조명, 선명한 반사, 흔들림 없음, 제품 식별 가능 같은 요소가 핵심이라고 정리되어 있습니다.

이걸 바탕으로 예제를 써보면 이런 식입니다.

clean studio tabletop shot, slow push-in, 50mm lens, a premium silver cosmetic bottle placed at the center on a matte white surface, a hand enters frame from the right and gently rotates the bottle once, soft diffused studio lighting, crisp highlight reflections on the metallic surface, minimal shadow, clean luxury commercial look, 8 seconds, stable hand motion, keep product label readable, no warping, no extra objects, no background clutter

여기서 중요한 단어는 “premium”보다 “label readable”입니다.
왜냐하면 광고에서 정말 중요한 것은 제품이 예뻐 보이는 것뿐 아니라, 제품이 정확히 인식되는 것이기 때문입니다.

AI 영상에서는 멋져 보이기만 하고 정작 브랜드 식별이 안 되는 경우가 자주 나옵니다.
그래서 제품 광고 프롬프트는 감성보다 통제가 더 중요합니다.


실전 예제 3

캐릭터 퍼포먼스나 토킹헤드는 왜 정적인 카메라가 유리할까

가이드의 토킹헤드 예시에서는 얼굴 특징이 일정한 클로즈업 캐릭터, 미세한 표정 변화와 작은 손동작, locked tripod, 얕은 심도, 얼굴 안정성 유지와 morphing 없음 같은 조건이 제시됩니다.

이건 아주 현실적인 조언입니다.
얼굴이 중요한 장면일수록 카메라를 화려하게 움직이는 것보다, 오히려 정적으로 두는 편이 더 안정적입니다.

예를 들면:

close-up portrait shot, locked tripod, 85mm lens, a Korean man in his late 30s with short neatly parted hair and a dark navy shirt, looking slightly off-camera, subtle breathing, one small hand gesture near the chest, calm serious expression, soft cinematic key light from the left, shallow depth of field, neutral dark background, 6 seconds, keep facial identity stable, no morphing, no lip distortion, no sudden lighting changes

이 프롬프트는 화려하지 않습니다.
하지만 얼굴을 안정적으로 유지해야 하는 장면에서는 이런 접근이 훨씬 강합니다.


실전 예제 4

액션 장면은 빠르게가 아니라, 무엇이 빠른지를 정확히 써야 한다

fast 같은 단어를 넣는다고 했을 경우 문제가 될수 있습니다. 무엇이 빠른지 알 수 없기 때문입니다. 피사체가 빠른지, 카메라가 빠른지, 편집이 빠른지, 리듬이 빠른지 모두 다를 수 있습니다.

예를 들어 아래 프롬프트는 좋지 않습니다.

epic fast action scene, cinematic, lots of movement

반면 이렇게 쓰면 훨씬 낫습니다.

full-body tracking shot, fast dolly follow from behind, a young hero in a damaged tactical jacket sprinting through a narrow alley, sparks falling from above, cloth movement visible, urgent pace, brief glance over the shoulder once, hard white backlight mixed with red emergency flashes, 5 seconds, maintain body proportions, no limb distortion, smooth forward tracking only, no random angle changes

여기서는 “빠르다”가 아니라
누가 빠른지,
카메라가 어떻게 빠른지,
장면 안에서 어떤 요소가 따라오는지가 분명합니다.

그게 실제 차이입니다.


프롬프트를 더 잘 쓰고 싶다면, 먼저 “나쁜 프롬프트”를 고치는 훈련을 해보면 좋다

아래는 흔히 쓰는 나쁜 프롬프트와, 그것을 개선한 예시입니다.

나쁜 프롬프트

beautiful cinematic woman in rain, emotional, amazing camera, dramatic

개선 프롬프트

medium side profile shot, slow dolly follow, 50mm lens, late 20s Korean woman in a wet black trench coat, walking alone through a narrow alley in the rain, one slow glance downward, restrained sadness, cold blue streetlight with soft warm reflections from shop windows, light mist in the background, 8 seconds, smooth steady pace, keep facial features and coat consistent, no morphing, no abrupt camera shake

어떤 점이 달라졌을까요?

“beautiful”, “cinematic”, “dramatic” 같은 포장 단어가 사라졌고,
대신 샷 크기, 렌즈, 의상, 행동, 조명, 시간, 제약이 들어갔습니다.

즉, 느낌을 제거하고 장면을 넣은 것입니다.


레퍼런스를 같이 쓰면 왜 훨씬 덜 AI처럼 보일까

업로드하신 정리문에서는 좋은 결과물 대부분이 레퍼런스 중심 작업 방식에서 나온다고 설명합니다. 그 이유는 레퍼런스가 인물 정체성, 구도, 움직임 리듬, 무드를 대신 고정해주기 때문이라고 되어 있습니다. 그래서 텍스트 프롬프트는 모든 걸 새로 발명하라는 주문이 아니라, 레퍼런스를 바탕으로 이렇게 연출하라는 감독 메모가 됩니다.

이 부분은 매우 중요합니다.

예를 들어, 텍스트만으로 “한국인 남자 배우, 감성적인 콘서트 무대, 입이 잘 안 보이게”라고 쓰는 것보다,
배우 레퍼런스 이미지 1장 + 무대 레퍼런스 1장 + 조명 무드 레퍼런스 1장을 함께 넣고 텍스트로 카메라와 액션만 보정하는 편이 훨씬 안정적입니다.

왜냐하면 모델이 매번 얼굴을 새로 상상할 필요가 없어지기 때문입니다.

텍스트는 부족한 부분을 채우고,
레퍼런스는 흔들리는 축을 고정합니다.

이 조합이 가장 강합니다.


실전 팁 5가지

첫째, 프롬프트를 쓸 때는 한 문장 안에 모든 걸 욱여넣지 말고, 머릿속에서 먼저 다섯 덩어리로 분리해보는 것이 좋습니다.
누가 나오고, 무엇을 하고, 카메라가 어떻게 움직이고, 빛과 질감은 어떻고, 어떤 오류를 막아야 하는지부터 정리해야 합니다.

둘째, 행동은 하나만 크게 잡는 편이 좋습니다.
“걷기”면 걷기, “돌아보기”면 돌아보기처럼 중심 동작 하나가 분명해야 합니다.

셋째, 카메라 움직임도 하나만 고르는 편이 좋습니다.
dolly, pan, orbit, locked tripod를 한 번에 섞기보다, 생성 하나당 메인 움직임 하나가 더 안정적입니다.

넷째, 스타일은 감탄사가 아니라 픽셀 지시로 써야 합니다.
cinematic 대신 soft key light, shallow depth of field, desaturated palette, light haze처럼 실제 화면을 바꾸는 단어가 훨씬 유효합니다.

다섯째, 마지막 줄에는 반드시 제약조건을 넣는 습관을 들이는 것이 좋습니다.
keep face consistent, no morphing, no extra limbs, smooth motion, no camera shake 같은 문장은 재미없어 보여도 품질에 직접적인 영향을 줍니다.


마무리

Seedance 2.0은 “잘 쓰는 사람”보다 “잘 연출하는 사람”에게 유리하다

이 글을 한 문장으로 정리하면 이것입니다.

Seedance 2.0 프롬프트는 글쓰기보다 연출 설계에 가깝다.

길고 감성적인 설명을 잘 쓰는 사람이 꼭 좋은 결과를 얻는 것은 아닙니다.
오히려 짧더라도 누가, 무엇을, 어떻게, 어떤 카메라로, 어떤 제약 안에서 보여줄지를 분명하게 쓰는 사람이 더 안정적인 결과를 얻습니다.

주체를 고정하고, 행동을 하나로 정하고, 카메라 움직임을 하나 선택하고, 스타일을 시각 요소로 붙이고, 제약조건으로 흔들림을 막아야 한다는 점입니다. 결국 Seedance는 랜덤 생성기가 아니라, 통제 가능한 미니 촬영 현장처럼 다루는 것이 핵심입니다.

반응형