๐Ÿ“‘ Paper/๐Ÿ’Œ Prompt Engineering

A Taxonomy of Prompt Modifiers for Text-To-Image Generation

Gamddalki 2023. 11. 22. 06:33

๋…ผ๋ฌธ์„ ์ฝ๊ธฐ ์ „์—

ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง (Prompt Engineering)์ด๋ž€?

  • ์ƒ์„ฑํ˜• ์ธ๊ณต ์ง€๋Šฅ(์ƒ์„ฑํ˜• AI) ์†”๋ฃจ์…˜์„ ์•ˆ๋‚ดํ•˜์—ฌ ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ํ”„๋กœ์„ธ์Šค
    • ์›ํ•˜๋Š” ๊ฒฐ๊ด๊ฐ’์— ์ตœ๋Œ€ํ•œ ๊ฐ€๊นŒ์›Œ์ง€๋„๋ก ์ž…๋ ฅ์„ ๊ณ„์†ํ•ด์„œ ๋‹ค๋“ฌ๋Š” ๊ณผ์ •
      • ‘์›ํ•˜๋Š”’ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ์ง€์‹œํ•˜๋Š” ์ตœ์ ์˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค๊ณ„
    • AI๊ฐ€ ์‚ฌ์šฉ์ž์™€ ๋” ์˜๋ฏธ ์žˆ๊ฒŒ ์ƒํ˜ธ ์ž‘์šฉํ•˜๋„๋ก ์•ˆ๋‚ดํ•˜๋Š” ๊ฐ€์žฅ ์ ์ ˆํ•œ ํ˜•์‹, ๊ตฌ๋ฌธ, ๋‹จ์–ด ๋ฐ ๊ธฐํ˜ธ๋ฅผ ์„ ํƒ → ์˜ˆ์ƒ๋Œ€๋กœ ์ž‘๋™ํ•˜๋„๋ก ํ•จ
  • ์ƒ์„ฑํ˜• AI: ์Šคํ† ๋ฆฌ, ๋Œ€ํ™”, ๋™์˜์ƒ, ์ด๋ฏธ์ง€, ์Œ์•…๊ณผ ๊ฐ™์€ ์ƒˆ๋กœ์šด ์ฝ˜ํ…์ธ ๋ฅผ ๋งŒ๋“ค์–ด๋‚ด๋Š” ์ธ๊ณต ์ง€๋Šฅ ์†”๋ฃจ์…˜
    • ๋ฐฉ๋Œ€ํ•œ ์–‘์˜ ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์„ ์‚ฌ์šฉํ•˜๋Š” ๊ทœ๋ชจ๊ฐ€ ์•„์ฃผ ํฐ ๊ธฐ๊ณ„ ํ•™์Šต(ML) ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•จ
    • ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ๋งค์šฐ ์œ ์—ฐํ•˜๋ฉฐ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Œ
      • BUT ๋งค์šฐ ๊ฐœ๋ฐฉ์  → ๋ชจ๋“  ์œ ํ˜•์˜ ์ž…๋ ฅ์ด ์œ ์šฉํ•œ ์ถœ๋ ฅ์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ X
        • ์ปจํ…์ŠคํŠธ์™€ ์„ธ๋ถ€ ์ •๋ณด๊ฐ€ ํ•„์š”ํ•จ
    • ex) ๋ฌธ์„œ ์š”์•ฝ, ๋ฌธ์žฅ ์™„์„ฑ, ์งˆ์˜์‘๋‹ต, ๋ฒˆ์—ญ ๋“ฑ → ๊ณผ๊ฑฐ ํ›ˆ๋ จ์„ ๋ฐ”ํƒ•์œผ๋กœ ํŒ๋‹จํ•œ ์ตœ์ƒ์˜ ๊ฒฐ๊ณผ๋ฅผ ์˜ˆ์ธก
  • ํ”„๋กฌํ”„ํŠธ: ํŠน์ • ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ์ƒ์„ฑํ˜• AI์— ์ž…๋ ฅํ•˜๋Š” ์ž์—ฐ์–ด ํ…์ŠคํŠธ
    • AI ๋ชจ๋ธ์ด ํ•™์Šตํ•œ ๋‚ด์šฉ ๊ฐ€์šด๋ฐ ํŠน์ • ๋‚ด์šฉ์„ ํƒ์ƒ‰ํ•˜๋„๋ก ์•ˆ๋‚ดํ•ด ๋ชฉํ‘œ์— ๋งž๋Š” ๊ฒฐ๊ณผ๋ฅผ ์ƒ์„ฑ
    • ๊ตฌ์„ฑ์š”์†Œ
      • ๋ช…๋ น(Instruction): ๋ชจ๋ธ์ด ์ˆ˜ํ–‰ํ•˜๊ธฐ๋ฅผ ์›ํ•˜๋Š” ํŠน์ • ์ž‘์—… ๋˜๋Š” ์ง€์นจ
      • ๋งฅ๋ฝ ์ •๋ณด(Context): ๋ชจ๋ธ์„ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์™ธ๋ถ€ ์ •๋ณด ๋˜๋Š” ์ถ”๊ฐ€ ๋งฅ๋ฝ
      • ์ž…๋ ฅ ๋ฐ์ดํ„ฐ(Input Data): ๋‹ต๋ณ€์„ ์ฐพ๊ณ ์ž ํ•˜๋Š” ์ž…๋ ฅ ๋˜๋Š” ์งˆ๋ฌธ
      • ์ถœ๋ ฅ ๋ฐ์ดํ„ฐ(Output Data): ์ถœ๋ ฅ์˜ ์œ ํ˜• ๋˜๋Š” ํ˜•์‹
    • ํ”„๋กฌํ”„ํŠธ์— ๋ชจ๋“  ๊ตฌ์„ฑ ์š”์†Œ๊ฐ€ ํฌํ•จ๋ผ์•ผ ํ•˜๋Š” ๊ฒƒ์€ X
    • ์ถ”๊ฐ€์ ์œผ๋กœ AI ๋ชจ๋ธ์— ์ „๋‹ฌํ•  ์ง€์‹œ ์‚ฌํ•ญ/์งˆ๋ฌธ, ์ž…๋ ฅ/์˜ˆ์ œ ๊ฐ™์€ ๊ธฐํƒ€ ์„ธ๋ถ€ ์ •๋ณด๋„ ํฌํ•จ๋  ์ˆ˜ ์žˆ์Œ
    • ๊ฒฐ๊ณผ์˜ ํ’ˆ์งˆ์€ ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์–ผ๋งˆ๋‚˜ ๋งŽ์€ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜๊ณ , ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ž˜ ๊ตฌ์„ฑ๋ผ ์žˆ๋Š”์ง€์— ๋”ฐ๋ผ ๋‹ฌ๋ ค์žˆ์Œ

→ ํ…์ŠคํŠธ ์š”์•ฝ, ์ •๋ณด ์ถ”์ถœ, ์งˆ์˜์‘๋‹ต, ํ…์ŠคํŠธ ๋ถ„๋ฅ˜, ์ฝ”๋“œ ์ƒ์„ฑ, ์ถ”๋ก  ๋“ฑ์˜ ์ž‘์—…์—์„œ ์–ธ์–ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒํ•  ์ˆ˜ ์žˆ์Œ

 

ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์ด ์ค‘์š”ํ•œ ์ด์œ 

  • ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด: ์ตœ์ข… ์‚ฌ์šฉ์ž์™€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ ๊ฐ„์˜ ๊ฒฉ์ฐจ๋ฅผ ํ•ด์†Œ
    • ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์ž…๋ ฅ์„ ์‹คํ—˜ํ•˜์—ฌ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ฐœ๋ฐœ์ž๊ฐ€ ๋‹ค์–‘ํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์žฌ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ํ”„๋กฌํ”„ํŠธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ๊ตฌ์ถ•
    • → AI ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ ํšจ์œจ์„ฑ๊ณผ ํšจ๊ณผ๋ฅผ ๋†’์ž„
    • ์ผ๋ฐ˜์ ์œผ๋กœ ๊ฐœ๋ฐฉํ˜• ์‚ฌ์šฉ์ž ์ž…๋ ฅ์„ AI ๋ชจ๋ธ๋กœ ์ „๋‹ฌํ•˜๊ธฐ ์ „์— ํ”„๋กฌํ”„ํŠธ ๋‚ด์— ์บก์Šํ™” ํ•จ
    ex) AI ์ฑ—๋ด‡: ์‚ฌ์šฉ์ž๊ฐ€ *‘์…”์ธ  ๊ตฌ์ž…์ฒ˜’*์™€ ๊ฐ™์€ ๋ถˆ์™„์ „ํ•œ ๋ฌธ์ œ ์„ค๋ช…์„ ์ž…๋ ฅ → ๋‚ด๋ถ€์ ์œผ๋กœ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ์ฝ”๋“œ๊ฐ€ ์—”์ง€๋‹ˆ์–ด๋ง ํ”„๋กฌํ”„ํŠธ ์‚ฌ์šฉ ‘๋‹น์‹ ์€ ์˜๋ฅ˜ ํšŒ์‚ฌ์˜ ์˜์—… ์‚ฌ์›์ž…๋‹ˆ๋‹ค. ๋ฏธ๊ตญ ์•จ๋ผ๋ฐฐ๋งˆ์— ๊ฑฐ์ฃผํ•˜๋Š” ํ•œ ์‚ฌ์šฉ์ž๊ฐ€ ์…”์ธ  ๊ตฌ์ž…์ฒ˜๋ฅผ ๋ฌป์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ ์…”์ธ  ์žฌ๊ณ ๊ฐ€ ์žˆ๋Š” ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๋งค์žฅ ์„ธ ๊ณณ์œผ๋กœ ์‘๋‹ตํ•˜์„ธ์š”.’ → ๋” ์—ฐ๊ด€์„ฑ์ด ๋†’๊ณ  ์ •ํ™•ํ•œ ์ •๋ณด ์ƒ์„ฑ

 

ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์˜ ์ด์ 

  • ๊ฐœ๋ฐœ์ž์˜ ์ œ์–ด ๋Šฅ๋ ฅ ๊ฐ•ํ™”: ์‚ฌ์šฉ์ž์™€ AI์˜ ์ƒํ˜ธ ์ž‘์šฉ์„ ๋ณด๋‹ค ํšจ๊ณผ์ ์œผ๋กœ ์ œ์–ด
    • AI ์˜ค์šฉ, AI๊ฐ€ ์•Œ์ง€ ๋ชปํ•˜๊ฑฐ๋‚˜ ์ •ํ™•ํ•˜๊ฒŒ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์—†๋Š” ์š”์ฒญ ๋ฐฉ์ง€
    • ex) ๋น„์ฆˆ๋‹ˆ์Šค AI ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ ๋ถ€์ ์ ˆํ•œ ์ฝ˜ํ…์ธ ๋ฅผ ์ƒ์„ฑํ•˜์ง€ ๋ชปํ•˜๋„๋ก ์ œํ•œํ•  ์ˆ˜ ์žˆ์Œ
    • → AI๋Š” ์ถœ๋ ฅ์„ ์„ธ๋ถ„ํ™”ํ•˜๊ณ  ํ•„์š”ํ•œ ํ˜•์‹์œผ๋กœ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ํ‘œ์‹œํ•  ์ˆ˜ ์žˆ์Œ
  • ๊ฐœ์„ ๋œ ์‚ฌ์šฉ์ž ๊ฒฝํ—˜: ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ํ”ผํ•˜๋ฉฐ ์ผ๊ด€๋˜๊ณ  ์ •ํ™•ํ•˜๋ฉฐ ์ ์ ˆํ•œ ์‘๋‹ต์„ ์–ป์„ ์ˆ˜ ์žˆ์Œ
    • ์ธ๊ฐ„์˜ ํŽธ๊ฒฌ์œผ๋กœ ์ธํ•ด ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ์กด์žฌํ•  ์ˆ˜ ์žˆ๋Š” ํŽธ๊ฒฌ์„ ์™„ํ™”ํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋จ
    • ์ตœ์†Œํ•œ์˜ ์ž…๋ ฅ์œผ๋กœ๋„ ์‚ฌ์šฉ์ž์˜ ์˜๋„๋ฅผ ์ดํ•ดํ•˜๋„๋ก ํ•จ
    • ex) ๋ฒ•๋ฅ  ๋ฌธ์„œ์™€ ๋‰ด์Šค ๊ธฐ์‚ฌ๋ฅผ ์š”์•ฝํ•ด ๋‹ฌ๋ผ๋Š” ์š”์ฒญ → ์Šคํƒ€์ผ๊ณผ ์–ด์กฐ์— ๋”ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ€ ์กฐ์ •
  • ์œ ์—ฐ์„ฑ ํ–ฅ์ƒ: ๋…ผ๋ฆฌ์  ์—ฐ๊ฒฐ๊ณผ ๊ด‘๋ฒ”์œ„ํ•œ ํŒจํ„ด์„ ๊ฐ•์กฐํ•˜๋Š” ๋„๋ฉ”์ธ ์ค‘๋ฆฝ์  ์ง€์นจ์„ ํฌํ•จํ•˜๋Š” ํ”„๋กฌํ”„ํŠธ ์ œ์ž‘ → ๊ฐ„๋‹จํ•˜๊ฒŒ ์žฌ์‚ฌ์šฉ ๊ฐ€๋Šฅ
    • ์ถ”์ƒํ™” ์ˆ˜์ค€์ด ๋†’์„์ˆ˜๋ก AI ๋ชจ๋ธ์ด ๊ฐœ์„ ๋˜๊ณ , ์กฐ์ง์ด ๋ณด๋‹ค ์œ ์—ฐํ•œ ๋„๊ตฌ๋ฅผ ๋Œ€๊ทœ๋ชจ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Œ
    • ex) ํ”„๋กœ์„ธ์Šค ์ตœ์ ํ™”๋ฅผ ์œ„ํ•œ ๊ธฐํšŒ๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด ์ƒํ™ฉ๋ณ„ ๋ฐ์ดํ„ฐ ๋Œ€์‹  ๊ด‘๋ฒ”์œ„ํ•œ ์‹ ํ˜ธ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋น„ํšจ์œจ์„ฑ์„ ์ฐพ๋„๋ก AI ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋Š” ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Œ → ๋‹ค์–‘ํ•œ ํ”„๋กœ์„ธ์Šค์™€ ์‚ฌ์—…๋ถ€์— ์‚ฌ์šฉ ๊ฐ€๋Šฅ

 

A Taxonomy of Prompt Modifiers for Text-To-Image Generation (2023)

 

ABSTRACT

  • ํ”„๋กฌํ”„ํŠธ ์ˆ˜์‹์–ด์˜ 6๊ฐ€์ง€ ์œ ํ˜•์„ ๊ตฌ๋ถ„ํ•จ
    • subject terms, image prompts, style modifiers, quality boosters, repeating terms, and magic terms
    • → ์˜จ๋ผ์ธ ์ปค๋ฎค๋‹ˆํ‹ฐ์˜ ์‹ค๋ฌด์ž๋“ค์„ ๋Œ€์ƒ์œผ๋กœ 3๊ฐœ์›” ๊ฐ„์˜ ๋ฏผ์กฑ์ง€ํ•™์  ์—ฐ๊ตฌ๋ฅผ ์ง„ํ–‰ํ•˜์˜€์Œ

Example of iterative prompt engineering for generating an image

 

TAXONOMY OF PROMPT MODIFIERS

Subject terms (์ฃผ์ œ์–ด)

  • ์›ํ•˜๋Š” ์ด๋ฏธ์ง€์˜ ์ฃผ์ œ
  • ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๊ณผ์ •์˜ control์„ ์œ„ํ•ด ํ•„์ˆ˜์ ์ž„
    • ex) “a landscape”, “an old car in a meadow”
  • BUT Text-to-Image ์‹œ์Šคํ…œ์ด ํŠน์ • ํ…์ŠคํŠธ์— ๋Œ€ํ•œ ์—ฐ๊ด€ ์ด๋ฏธ์ง€ ํ›ˆ๋ จ์ด ๋œ ๋˜์–ด ์žˆ๋Š” ๊ฒฝ์šฐ subject terms์ด ๊ฒฐ๊ณผ๋ฌผ์— ์ž˜ ๋ฐ˜์˜๋˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Œ

 

Style modifiers (์Šคํƒ€์ผ)

  • ํŠน์ • ์Šคํƒ€์ผ์˜ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ํ”„๋กฌํ”„ํŠธ์— ์ถ”๊ฐ€๋  ์ˆ˜ ์žˆ์Œ
  • ๋ฏธ์ˆ  ์‹œ๋Œ€, ํ•™ํŒŒ, ์Šคํƒ€์ผ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋ฏธ์ˆ  ์žฌ๋ฃŒ, ๋งค์ฒด, ๊ธฐ๋ฒ•, ์ž‘๊ฐ€์™€ ๊ด€๋ จํ•œ ์ •๋ณด๋ฅผ ๋„ฃ์„ ์ˆ˜ ์žˆ์Œ
    • ex) “by Francisco Goya”: ์ŠคํŽ˜์ธ ๋ฏธ์ˆ ๊ฐ€์ธ ํ”„๋ž€์‹œ์Šค์ฝ” ๊ณ ์•ผ์˜ ์Šคํƒ€์ผ๋กœ ์ด๋ฏธ์ง€ ์ƒ์„ฑ

 

Image prompts (์ด๋ฏธ์ง€ ํ”„๋กฌํ”„ํŠธ)

  • ์ฃผ์ œ์™€ ์Šคํƒ€์ผ์— ๊ด€ํ•œ (visual) target์„ ์ œ๊ณตํ•จ
  • ์ด๋ฏธ์ง€๋ฅผ ํ”„๋กฌํ”„ํŠธ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›๋Š” ๊ฒƒ
    • ํ•˜๋‚˜ ๋˜๋Š” ์—ฌ๋Ÿฌ ๊ฐœ์˜ URL๋กœ ํ…์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ์— ์ถ”๊ฐ€๋จ
    • ๋ณ„๋„์˜ ๋ฐฐ์—ด๋กœ ์ถ”๊ฐ€๋จ
  • initial images์™€๋Š” ๋‹ค๋ฅธ ๊ฐœ๋…์ž„
    • image prompt: ์—ฌ๋Ÿฌ ์žฅ์˜ ์ด๋ฏธ์ง€๋ฅผ ํฌํ•จํ•  ์ˆ˜ ์žˆ์Œ
    • initial image: ์ด๋ฏธ์ง€ ์ƒ์„ฑ์˜ ์‹œ์ž‘์ , ํ•˜๋‚˜์—ฌ์•ผ ํ•จ
      • ex) for the purpose of enhancing or distorting the initial image

 

Quality boosters (ํ€„๋ฆฌํ‹ฐ ๋ถ€์Šคํ„ฐ)

  • ์ด๋ฏธ์ง€์˜ ๋ฏธ์  ํ’ˆ์งˆ๊ณผ level of detail์„ ๋†’์ด๋Š”๋ฐ ์‚ฌ์šฉ
  • ๋Œ€ํ‘œ์ ์ธ ์šฉ์–ด: “trending on artstation,” “award-winning,” “masterpiece,” “highly detailed”, “awesome,” “#wow,” “epic,”, “rendered in Unreal Engine.”
    • ex) “painting of an exploding heart” → “highly detailed, eclectic, fiery, vfx, rendered in octane, postprocessing, 8k.”
  • “extra fluff”์˜ ํ˜•ํƒœ๋กœ ํ”„๋กฌํ”„ํŠธ์— ์ถ”๊ฐ€๋  ์ˆ˜ ์žˆ์Œ
  • BUT ์ƒ์„ฑ๋˜๋Š” ์ด๋ฏธ์ง€์˜ ๋””ํ…Œ์ผ๊ณผ ์ „๋ฐ˜์ ์ธ ํ€„๋ฆฌํ‹ฐ๋Š” ํ–ฅ์ƒํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, subject์˜ ๋ฐ˜์˜๋„๊ฐ€ ๋‚ฎ์•„์งˆ ์ˆ˜ ์žˆ์Œ

 

Repeating terms (์šฉ์–ด ๋ฐ˜๋ณต)

  • ์„œ๋กœ ๋‹ค๋ฅธ phrasing๊ณผ synonyms์„ ์‚ฌ์šฉํ•จ

  • ex) “space whale. a whale in space”
  • ์ƒ์„ฑ ์‹œ์Šคํ…œ์ด ํ˜•์„ฑํ•œ assciations๋ฅผ ๊ฐ•ํ™”ํ•  ์ˆ˜ ์žˆ์Œ
  • ๋ฐ˜๋ณต๋˜๋Š” ์šฉ์–ด๋Š” ๋ชจ๋ธ๋“ค์ด positive feedback loops์— ๊ฐ‡ํžˆ๋„๋ก ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๋Š” ๊ธฐ์ˆ ์  ์„ค๋ช…์ด ๊ฐ€๋Šฅ

 

Magic terms (๋งˆ๋ฒ• ์šฉ์–ด)

  • ์ด๋ฏธ์ง€์˜ ๋žœ๋ค์„ฑ์„ ๊ฐ•ํ™”ํ•จ
  • ex) “orchestra conductor leading a chorus of sound wave audio waveforms swirling around him on the orchestral stage”์— “control the soul”์„ ์ถ”๊ฐ€ํ•จ
  • ๋”์šฑ ๋‹ค์–‘ํ•œ ๊ฒฐ๊ณผ๋ฌผ์„ ์–ป๊ณ ์ž ํ•˜๋Š” ์˜๋„์—์„œ ์‚ฌ์šฉ๋จ
    • ํ”„๋กฌํ”„ํŠธ์˜ main subject์™€ semantically ๊ฑฐ๋ฆฌ๊ฐ€ ์žˆ๋Š” ์šฉ์–ด์ผ ์ˆ˜ ์žˆ์Œ
    • non-visual qualities์ผ ์ˆ˜ ์žˆ์Œ
      • ์ด‰๊ฐ (somatosensory), ์ฒญ๊ฐ (auditory), ํ›„๊ฐ (olfactory), ๋ฏธ๊ฐ (gustatory) ๋“ฑ
        • ex) “feed the soul”, “feel the sound”

 

→ ์œ„ ์šฉ์–ด๋“ค์€ ํ•ด์‹œํƒœ๊ทธ์˜ ํ˜•ํƒœ (ex. “#wow”), attribution phrases (ex. “by [artist]”)์˜ ํ˜•ํƒœ, ์ข€ ๋” ๋ณต์žกํ•œ composite statements (e.g., “in the style of [artist]”)์˜ ํ˜•ํƒœ๋กœ ํ”„๋กฌํ”„ํŠธ์— ๋ฐ˜์˜๋  ์ˆ˜ ์žˆ์Œ

 

CONCLUSION

  • ํ”„๋กฌํ”„ํŠธ ์ˆ˜์‹์–ด์˜ ์œ ํ˜•์„ ๊ตฌ๋ถ„ํ•จ ํ†ตํ•ด ๊ตฌ์กฐํ™”๋œ ํ”„๋กฌํ”„ํŠธ ์ž‘์„ฑ์— ๋„์›€์ด ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, Gen AI์˜ ๊ณ ์œ ํ•œ ํ–‰๋™์œ ๋„์„ฑ์„ ๊ฐ•์กฐํ•ด ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์„ ๋ณด๋‹ค ๋ช…ํ™•ํ•˜๊ฒŒ ์ดํ•ดํ•˜๊ฒŒ ํ•จ

 

 

์ฐธ๊ณ 

์ƒ์„ฑํ˜• AI ๋ชจ๋ธ๊ณผ ๋Œ€ํ™”ํ•˜๋Š” ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง(Prompt Engineering)
์ƒ์„ฑํ˜• AI๋ž€ ๋ฌด์—‡์ธ๊ฐ€์š”?
ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€์š”?
๋‹น์žฅ ์จ๋จน์„ ์ˆ˜ ์žˆ๋Š” Text to Image AI ํ™œ์šฉ๋ฒ• #1

 

 

'๐Ÿ“‘ Paper > ๐Ÿ’Œ Prompt Engineering' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

RePrompt: Automatic Prompt Editing to Refine AI-Generative Art Towards Precise Expressions  (2) 2023.11.22