Affective Image Classification using Features Inspired by Psychology and Art Theory (2010)
ABSTRACT
- ์ด๋ฏธ์ง๋ ๊ฐ์ ์ ์ธ ์์ค์์ ์ฌ๋๋ค์๊ฒ ์ํฅ์ ๋ฏธ์น ์ ์์
- ๊ทธ๋ฌ๋ ์ด๋ฏธ์ง๋ฅผ ๋ณด๋ ์ฌ๋์๊ฒ ๋ฐ์ํ๋ ๊ฐ์ ์ ๋งค์ฐ ์ฃผ๊ด์ ์ด๊ธฐ ๋๋ฌธ์ ์ธ๋ฑ์ค๊ฐ ํ์ฑ๋๋ ๊ฒฝ์ฐ๋ ๊ฑฐ์ ์์
- BUT ๊ฐ์ ์ ์ธ ๋ด์ฉ์ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฏธ์ง๋ฅผ ๊ฒ์ํ ์ ์๋ค๋ฉด ๋์์ด ๋ ์ ์๋ ์ํฉ์ด ์์
- ๊ทธ๋ฌ๋ ์ด๋ฏธ์ง๋ฅผ ๋ณด๋ ์ฌ๋์๊ฒ ๋ฐ์ํ๋ ๊ฐ์ ์ ๋งค์ฐ ์ฃผ๊ด์ ์ด๊ธฐ ๋๋ฌธ์ ์ธ๋ฑ์ค๊ฐ ํ์ฑ๋๋ ๊ฒฝ์ฐ๋ ๊ฑฐ์ ์์
- ํด๋น ๋
ผ๋ฌธ์ ์ด๋ฏธ์ง์ ๊ฐ์ ์ ์ธ ๋ด์ฉ์ ๋ํ๋ด๋ low level feature๋ฅผ ์ถ์ถํ๊ณ ๊ฒฐํฉํ๋ ๋ฐฉ๋ฒ์ ์กฐ์ฌํ๊ณ ๊ฐ๋ฐํ์ฌ ์ด๋ฏธ์ง ๊ฐ์ ๋ถ๋ฅ์ ์ฌ์ฉํจ
- ์ฌ๋ฆฌํ๊ณผ ์์ ์ด๋ก ์ ์ด๋ก ์ ์ด๊ณ ๊ฒฝํ์ ์ธ ๊ฐ๋ ์ ํ์ฉํ์ฌ ๊ฐ์ ์ ์ธ ํํ์ผ๋ก ์์ ์ํ ์์ญ์ ๊ณ ์ ํ ์ด๋ฏธ์ง ํน์ง์ ์ถ์ถํจ
- → IAPS์์ SOTA์ ๋น๊ตํ์ฌ ํฅ์๋ ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ฅผ ์ป์
SYSTEM FLOW OF THE FRAMEWORK
1. image ๋ฐ์ดํฐ ์ 3์ข ์ด์ฉ
- IAPS(International Affective Picture System) (394๊ฐ)
- Artistic Photography ๊ณต์ ์ฌ์ดํธ ํฌ๋กค๋ง (807๊ฐ)
- using the emotion categories as search terms in the art sharing site
- These photos are taken by people who attempt to evoke a certain emotion in the viewer
- ์๊ฐ๊ฐ ํ์ํ ์์๊ณผ ์ง๊ฐ์ ์์์ ์ผ๋ก ์ฌ์ฉํ๋ฉด ๋ถ๋ฅ๊ฐ ๊ฐ์ ๋๋์ง ์ฌ๋ถ๋ฅผ ์กฐ์ฌํ๊ธฐ ์ํด ์ฌ์ฉ
- using the emotion categories as search terms in the art sharing site
- Abstract Painting (228๊ฐ)
- ํน์ ๋ฌผ์ฒด, ์ฌ๋ณผ ๋ฑ์ด ์ ๋ฐํ๋ ๊ฐ์ ์ ๋ฐฐ์ ํ๊ณ ๋งฅ๋ฝ์ ์ธ ๋ด์ฉ์ด ์๋ ์ํ์์ ์ด๋ฏธ์ง์ ํน์ง๋ง์ ๋ณด๊ธฐ ์ํด ์ฌ์ฉ
2. Preprocessing ์งํ ํ segmentation
⇒ segmentation result + original image: input to the feature extraction process
Preprocessing
- resize image into 200,000 pixels
- crop borders
- conversion from RGB to HSV
- intuitive definition of colors by defining a well separated Hue (H), Saturation (S) and Brightness (Y) channel
Segmentation
- Waterfall segmentation ์ด์ฉ
- takes both color and spatial information into account
- ⇒ results in an image separated into contiguous regions
3. FEATURE extraction: get the feature vector (low level feature ์ด์ฉ)
FEATURES
- based on the experimentally-determined relation between ์์ ์ฑ๋, ๋ฐ๊ธฐ, ๊ทธ๋ฆฌ๊ณ ๊ฐ์ ์ dimensions [26], as well as features based on relations between ์์ ํผํฉ๊ณผ induced emotional effects from art theory [15].
- We complement these features by a selection of features, some of which are shown to be of use in similar image retrieval [24] and classification tasks [7, 32]
1) Color
- low-level color features๋ฅผ ๊ฐ์ ๊ณผ ๋งคํํ๋ ๊ฒ์ ๋งค์ฐ ์ด๋ ค์ด ์ผ์
- ์์ ์ฌ์ฉ์ ๋ํ ์ด๋ก ๊ณผ ์ธ์ง ๋ชจ๋ธ์ ๊ณ ๋ คํด์ผ ํ๋ฉฐ ๋ฌธํ์ , ์ธ๋ฅํ์ ๋ฐฐ๊ฒฝ์ ํฌํจํด์ผ ํจ [15, 5]
- ๋ค๋ฅธ ๋ฌธํ๋ ๋ฐฐ๊ฒฝ์ ๊ฐ์ง ์ฌ๋๋ค์ ๋์ผํ ์์ ํจํด์ ์๋นํ ๋ค๋ฅด๊ฒ ์ธ์ํ๊ณ ํด์ํ ์ ์์ (= ์ฐ๋ฆฌ์ ํ๊ณ์ ๋ํ ๋ ์ ์์ ๋ฏ)
- ์์ฑ์ ์์ฑ ์กฐํฉ์ emotional impact๋ ์์ ๊ฐ[15], ์ฌ๋ฆฌํ[26], ์์ฑ ๊ณผํ์[23] ๋ฐ ๋ง์ผํ ์์ด์ ํธ์ ๊ด์ ์์ ์กฐ์ฌ๋์์
- ์์ ์ฌ์ฉ์ ๋ํ ์ด๋ก ๊ณผ ์ธ์ง ๋ชจ๋ธ์ ๊ณ ๋ คํด์ผ ํ๋ฉฐ ๋ฌธํ์ , ์ธ๋ฅํ์ ๋ฐฐ๊ฒฝ์ ํฌํจํด์ผ ํจ [15, 5]
- ์์ ์ธก์ ์ ์ํด implemented ๋ features:
- Saturation and Brightness statistics (์ฑ๋์ ๋ฐ๊ธฐ)
- ์ง์ ์ ์ธ ์ํฅ์ ์ค ์ ์์ on pleasure, arousal and dominance, the three axes of the emotion space according to the dimensional approach to emotions [22].
- formulae determined by Valdez and Mehrabian from their ์ฌ๋ฆฌํ์ ์คํ [26].
- The experiments were conducted in a controlled environment, where 250 people were shown series of single color patches and rated them on a standardized emotional scale (Pleasure-Arousal-Dominance) to describe how they feel about the color.
- The resulting equations:
- Pleasure = 0.69 Y +0.22 S (1)
- Arousal = −0.31 Y +0.60 S (2)
- Dominance = 0.76 Y +0.32 S (3)
- Hue statistics (์์)
- tone of the image๋ฅผ ๊ฒฐ์
- ๊ทธ๋ฌ๋ hue๋ circular way (in degrees)๋ก ์ธก์ ๋จ
- vector-based, circular statistics [20] must be used to compute measurements like mean, hue spread, etc.
- Colorfulness
- measured by Earth Mover’s Distance (EMD) between the histogram of an image and the histogram having a uniform color distribution, according to an algorithm suggested by Datta [7].
- Color Names
- each color has a special meaning and is used in certain ways by artists
- 11๊ฐ์ง ๊ธฐ๋ณธ ์์์ ๋ํด ์ฌ์ฉ๋ ํฝ์ ์๋ฅผ ๊ณ์ฐํจ (black, blue, brown, green, gray, orange, pink, purple, red, white, yellow) are present on the image using the algorithm of van de Weijer et al. [27].
- each color has a special meaning and is used in certain ways by artists
- Itten contrasts [15]
- a powerful concept in art theory
- viewer์๊ฒ ๊ฐ์ ์ ์ธ ํจ๊ณผ๋ฅผ ์ ๋ํ๊ณ ์กฐํ๋ก์ด ์ด๋ฏธ์ง๋ฅผ ์ป๊ธฐ ์ํด ์์ ์กฐํฉํ๊ธฐ ์ํ ๊ณต์ํ๋ ๊ฐ๋
- hue, saturation and luminance(์์, ์ฑ๋, ํ๋)์ ๋ฐ๋ผ ์์์ characterizeํจ
- 12๊ฐ ์์์ด ๊ธฐ๋ณธ ์ปฌ๋ฌ๋ก identified
- 5 ๋ ๋ฒจ์ ํ๋์ 3 ๋ ๋ฒจ์ ์ฑ๋๋ก varied
- 12๊ฐ์ pure colors๊ฐ equatorial circle์ ๋ฐ๋ผ ๋ฐฐ์ด, luminance ํ๋๋ meridians์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ฉฐ, radius๊ฐ ์ปค์ง์ ๋ฐ๋ผ saturation์ด ์ฆ๊ฐ
- The center of the sphere is neutral gray, ๋์กฐ์ ์ธ ์์์ ์๋ก ๋ฐ๋ํธ์ ์์นํจ
- Warm colors lie opposite cold colors, dark colors opposite light colors, etc.
- ์ฐธ๊ณ
- 12๊ฐ ์์์ด ๊ธฐ๋ณธ ์ปฌ๋ฌ๋ก identified
- ์ด polar representation์ ๋ฐํ์ผ๋ก, Itten์ 7๊ฐ์ง ํ์
์ contrast๋ฅผ identified
- contrast of saturation, contrast of light and dark, contrast of extension, contrast of complements, contrast of hue, contrast of warm and cold and the simultaneous contrast.
- ์ฐธ๊ณ
- contrast of saturation, contrast of light and dark, contrast of extension, contrast of complements, contrast of hue, contrast of warm and cold and the simultaneous contrast.
- ๋ํ formalized color combinations that look harmonious: the color accordances (์์ ์กฐํ)
- ์ด๋ฅผ mathematical formulae๋ก ๋ํ๋
- partly based on the work in [6].
- transform the image into a simpler collection of colored patches
- waterfall segmentation์ ๊ฒฐ๊ณผ๋ก ์ป์ region๊ณผ ๊ฐ๊ฐ์ average Hue, Saturation and Brightness ๊ณ์ฐ ๊ฒฐ๊ณผ๋ฅผ ์ด์ฉ
- translate the region’s average values into the Itten color model [15]
- → ๊ฐ region์ด e.g. “dark”, with “low saturation” and “green hue”์ ๊ฐ์ด ํํ๋จ
- ๋ชจ๋ธ์ ์ฑ๋์ ๋ฐ๊ธฐ๋ fuzzy membership functions defined in [32]๋ฅผ ์ด์ฉํด encoded๋จ
- ์ถ๊ฐ๋ก ๊ฐ ์์ญ(has Itten color and a size)์ ๋ํด Itten contrasts๋ฅผ ๋ถ์ํจ
- ๋ช ์์ ๋์กฐ ์ธก์ : ์๋์ ํฌ๊ธฐ์ ๋ฐ๋ผ ๊ฐ์ค์น๊ฐ ๋ถ์ฌ๋ ๋ชจ๋ ์์ญ์ Brightness membership functions์ ๋ํ ํ์ค ํธ์ฐจ ๋ฐ ์๋ ๋ก๊ทธ ๋ฐฉ์์ผ๋ก ํฌํ๋์ ๋๋น๋ฅผ ์ ์
- ์์์ ๋์กฐ ์ธก์ : ๋ฒกํฐ ๊ธฐ๋ฐ์ measurement of the hue spread
- complements์ ๋์กฐ ์ธก์ : ๋ถํ ๋ ์์ญ ์ฌ์ด์ ์์ ์ฐจ์ด๋ฅผ ๊ณ์ฐ
- hue-wheel problem์ ๊ณ ๋ คํด์ผ ํ๋ฏ๋ก, hue difference measure (์์ฐจ ์ธก๋, where hi is the representative (mean) hue of the region i)๋ก d = min(|hi − hj |, 360 − |hi − hj |) ๋ฅผ ์ฌ์ฉํจ
- ๋ง์ฝ contrast of complements๊ฐ ์๋ค๋ฉด ๊ฐ์ 180โฆ์ ๊ฐ๊น์
- hue-wheel problem์ ๊ณ ๋ คํด์ผ ํ๋ฏ๋ก, hue difference measure (์์ฐจ ์ธก๋, where hi is the representative (mean) hue of the region i)๋ก d = min(|hi − hj |, 360 − |hi − hj |) ๋ฅผ ์ฌ์ฉํจ
- ์์ฟจ์ ๋์กฐ ์ธก์ : [6]์์ ์ ์
- ๊ฐ ์์ญ์๋ ri ์์ญ์ ์ถ์(t = 1), ์ค๋ฆฝ(t = 2) ๋ฐ ๋ฐ๋ปํ(t = 3) ์ ๋๋ฅผ ๋ํ๋ด๋ three membership functions wt๊ฐ ํ ๋น
- warm-cold contrast between two regions is defined as:
- total amount of warm and cold area in the image ๋ํ ๊ณ์ฐํจ
- simultaneous contrast: absence of contrast of complements์
- complementary contrast๊ฐ์ด ๋ฎ์ ๊ฒ๊ณผ ๊ฐ์
- contrast of extension: ์ํ์ ์ผ๋ก ๊ณต์ํ ๋๊ธฐ ์ด๋ ค์ ๊ณ์ฐํ์ง ์์
- Harmony: ์ฌ๋์ ๋์ ์์ ๊ฐ์ ์ฃผ๋ ์์๊ณผ ํค์ ์กฐํฉ
- the combination of those colors whose mix is gray๋ก ์ ์๋๋ ๊ฐ๊ด์ ์ธ ๊ฐ๋ ์
- spherical model์ ์ ์ฉ๋ color accordances ๋ ๊ตฌ๋ฉด ์ ์์น๋ฅผ ์ ์ผ๋ก ์ฐ๊ฒฐํ์ ๋ ์ ๋ค๊ฐํ์ ์์ฑํ๋ ์์ ์กฐํฉ์
- ๊ณ์ฐ ๋ฐฉ๋ฒ
- ์ด๋ฏธ์ง๋ก๋ถํฐ 12๊ฐ ์ฃผ์ ์์์ ๊ฐ์ง hue histogram์ ์์ฑํจ (5% ๋ฏธ๋ง์ธ bin์ ๋ฌด์)
- ์ฃผ๋ก 3–4๊ฐ์ ์ฃผ์ ์์์ด ๋ฐ๊ฒฌ๋จ
- ์ ์ฃผ์ ์์์ Itten color wheel๊ณผ mappingํ๊ณ , ์ด๋ค์ ์์น๋ฅผ ์ฐ๊ฒฐํด ๋ค๊ฐํ ์์ฑ
- ์์ฑ๋ ๋ค๊ฐํ์ ๋ด๊ฐ๊ณผ ๋์ผํ ์์ ์ ์ ์ ๊ฐ์ง ๊ฐ์์ ์ ๋ค๊ฐํ์ ๋ด๊ฐ์ ์ฐจ์ด๋ก ์ธก์
- ์ด๋ฏธ์ง๋ก๋ถํฐ 12๊ฐ ์ฃผ์ ์์์ ๊ฐ์ง hue histogram์ ์์ฑํจ (5% ๋ฏธ๋ง์ธ bin์ ๋ฌด์)
- transform the image into a simpler collection of colored patches
- partly based on the work in [6].
- Saturation and Brightness statistics (์ฑ๋์ ๋ฐ๊ธฐ)
- Color features by Wang Wei-ning et al. [32]
- ์์์ ๊ฐ์ ์ ์ํฅ์ ์ด๋ฏธ์ง๋ก ํํํ ์ ์๋๋ก ์ค๊ณ๋ ์ ๋ฌธ ํ์คํ ๊ทธ๋จ
2) Texture
- ์ ๋ฌธ ์ฌ์ง์๊ฐ๋ค๊ณผ ์์ ๊ฐ๋ค์ ๋ณดํต ์ ๋ช
ํ ์ฌ์ง, ํน์ ์์ํฌ์ปค์ฑ(the main object is sharp with a blurred background) ๋ ์ฌ์ง์ ๋ง๋ฆ
- ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๋ ์ฌ์ง ์ ๋ธ๋ฌ ์ฒ๋ฆฌ๊ฐ desired expression์ achieveํ๋ ๋ฐ์๋ ํจ์จ์ ์ผ๋ก ์ฌ์ฉ๋ ์ ์์์ ๋ฐ๊ฒฌํจ
- ์๋์ ์ผ๋ก blur๋ ์ด๋ฏธ์ง๋ fear๋ฅผ ๋ํ๋ด๋ art photography images์์ ์์ฃผ ํ์ฉ๋์์
- ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๋ ์ฌ์ง ์ ๋ธ๋ฌ ์ฒ๋ฆฌ๊ฐ desired expression์ achieveํ๋ ๋ฐ์๋ ํจ์จ์ ์ผ๋ก ์ฌ์ฉ๋ ์ ์์์ ๋ฐ๊ฒฌํจ
- Wavelet-based features
- to measure spatial smoothness/graininess in images
- using the Daubechies wavelet transform [8]
- [7]์์ ์ ์๋ three-level wavelet transform on all three color channels (Hue H, Saturation S and Brightness Y)๋ฅผ ์ด์ฉํจ
- ์์์ ํ ์ฑ๋์ wavelet transform์ ๋ํ ์์ค i์ ๊ณ์๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ํ์ํ ๋:
- the wavelet features (where i = {1, 2, 3}) are:
- ๋ชจ๋ ๋ ๋ฒจ i์ ๋ชจ๋ ์ฑ๋(H, S, Y)์ ๋ํด ๊ณ์ฐ๋จ
- ์ฆ, 9๊ฐ์ wavelet features๋ฅผ ์ป๊ฒ ๋จ
- sum over all three levels๋ฅผ ๊ฐ ์ฑ๋๋ง๋ค ์ถ๊ฐํจ (์ด 3๊ฐ)
- ๋ชจ๋ ๋ ๋ฒจ i์ ๋ชจ๋ ์ฑ๋(H, S, Y)์ ๋ํด ๊ณ์ฐ๋จ
- the wavelet features (where i = {1, 2, 3}) are:
- ์์์ ํ ์ฑ๋์ wavelet transform์ ๋ํ ์์ค i์ ๊ณ์๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ํ์ํ ๋:
- to measure spatial smoothness/graininess in images
- Tamura [25]
- affective image retrieval [33]์์ ํจ๊ณผ์ ์ผ๋ก ์ฌ์ฉ๋์์
- coarseness, contrast and directionality
- ⇒ ๋ฐ๋ผ์ Tamura texture features ์ค ์์์ 3๊ฐ๋ฅผ ์ฌ์ฉํ๊ธฐ๋ก ํจ:
- affective image retrieval [33]์์ ํจ๊ณผ์ ์ผ๋ก ์ฌ์ฉ๋์์
- Gray-Level Co-occurrence Matrix (GLCM) [13]
- ์ง๊ฐ์ ์ธก์ ํ๋ ๋ ํ๋์ ๊ณ ์ ์ ์ธ ๋ฐฉ๋ฒ์
- ⇒ compute contrast, correlation, energy, and homogeneity of an image
3) Composition
- ์ด๋ฏธ์ง part ๊ฐ์ ๊ด๊ณ๋ ๊ต์ฅํ ๋ณต์กํ๋ฏ๋ก only few aspects of composition๋ง analyzeํ์
- ๊ทธ๋ฌ๋ ์ด ๋ถ์ผ๋ ์์ผ๋ก much improvement could be made
- Level of Detail
- detail์ด ๋ง์ ์ด๋ฏธ์ง๋ ์ผ๋ฐ์ ์ผ๋ก ๋ฏธ๋๋ฉ๋ฆฌ์คํธ ๊ตฌ์ฑ๊ณผ ๋ค๋ฅธ ์ฌ๋ฆฌ์ ํจ๊ณผ๋ฅผ ๋
- ์ด๋ฏธ์ง์ detail ์์ค์ ์ธก์ ํ๊ธฐ ์ํด predefined Alternating Sequential Filter size(ํํฐ ํฌ๊ธฐ 3 ๋ฐ ํญํฌ ๊ณ์ธต์ ์์ค 2)๋ก waterfall segmentatione๋ ์์ญ์ ๊ฐ์๋ฅผ countํจ
- simple images: low, busy or cluttered images: high
- Low Depth of Field (DOF)
- ์ ๋ฌธ ์ฌ์ง์๊ฐ๊ฐ ๋ฐฐ๊ฒฝ์ ๋ธ๋ฌ ์ฒ๋ฆฌํ์ฌ reducing the “busyness”ํ๊ณ attention of the observer๋ฅผ object of interest๋ก ์ง์ค๋๊ฒ๋ ํ๋ ๋ฐ์ ์ฌ์ฉ๋จ (์์ํฌ์ปค์ฑ)
- [7]์์ ์ ์ฒด ์ด๋ฏธ์ง์ ๋ํ ์ด๋ฏธ์ง์ ๋ด๋ถ ๋ถ๋ถ์ ๊ณ ์ฃผํ์(์ 4์ ํ๊ธฐ์ ์ฌ์ฉ๋ ๋ ๋ฒจ 3)์ ์จ์ด๋ธ๋ฆฟ ๊ณ์์ ๋น์จ์ ๊ณ์ฐํ์ฌ low DOF ๋ฐ macro image๋ฅผ ๊ฒ์ถํ๋ ๋ฐฉ๋ฒ์ด ์ ์๋จ
- Dynamics
- ์ ํ ์ฐ๊ตฌ์ ๋ฐ๋ฅด๋ฉด ์ ๋ค์ emotional effects [15, 2]๋ฅผ ์ ๋ฐํจ
- Horizontal lines(์ํ์ ): associated with a static horizon(์ ์ ์ธ ์งํ์ ) and communicate calmness, peacefulness and relaxation
- vertical lines(์์ง์ ): clear and direct and communicate dignity and eternity
- slant lines(๊ธฐ์ธ์ด์ง ์ ): unstable and communicate dynamism
- Lines with many different directions: chaos, confusion or action
- ์ ์ด ๊ธธ๊ณ ๊ตต์ผ๋ฉฐ ์ง๋ฐฐ์ ์ผ์๋ก induced psychological effect๊ฐ ๊ฐํจ
- Hough transform์ ํตํด significant line slopes๋ฅผ detectํจ
- ๋ฐ๊ฒฌ๋ ์ ์ ๊ธฐ์ธ๊ธฐ ๊ฐ๋ θ์ ๋ฐ๋ผ static (horizontal and vertical) or slant๋ก ๋ถ๋ฅ๋๊ณ , ๊ฐ๊ฐ์ ๊ธธ์ด๋ก ๊ฐ์ค์น๊ฐ ๋ถ์ฌ๋จ
- (-15 โฆ < θ < โฆ < โฆ>) ๋๋ (75 โฆ < θ < 105 โฆ)์ด๋ฉด ์ ์ , ๊ทธ๋ ์ง ์์ผ๋ฉด ๊ธฐ์ธ๊ธฐ
- ๋ฐ๊ฒฌ๋ ์ ์ ๊ธฐ์ธ๊ธฐ ๊ฐ๋ θ์ ๋ฐ๋ผ static (horizontal and vertical) or slant๋ก ๋ถ๋ฅ๋๊ณ , ๊ฐ๊ฐ์ ๊ธธ์ด๋ก ๊ฐ์ค์น๊ฐ ๋ถ์ฌ๋จ
- ์ ํ ์ฐ๊ตฌ์ ๋ฐ๋ฅด๋ฉด ์ ๋ค์ emotional effects [15, 2]๋ฅผ ์ ๋ฐํจ
- Rule of Thirds
- main object๋ ๋ด๋ถ ์ง์ฌ๊ฐํ์ ์์ชฝ ํน์ ์ฃผ๋ณ์ ๋์ฌ ์์
- ⇒ ๋ฐ๋ผ์ ์ฐ๋ฆฌ๋ ๋ด๋ถ ์ง์ฌ๊ฐํ์ ๋ํ color statistics๋ฅผ ์ธก์ ํ์์
4) Content
- ์ด๋ฏธ์ง์ semantic content๋ ์ด๋ค ๊ทธ๋ฆผ์ emotional influence์ ๊ฐ์ฅ ํฐ ์ํฅ์ ๋ฏธ์นจ
- induced two algorithms
- Human Faces
- strongly draw the attention of human observers
- ํ์ ์ distinguish the moods of a picture๋ฅผ ์ํด ๋งค์ฐ ์ค์ํ๋, ์ด๋ฏธ์ง์์ ์ฌ๋์ ํ์ ์ ์ธ์ํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์์ง ์๋ฒฝํ์ง ์์
- ๋ฐ๋ผ์ (ํ์ํธํ์ผ๋ก) ์ผ๊ตด ๊ฐ์ง ์๊ณ ๋ฆฌ์ฆ by Viola and Jones [28]์ ์ฌ์ฉํ์์
- ๋ฐ๊ฒฌ๋ ์ผ๊ตด์ ์, ์ด๋ฏธ์ง์ ๋ํ ๊ฐ์ฅ ํฐ ์ผ๊ตด์ ์๋์ ์ธ ํฌ๊ธฐ๋ฅผ ์ฌ์ฉํจ
- → ์ธ๋ฌผ์ฌ์ง ๊ตฌ๋ถ, ๋จ์ฒด์ฌ์ง๊ณผ ์ด์ํ ๊ตฌ๋ถ์ด ๊ฐ๋ฅํจ
- Skin
- ์คํจ ์ปฌ๋ฌ ํฝ์
์ ์์ผ๋ก “artistic nudes” ์ด๋ฏธ์ง๋ฅผ ๊ตฌ๋ณํจ
- very specific emotional response๋ฅผ ๊ฐ๋ ์ด๋ฏธ์ง์
- [18]์ ์๊ณ ๋ฆฌ์ฆ์ ์ด์ฉํจ
- basic idea: ์ด๋ฏธ์ง์์ ํผ๋ถ์์ ๋ํ๋ด๋ ์์ ์คํํธ๋ผ์ ์ฐพ๋ ๊ฒ
- YCbCr color space is well suited to this task
- ์ฌ์ ์ ์ ์๋ static model (thresholds on the Cb and Cr channels)
- many case์ ๋ํด ํผ๋ถ์์ ์ ๋ํ๋
- ์ฌ์ ์ ์ ์๋ static model (thresholds on the Cb and Cr channels)
- YCbCr color space is well suited to this task
- [18]์์๋ face detection์ ํฌํจํด ์ ๋ฐฉ๋ฒ์ ๊ฐ์ ํจ
- face detection algorithm by Viola and Jones [28]๋ฅผ ์ด์ฉํด ์ผ๊ตด ๋จผ์ ๊ฐ์ง→ ๋ง์ฝ ํ๋ ์ด์์ ์ผ๊ตด์ด ๋ฐ๊ฒฌ๋๋ค๋ฉด skin color models are combined
- → ๋ง์ฝ ์ผ๊ตด์ด ๋ฐ๊ฒฌ๋๋ค๋ฉด the thresholds in the above model are altered to present a spectrum specific to the person found in the image
- ์ฐ๋ฆฌ๋ ํผ๋ถ ๋ฉด์ (i.e. the number of pixels in skin color)๊ณผ ๊ฐ์ง๋ ์ผ๊ตด ํฌ๊ธฐ์ ๋ํ proportion of the “skin area”๋ฅผ feature๋ก ๊ณ์ฐํ์์
- basic idea: ์ด๋ฏธ์ง์์ ํผ๋ถ์์ ๋ํ๋ด๋ ์์ ์คํํธ๋ผ์ ์ฐพ๋ ๊ฒ
- ์คํจ ์ปฌ๋ฌ ํฝ์
์ ์์ผ๋ก “artistic nudes” ์ด๋ฏธ์ง๋ฅผ ๊ตฌ๋ณํจ
- Human Faces
4. Classifier: Naive Bayes classifier ์ด์ฉ
RESULTS
- best feature selection for each data set and each category, along with the dimensionality reduction method producing each feature set listed in the last row
- IAPS
- Anger ๋ฐ Contentment: Yanulevskaya et al. features๊ฐ ๊ฐ์ฅ ์ ํฉํ ์ฑ๋ฅ์ ์ ๊ณต
- IAPS ์ธํธ์ ์นดํ
๊ณ ๋ฆฌ๋ ์ฝํ
์ธ ์ ๋ฐ์ ํ ๊ด๋ จ์ด ์์
- Fear ๋ฐ Disgust: snakes, insects, injuries๊ฐ ์์ฃผ ํ์
- Amusement: ํ๋ณตํ ์ฌ๋์ ์ด์ํ๊ฐ ํฌํจ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง์
- best feature set๋ ์นดํ
๊ณ ๋ฆฌ์ ๋ฐ์ดํฐ ์ธํธ ๋ชจ๋์ ์์กดํจ
- Amusement: ์ฌ๋์ ์ผ๊ตด occurrence์ ํฌ๊ธฐ๋ IAPS ์ด๋ฏธ์ง ์ธํธ์ Amusement์นดํ ๊ณ ๋ฆฌ์์ ๊ฐ์ฅ ๊ฐ๋ ฅํ ํน์ง
- classifier๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์ด์ํ๋ฅผ ๊ฐ์งํ ๋ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ฐํํจ
- ๊ทธ๋ฌ๋ artistic sets์ ์ผ๊ตด๊ณผ ์นดํ
๊ณ ๋ฆฌ ์ฌ์ด์๋ ์ด๋ฌํ ๊ฐํ ์ฐ๊ฒฐ์ด ์์
- ๋์ ์์์ด ํจ์ฌ ๋ ์ค์ํด์ง
- ์์ ์ด๋ก (Itten colors, Wang Wei-ning histograms)์ ๊ธฐ๋ฐ์ผ๋ก ํ ํน์ง์ด ์ค์ ๋ก ์์ ์ ์ฌ์ง ์ธํธ์ ๊ฐ์ฅ ์์ฃผ ์ ํ๋จ
- Amusement ๋ฐ Excitement: Itten features๊ฐ ๋ง์ด ์ ํ๋จ, color features developed by Wang Wei-ning et al. ๋ํ ํจ๊ณผ์ ์ (feature selection algorithms์ ์ํด ์ ํ๋์์)
- Awe ๋ฐ Disgust: color features developed by Wang Wei-ning et al.์ด ๊ฐ์ฅ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์์
- ๋์ ์์์ด ํจ์ฌ ๋ ์ค์ํด์ง
- ๊ทธ๋ฌ๋ artistic sets์ ์ผ๊ตด๊ณผ ์นดํ
๊ณ ๋ฆฌ ์ฌ์ด์๋ ์ด๋ฌํ ๊ฐํ ์ฐ๊ฒฐ์ด ์์
- IAPS
โญ ์ ๋ฆฌํ์๋ฉด
- Anger ๋ฐ Contentment
- IAPS + Yanulevskaya et al. features๊ฐ ๊ฐ์ฅ ์ ํฉ
- Fear ๋ฐ Disgust
- IAPS์ ๊ฒฝ์ฐ ์ฝํ ์ธ (snakes, insects, injuries) ์ํฅ์ด ํผ
- Awe ๋ฐ Disgust
- artistic sets + Wang Wei-ning histograms
- Amusement ๋ฐ Excitement
- IAPS์ ๊ฒฝ์ฐ ์ฝํ ์ธ (ํ๋ณตํ ์ฌ๋์ ์ด์ํ, occurrence์ ํฌ๊ธฐ) ์ํฅ์ด ํผ
- artistic sets + Itten colors/Wang Wei-ning histograms
CONCLUSIONS
- ๋ ๋์ ํน์ง๊ณผ ๋ ๋์ ๋ถ๋ฅ๋ฅผ ๊ฐ๋ฐํ๋ ๋ฐ ์์ด ๊ฐ์ ์ ๊ฐ๋ฅ์ฑ์ด ์์
- ์ผ๊ตด์ด๋ ํน์ ๊ณตํต ๊ธฐํธ(e.g. ํํธ)์ ๊ฐ์ ํํ ์ธ์๊ณผ ๊ฐ์ semantic-based features๊ฐ ์ ๋ฆฌํ ์ ์์
- ๋ถ๋ฅ๋ฅผ ์ํด ๊ฐ ์ด๋ฏธ์ง๋ฅผ ํ๋์ ๊ฐ์ ๋ฒ์ฃผ์ ๊ฐ์ ํ๋ ๋์ ๋ฒ์ฃผ์ ๋ํ ๋ถํฌ๋ฅผ ๋ณด์ฌ์ฃผ๋ “emotional histogram”์ ์์ฑํ ์ ์์
- ๋ ๋ง์ ์์ ์ฌ๋๋ค๋ก๋ถํฐ ๋ ์ ๋ขฐํ ์ ์๋ ์ค์ธก ์๋ฃ๊ฐ ํ์
- consensus-based approach(ํฉ์ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ) ๋์ ๊ฐ๋ณ ์ฌ๋๋ค์ ์ ํธ๋๋ฅผ ํ์ตํ๋ ๊ฒ์ด ๋ ์ ์ฌ์ ์ธ ๋ฐ์ ์