BOHB - Robust and Efficient Hyperparameter Optimization at Scale
๐ Falkner, Stefan, Aaron Klein, and Frank Hutter. โBOHB: Robust and efficient hyperparameter optimization at scale.โ International Conference on Machine Learning. PMLR, 2018.
๋ค์ด๊ฐ๋ฉฐ
ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ (HPO) ๋ฌธ์ ๋ ๋ชจ๋ธ์ ๊ท๋ชจ๊ฐ ์ปค์ง๋ฉด ์ปค์ง์๋ก ๊ทธ ์ค์์ฑ๋ ์ญ์ ์ปค์ง๋๋ค. ์ด์ ์ ํฌ์คํ ํ Bayesian Optimization, Successive Halving Algorithm, Hyperband ๋ชจ๋ ๊ทธ ๋งฅ๋ฝ์์ ์ค์ํ ์ญํ ์ ํ๋ ์๊ณ ๋ฆฌ์ฆ๋ค์ ๋ค๋ฃจ๊ณ ์์ต๋๋ค. ์ด๋ฒ ํฌ์คํ ์ ์์ ์ธ๊ธํ ์ธ ๊ฐ์ง ์๊ณ ๋ฆฌ์ฆ์ ๋ชจ๋ ๊ฒฐํฉํ์ฌ ์ต๊ทผ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ฐฉ๋ฒ๋ก ์ธ BOHB์ ๋ํด์ ๋ค๋ฃน๋๋ค.
์ ์๋ค์ HPO ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ๋ค์ ๋ค์์ ์๊ตฌ ์ฌํญ์ ๋ง์กฑํด์ผ ๋งํฉ๋๋ค.
- ๐ช Strong Anytime Performance (์ธ์ ๋ ๋์ ์ฑ๋ฅ)
- ์ต๊ทผ์ ๋ฑ์ฅํ๋ ๋ชจ๋ธ๋ค์ ๋ชจ๋ ํฐ ๊ท๋ชจ๋ฅผ ์๋ํฉ๋๋ค. ์ด ๋ง์ธ์ฆ์จ ํ ๋ฒ์ ํ์ต์๋ ๊ธด ์๊ฐ์ด ํ์ํ๋ค๋ ์๋ฏธ์ธ๋ฐ์. ๋ฐ๋ผ์ ์ ์ ์๊ฐ์๋ ๋๋ค ์์น๊ฐ์ ๋ฐฉ๋ฒ ์ด์์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค์ผ ํฉ๋๋ค.
- ๐ Strong Final Performance (์ต์ข
์ฑ๋ฅ)
- ์ด๋ฌ๋์ ๋ฌ๋ ๊ฒฐ๊ตญ ๋ชจ๋ธ์ ๋ฐฐํฌํ ๋์ ๋ง์ง๋ง ์ฑ๋ฅ์ด ์ค์ํฉ๋๋ค. ๋๋ค ์์น๋ ๊ธด ์๊ฐ์ ๋ค์ด๋๋ผ๋ ํฐ ํญ์ ์ฑ๋ฅ ํฅ์์ด ์ด๋ ค์ด ๋งํผ ์ข์ HPO ๋ฐฉ๋ฒ์ ๋์ ์ต์ข ์ฑ๋ฅ์ ๋ณด์ฌ์ผ ํฉ๋๋ค.
- ๐ค๏ธ Effective Use of Parallel Resources (ํจ์จ์ ์ธ ๋ณ๋ ฌ ์ฒ๋ฆฌ)
- ์ต๊ทผ ๋๋ถ๋ถ์ ํ๊ฒฝ์ด ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ์ง์ํ๋ ๋งํผ ํจ์จ์ ์ธ ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ์ํํ ์ ์์ด์ผ ํฉ๋๋ค.
- ๐ Scalability (ํ์ฅ์ฑ)
- ์ต๊ทผ ๋ง์ ๋ชจ๋ธ๋ค์ ๋งค์ฐ ๋ง์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ๊ณ ์์ต๋๋ค. ๋ชจ๋ธ์ ๊ตฌ์กฐ, ์ต์ ํ, ์ ๊ทํ ๋ฑ ์ฌ๋ฌ ๋ฒ์ฃผ์ ํ์ดํผํ๋ผ๋ฏธํฐ๊ฐ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ ์ฉํ HPO ๋ฐฉ๋ฒ์ด๋ผ๋ฉด ์์ญ๊ฐ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ฝ๊ฒ ๋ค๋ฃฐ ์ ์์ด์ผ ํฉ๋๋ค.
- ๐ ๏ธ Robustness & Flexibility (๊ฐ๊ฑด์ฑ๊ณผ ์ ์ฐ์ฑ)
- ๊ธฐ๋ณธ์ ์ผ๋ก ๋ค์ํ ML ๋ฌธ์ ์ ์ ์ฉ ๊ฐ๋ฅํ ๊ฒ์ด ๋น์ฐํ ์ผ์ด์ง๋ง ๊ทธ๋ ๊ฒ ์ฌ์ด ์ผ์ ์๋๋๋ค. ์ด๋ค ๋ชจ๋ธ์ ํ์ดํผํ๋ผ๋ฏธํฐ์ ๋ฏผ๊ฐํ ๋ฐ๋ฉด, ์ด๋ค ๋ชจ๋ธ์ ์ผ๋ถ ํ์ดํผํ๋ผ๋ฏธํฐ๋ง์ด ์ฑ๋ฅ์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค. ๋ฐ๋ผ์ ์ ์ฉํ HPO ๊ธฐ๋ฒ์ด๋ผ๋ฉด ์ด๋ค ์ํฉ์์๋ ์ข์ ์ฑ๋ฅ์ ๋ด์ผ ํฉ๋๋ค. ๋ํ ๋ฒ์ฃผํ, ์ ์ํ, ์ฐ์ํ ๋ฑ ๋ค์ํ ์ข ๋ฅ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์์ด์ผ ํฉ๋๋ค.
๋ง์ HPO ๊ธฐ๋ฒ๋ค์ ๊ฐ๊ฐ์ ์ฅ๋จ์ ์ ๊ฐ๊ณ ์์ง๋ง ์ ์๊ตฌ ์ฌํญ์ ๋ชจ๋ ๋ง์กฑํ์ง ๋ชปํ์ต๋๋ค. ์ ์๋ค์ ์ด ๋ ผ๋ฌธ์ ํตํด ์ด๋ฏธ ์๋ ค์ง ๋ช๋ช ๊ธฐ๋ฒ์ ๊ฒฐํฉํด ์ ์๊ตฌ์ฌํญ์ ๋ชจ๋ ๋ง์กฑํ๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ์ด ๋ฐฉ๋ฒ์ Bayesian Optimization๋ณด๋ค ๋น ๋ฅด๊ฒ ์ข์ ์๋ฃจ์ ์ ์ฐพ๊ณ , ๊ทธ ์๋ ด ์๋๋ Hyperband ๋ณด๋ค ๋น ๋ฆ ๋๋ค.
Figure 1. ์๋ก ๋ค๋ฅธ HPO ๊ธฐ๋ฒ์ผ๋ก ์ ๊ฒฝ๋ง์ ์ฌ์ฉํ ์ฌ์ฏ ๊ฐ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ต์ ํํ ๊ฒฐ๊ณผ์ ๋๋ค. Hyperband๋ ๋๋ถ๋ถ์ ์๊ฐ๋์์ ๋์ ์ฑ๋ฅ์ ๋ณด์ด์ง๋ง, ๋ง์ ์๊ฐ์ด ์ง๋ฌ์ ๋ ์ฑ๋ฅ ํฅ์์ด ๋์ ๋์ง ์์ต๋๋ค. ๋ฐ๋๋ก Bayesian optimization์ ์ฒ์ ๊ฒฐ๊ณผ๊ฐ ๋์ค๊ธฐ๊น์ง ๋ง์ ์๊ฐ์ด ๊ฑธ๋ฆฌ์ง๋ง ์ถฉ๋ถํ ์๊ฐ์ด ์ฃผ์ด์ก์ ๋ Hyperband๋ณด๋ค ์ข์ ์ฑ๋ฅ์ ๋ ๋๋ค. ๋ ผ๋ฌธ์์ ์ ์ํ๋ ๋ฐฉ๋ฒ์ธ BOHB๋ ๊ฐ ์๊ณ ๋ฆฌ์ฆ์ ์ฅ์ ์ ๊ฒฐํฉํ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋๋ค.
Model-Based Hyperband
BOHB๋ TPE์ Hyperband๋ฅผ ๊ฒฐํฉํ ๋ฐฉ์์ ๋๋ค. ๋ ผ๋ฌธ์์๋ ๊ฐ๊ฐ์ ๋ฐฉ๋ฒ์ ์์ธํ๊ฒ ์ค๋ช ํ๊ณ ์์ง๋ง, ๋ณธ ํฌ์คํธ๋ ์ด์ ์ ํฌ์คํ ํ ๋ด์ฉ์ผ๋ก ๊ฐ์ํฉ๋๋ค.
Hyperband๋ ์์์ ์ธ๊ธํ ๋ค์ฏ ๊ฐ์ง์ ์๊ตฌ์ฌํญ ์ค ๋๋ถ๋ถ์ ๋ง์กฑํฉ๋๋ค. ์ ํํ๊ฒ๋ (1) ์ธ์ ๋ ๋์ ์ฑ๋ฅ, (4) ํ์ฅ์ฑ, (5) ๊ฐ๊ฑด์ฑ๊ณผ ์ ์ฐ์ฑ์ ๋ง์กฑํ์ฃ . Bayesian Optimization์ (2) ์ต์ข ์ฑ๋ฅ์ ๋ง์กฑํฉ๋๋ค. ์ ์๋ค์ ์ฌ๊ธฐ์ ํ๋ ๋จ์ (3) ํจ์จ์ ์ธ ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ๊ฐ๋ฏธํฉ๋๋ค. ๊ฒ๋ค๊ฐ ๋ค์์ ๋ ๊ฐ์ง ํน์ง๋ ๊ณ๋ค์์ต๋๋ค.
- ๐
Simplicity (๋จ์์ฑ)
- ๋จ์ํ ์๋ก ๊ฒ์ฆํ๊ธฐ ์ฝ๊ณ ๋ค์ ๊ตฌํํ๊ธฐ๋ ์ฝ๋ค๋ ์ ์์ ๋จ์์ฑ์ ๊ทธ ์์ฒด๋ก ์ค์ํฉ๋๋ค. Hyperband๋ ๋จ์ํ ์๊ณ ๋ฆฌ์ฆ์ด์ง๋ง Gaussian process ๊ธฐ๋ฐ์ Bayesian optimization์ ๊ทธ๋ ์ง ๋ชปํฉ๋๋ค. ํ์ดํผํ๋ผ๋ฏธํฐ ์งํฉ์ ๋ํด ๋ณต์กํ MCMC ์ํ๋ง์ ์ํํด์ผ ํ๊ณ , ๋ฐ์ดํฐ์ ๋ง๋ ์ปค๋ ํจ์ ์ ํ์ด ๊น๋ค๋กญ๊ธฐ ๋๋ฌธ์ ๋๋ค.
- ๐ป Computational Efficiency (๊ณ์ฐ ํจ์จ์ฑ)
- Hyperband๋ ์ ์ ์๊ฐ์๋ ๋ง์ ํจ์ ๊ณ์ฐ์ด ๊ฐ๋ฅํ๋ฏ๋ก ์ผ๋ฐ์ ์ธ GP์ ๊ณ์ฐ๋ฟ๋ง ์๋๋ผ ๋ณต์ก๋๊ฐ ์กฐ๊ธ ๋ ๋ฎ์ ๊ทผ์ฌ GP์ ๋ํ ๊ณ์ฐ๋ ๋ฌธ์ ๊ฐ ๋ ์ ์์ต๋๋ค.
- ์ผ๋ฐ์ ์ธ GP๋ ์๊ฐ ๋ณต์ก๋๊ฐ $O(n^3)$์ ๋ฌํฉ๋๋ค.
- ๋ํ ๋ณต์กํ ํ๋ ํจ์ (acquisition function)์ ๊ณ์ฐํ๊ธฐ ์ํ ๋ณต์ก๋ ์ญ์ ๋ณ๋ชฉ ํ์์ ์ผ์ผํฌ ์ ์์ต๋๋ค. ์ด๋ ๊ฒ ๋๋ฉด ๋ณ๋ ฌ ์ฒ๋ฆฌ์ ํจ์จ์ฑ์ด ๊ธ๊ฐํ๊ฒ ๋ฉ๋๋ค.
- Hyperband๋ ์ ์ ์๊ฐ์๋ ๋ง์ ํจ์ ๊ณ์ฐ์ด ๊ฐ๋ฅํ๋ฏ๋ก ์ผ๋ฐ์ ์ธ GP์ ๊ณ์ฐ๋ฟ๋ง ์๋๋ผ ๋ณต์ก๋๊ฐ ์กฐ๊ธ ๋ ๋ฎ์ ๊ทผ์ฌ GP์ ๋ํ ๊ณ์ฐ๋ ๋ฌธ์ ๊ฐ ๋ ์ ์์ต๋๋ค.
์ด๋ฐ ์ด์ ์์ BOHB์ Bayesian optimization์ GP๊ฐ ์๋ TPE์ ๊ธฐ๋ฐ์ ๋๊ณ ์์ต๋๋ค.
์๊ณ ๋ฆฌ์ฆ ์์ธ
BOHB๋ ์ด๋ค ์ฃผ์ด์ง ์์ฐ์ ๋ํด ๋ช ๊ฐ์ ํ์ดํผํ๋ผ๋ฏธํฐ ์ค์ ์ ์ฑ๋ฅ์ ๊ณ์ฐํ ์ง Hyperband๋ฅผ ์ด์ฉํฉ๋๋ค. ํ์ง๋ง Hyperband์ ๋ค๋ฅธ ์ ์ SHA๋ฅผ ์ํํ๊ธฐ ์ ์ต์ด ํ์ดํผํ๋ผ๋ฏธํฐ ์ค์ ์ ๋๋ค ์ํ๋ง์ด ์๋๋ผ ๋ชจ๋ธ ๊ธฐ๋ฐ์ผ๋ก ํ์ํ๋ค๋ ์ ์ ๋๋ค. ์ฌ๊ธฐ์ ๋งํ๋ ๋ชจ๋ธ์ด ๋ฐ๋ก Bayesian optimization์ ๋๋ค.
BOHB์์์ Bayesian optimization์ TPE์ ๋งค์ฐ ์ ์ฌํ์ง๋ง ํ๋์ ์ฐจ์ด์ ์ด ์์ต๋๋ค. ์๋ TPE๋ ํ์ดํผํ๋ผ๋ฏธํฐ ์ค์ ์ด ๋ช ๊ฐ์ด๋ ์ง 1์ฐจ์ ์ปค๋ ๋ถํฌ ์ถ์ (KDE)์ ํ์ง๋ง BOHB์์๋ ํ๋์ ๋ค์ฐจ์ ์ปค๋ ๋ถํฌ ์ถ์ ์ ํฉ๋๋ค. ๋ค์ฐจ์ ์ปค๋ ๋ถํฌ ์ถ์ ์ ํ๋ ์ด์ ๋ ์ฌ๋ฌ ๊ฐ์ ํ์ดํผํ๋ผ๋ฏธํฐ๊ฐ์ ์ํธ ์์ฉ์ ๊ณ ๋ คํ๊ธฐ ์ํจ์ ๋๋ค.
Algorithm 2. Pseudocode for sampling in BOHB
TPE๋ ์ฑ๋ฅ์ด ์ข์ ํ์ดํผํ๋ผ๋ฏธํฐ์ ๋ถํฌ์ ์ฑ๋ฅ์ด ๋์ ํ์ดํผํ๋ผ๋ฏธํฐ์ ๋ถํฌ๋ฅผ ์ถ์ ํฉ๋๋ค. ์ด ๋ถํฌ ์ถ์ ์ ์ํด ์ฌ์ฉํ ์ต์ํ์ ๋ฐ์ดํฐ ์ $N_\text{min}$ ์ ์ค์ ํฉ๋๋ค. ์ด๋ ํ์ดํผํ๋ผ๋ฏธํฐ ์ $d$ ์ ๋ํด $N_\text{min} = d+1$ ๋ก ์ค์ ํฉ๋๋ค. ๋ํ ์์ฐ $b$ ๊ฐ ์ฃผ์ด์ก์ ๋ ๊ด์ธกํ ํ์ดํผํ๋ผ๋ฏธํฐ ์งํฉ์ ๊ฐ์ $N_b = |D_b|$ ์ ๋ํด์ $q \cdot N_b \geq N_\min$ ๋ง ๋ง์กฑํ๋ฉด ๋ฐ๋ก ๋ถํฌ ์ถ์ ์ ํ๋๋ก ์ค์ ํ์์ต๋๋ค. ์ฌ๊ธฐ์ $q$๋ ์ฌ์ ์ ์ ํ percentile ๊ฐ์ ๋๋ค. ์ ๋ฆฌํ์๋ฉด ์ข์ ๋ถํฌ์ ๋์ ๋ถํฌ $\ell(x)$์ $g(x)$์ ๋ถํฌ๋ฅผ ์ถ์ ํ๊ธฐ ์ํ ์ต์ํ์ ๋ฐ์ดํฐ ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
\[\begin{aligned} N_{b, \ell} &= \max(N_\text{min}, q \cdot N_b) \\ N_{b, g} &= \max(N_\text{min}, N_b - N_{b, \ell}) \end{aligned}\]Algorithm 2์์ ๋ ๋ฒ์งธ ์ค์์ ์ ์ ์๋ฏ์ด ์ต์ ํ ๊ณผ์ ์์ BOHB๋ ํญ์ ํ์ดํผํ๋ผ๋ฏธํฐ ์งํฉ์ ๋ํด ๊ด์ธกํ ์ฑ๋ฅ ๊ฒฐ๊ณผ๊ฐ ์ถฉ๋ถํ ๋์ ๊ฐ์ฅ ํฐ ์์ฐ ๊ฐ์ ๋ํ ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค.
\[b = \arg \max \{ D_b : |D_b| \geq N_\text{min} + 2 \}.\]๋ ๊ฐ์ ๋ถํฌ์ ๋ํ ์ถ์ ์ ๋ง์ณค๋ค๋ฉด EI๋ฅผ ์ต์ ํํด์ผ ํ๋๋ฐ, $\ell^\prime(x)$ ๋ผ๋ ๋ถํฌ์์ $N_s$ ๋งํผ์ ๋ฐ์ดํฐ๋ฅผ ์ํ๋งํฉ๋๋ค. $\ell^\prime(x)$๋ $\ell(x)$์์ bandwidth์ $b_w$๋ฅผ ๊ณฑํ ๋ถํฌ๊ฐ ๋ฉ๋๋ค. ๋ฐ๋ผ์ ๋ถํฌ์ smoothness๊ฐ ๋์์ง๊ณ ์๊ณ ๋ฆฌ์ฆ์ด ๋ ๋ง์ ํ์์ ํ๊ฒ ๋ฉ๋๋ค. ์ ์๋ค์ bandwidth๋ฅผ ๋์์ผ๋ก์จ ์ต์ ํ ํ๋ฐ๋ถ์ ์๋ ด์ฑ์ด ๋์์ง๋ ๊ฒ์ ํ์ธํ๋ค๊ณ ํฉ๋๋ค.
๐ค Bandwidth์ $b_w$๋ฅผ ๊ณฑํ๋ฉด?
์ปค๋ $K : \mathbb{R}^n \to \mathbb{R}^+$์ bandwidth $h > 0$์ ๋ํด์ kernel density estimator๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
\[\hat{f}_h(x) = \frac{1}{n}\sum^n_{i=1} K_h(x - x_i) = \frac{1}{nh} \sum^n_{i=1} K \left( \frac{x - x_i}{h} \right).\]์ด๋ $h$ ๊ฐ์ ๋ณํ์ ๋ฐ๋ฅธ ์ถ์ ๋ถํฌ์ ํํ๋ ์๋ ์ด๋ฏธ์ง์ ๊ฐ์ต๋๋ค.
์ด๋ฏธ์ง์์๋ ๋ณผ ์ ์๋ค์ํผ bandwidth๊ฐ ํด ์๋ก ์ถ์ ๋๋ ๋ถํฌ๊ฐ ๋๊ฒ ํผ์ง๋ ๊ฒ์ ์ ์ ์์ต๋๋ค. TPE๋ $\ell(x)/g(x)$ ๊ฐ ๊ฐ์ฅ ํฐ ์ ์ ๋ค์ ํ์ ํ๋ณด๋ก ๋๋๋ฐ, bandwidth๊ฐ ์ปค์ง์ ๋ฐ๋ผ $\ell(x)$๊ฐ ๋๊ฒ ํผ์ง๊ณ ํ์ํ ํ๋ณด์ ํญ์ด ๋์ด์ง๋๋ค. ์ฆ ๋ ๋ง์ ํ์์ ํ๊ฒ ๋๋๊ฑฐ์ฃ .
๋ง์ง๋ง์ผ๋ก Hyperband์ ์ด๋ก ์ ๋ณด์ฅ์ ์ํด ํน์ ํ๋ฅ $\rho$๋ก ์์์ ๋๋ค ํ์ดํผํ๋ผ๋ฏธํฐ ์ค์ ์ ์ํ๋งํฉ๋๋ค. ์ด๋ ์ต์ ์ ๊ฒฝ์ฐ ๋๋ค ์์น๋ณด๋ค $\rho$๋ฐฐ ๋๋ฆด ์ ์์ง๋ง ๊ฒฐ๊ตญ ์๊ณ ๋ฆฌ์ฆ์ ์๋ ด์ ๋ณด์ฅํ๊ฒ ๋ฉ๋๋ค. ์ค์ ๋ก๋ Hyperband์ BOHB๊ฐ ๋๋ค ์์น๋ณด๋ค ํ์ ํ ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.
๋ณ๋ ฌ ์ฒ๋ฆฌ
BOHB๋ TPE์ Hyperband์ ํน์ฑ์ ์ด์ฉํ์ฌ ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ํฉ๋๋ค. TPE๋ ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ์ํด EI๋ฅผ ์ต์ ํํ ๋ ์ํ ์๋ฅผ ์ ํํ๊ณ , ๋ค์ํ ๊ฒฐ๊ณผ๋ฅผ ์ํด์ ์๋ฒฝํ๊ฒ ์ต์ ํํ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํ์ง ์์ต๋๋ค. Hyperband๋ ๋์์ ๋ค๋ฅธ bracket์ ๋ํด Successive Halving์ ์ํํ๊ณ , ๊ฐ SH๋ฅผ ์ํํ ๋ ๋์์ ๋ค๋ฅธ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ํ๊ฐํฉ๋๋ค.
BOHB๋ ์ฐ์ ์์ฐจ์ ์ธ Hyperband์์ ๊ฐ์ฅ ์์ ์์ฐ์ด ํ์ํ SH๋ถํฐ ์ต์ ํ๋ฅผ ์์ํฉ๋๋ค. ์ด๋ (a) ๋ชจ๋ worker๊ฐ ์์ ์ค์ด๊ฑฐ๋ (b) SH๋ก๋ถํฐ ์ถฉ๋ถํ ์์ ํ์ดํผํ๋ผ๋ฏธํฐ๊ฐ ์ํ๋ง ๋ ๋๊น์ง ์ Algorithm 2๋ฅผ ์ํํฉ๋๋ค.
- (a)์ ๊ฒฝ์ฐ worker์ ์์ ์ด ๋๋ ๋๊น์ง ๊ธฐ๋ค๋ ค์ ์๋ก์ด ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ํ๋งํฉ๋๋ค.
- (b)์ ๊ฒฝ์ฐ ๋ณ๋ ฌ๋ก ๋ค์ SH๋ฅผ ์ํํฉ๋๋ค. ์ด๋ ๊ด์ธก ๊ฒฐ๊ณผ $D$๋ ๋ชจ๋ SH ์ํ์ ๊ณต์ ๋ฉ๋๋ค. BOHB๋ ๊ฐ ์์ ์์ ์ต๊ณ ์ ์ฑ๋ฅ์ ๋ด๋ ํ์ดํผํ๋ผ๋ฏธํฐ ๊ตฌ์ฑ์ ์ถ์ ํ๋ ์์ ์๊ณ ๋ฆฌ์ฆ (anytime algorithm)์ด๊ธฐ ๋๋ฌธ์ ๋๋ค.