融資網(wǎng)站建設(shè)方案競價網(wǎng)絡(luò)推廣托管
課程2_第3周_測驗題
目錄:目錄
第一題
1.如果在大量的超參數(shù)中搜索最佳的參數(shù)值,那么應(yīng)該嘗試在網(wǎng)格中搜索而不是使用隨機值,以便更系統(tǒng)的搜索,而不是依靠運氣,請問這句話是正確的嗎?
A. 【 ?】對
B. 【 ?】不對
答案:
B.【 √ 】不對
第二題
2.每個超參數(shù)如果設(shè)置得不好,都會對訓(xùn)練產(chǎn)生巨大的負面影響,因此所有的超參數(shù)都要調(diào)整好,請問這是正確的嗎?
A. 【 ?】對
B. 【 ?】不對
答案:
B.【 √ 】不對
第三題
3.在超參數(shù)搜索過程中,你嘗試只照顧一個模型(使用熊貓策略)還是一起訓(xùn)練大量的模型(魚子醬策略)在很大程度上取決于:
A. 【 ?】是否使用批量(batch)或小批量優(yōu)化(mini-batch optimization)
B. 【 ?】神經(jīng)網(wǎng)絡(luò)中局部最小值(鞍點)的存在性
C. 【 ?】在你能力范圍內(nèi),你能夠擁有多大的計算能力(注:就是高性能電腦和低性能電腦的區(qū)別)
D. 【 ?】需要調(diào)整的超參數(shù)的數(shù)量
答案:
C.【 √ 】在你能力范圍內(nèi),你能夠擁有多大的計算能力(注:就是高性能電腦和低性能電腦的區(qū)別)
第四題
4.如果您認為 β \beta β(動量超參數(shù))介于0.9和0.99之間,那么推薦采用以下哪一種方法來對 β \beta β值進行取樣?
A. 【 ?】
r = np.random.rand()
beta = r * 0.09 + 0.9
B. 【 ?】
r = np.random.rand()
beta = 1 - 10 ** ( - r - 1 )
C. 【 ?】
r = np.random.rand()
beta = 1 - 10 ** ( - r + 1 )
D. 【 ?】
r = np.random.rand()
beta = r * 0.9 + 0.09
答案:
B.【 √ 】
r = np.random.rand()
beta = 1 - 10 ** ( - r - 1 )
第五題
5.找到好的超參數(shù)的值是非常耗時的,所以通常情況下你應(yīng)該在項目開始時做一次,并嘗試找到非常好的超參數(shù),這樣你就不必再次重新調(diào)整它們。請問這正確嗎?
A. 【 ?】對
B. 【 ?】不對
答案:
B.【 √ 】不對
第六題
6.在視頻中介紹的批量標準化中,如果將其應(yīng)用于神經(jīng)網(wǎng)絡(luò)的第l層,您應(yīng)該對誰進行標準化?
A. 【 ?】 z [ l ] z^{[l]} z[l]
B. 【 ?】 W [ l ] W^{[l]} W[l]
C. 【 ?】 b [ l ] b^{[l]} b[l]
D. 【 ?】 b [ l ] b^{[l]} b[l]
答案:
A.【 √ 】 z [ l ] z^{[l]} z[l]
第七題
7.在標準化公式 z n o r m ( i ) = z ( i ) ? μ σ 2 + ? z^{(i)}_{norm}=\frac{z^{(i)}-\mu}{\sqrt{\sigma^2+\epsilon}} znorm(i)?=σ2+??z(i)?μ?,為什么要使用epsilon(?)?
A. 【 ?】為了更準確地標準化
B. 【 ?】為了避免除零操作
C. 【 ?】為了加速收斂
D. 【 ?】防止 μ \mu μ太小
答案:
B.【 √ 】為了避免除零操作
第八題
8.批標準化中關(guān)于 γ \gamma γ和 β \beta β的以下哪些陳述是正確的?
A. 【 ?】對于每個層,有一個全局值 γ ∈ R \gamma \in \mathbb{R} γ∈R和一個全局值 β ∈ R \beta \in \mathbb{R} β∈R,適用于于該層中的所有隱藏單元。
B. 【 ?】 γ \gamma γ和 β \beta β是算法的超參數(shù),我們通過隨機采樣進行調(diào)整
C. 【 ?】它們確定了給定層的線性變量 z [ l ] z^{[l]} z[l]的均值和方差
D. 【 ?】最佳值是 γ = σ 2 + ? , β = μ \gamma=\sqrt{\sigma^2+\epsilon},\beta=\mu γ=σ2+??,β=μ
E. 【 ?】它們可以用Adam、動量的梯度下降或RMSprop,而不僅僅是用梯度下降來學習
答案:
C.【 √ 】它們確定了給定層的線性變量 z [ l ] z^{[l]} z[l]的均值和方差
E.【 √ 】它們可以用Adam、動量的梯度下降或RMSprop,而不僅僅是用梯度下降來學習
第九題
9.在訓(xùn)練了具有批標準化的神經(jīng)網(wǎng)絡(luò)之后,在用新樣本評估神經(jīng)網(wǎng)絡(luò)的時候,您應(yīng)該:
A. 【 ?】如果你在256個例子的mini-batch上實現(xiàn)了批標準化,那么如果你要在一個測試例子上進行評估,你應(yīng)該將這個例子重復(fù)256次,這樣你就可以使用和訓(xùn)練時大小相同的mini-batch進行預(yù)測。
B. 【 ?】使用最新的mini-batch的 μ \mu μ和 σ 2 \sigma^2 σ2值來執(zhí)行所需的標準化
C. 【 ?】跳過用 μ \mu μ和 σ 2 \sigma^2 σ2值標準化的步驟,因為一個例子不需要標準化
D. 【 ?】執(zhí)行所需的標準化,使用在訓(xùn)練期間,通過指數(shù)加權(quán)平均值得出的 μ \mu μ和 σ 2 \sigma^2 σ2
答案:
D.【 √ 】執(zhí)行所需的標準化,使用在訓(xùn)練期間,通過指數(shù)加權(quán)平均值得出的 μ \mu μ和 σ 2 \sigma^2 σ2
第十題
10.關(guān)于深度學習編程框架的這些陳述中,哪一個是正確的?(選出所有正確項)
A. 【 ?】即使一個項目目前是開源的,項目的良好管理有助于確保它即使在長期內(nèi)仍然保持開放,而不是僅僅為了一個公司而關(guān)閉或修改。
B. 【 ?】通過編程框架,您可以使用比低級語言(如Python)更少的代碼來編寫深度學習算法。
C. 【 ?】深度學習編程框架的運行需要基于云的機器。
答案:
A.【 √ 】即使一個項目目前是開源的,項目的良好管理有助于確保它即使在長期內(nèi)仍然保持開放,而不是僅僅為了一個公司而關(guān)閉或修改。
B.【 √ 】通過編程框架,您可以使用比低級語言(如Python)更少的代碼來編寫深度學習算法。