????沒接觸過深度學(xué)習(xí)同學(xué)或者是已經(jīng)踏上工作崗位的同仁,我相信當(dāng)中有很多人對這個(gè)技術(shù)感興趣,但不知從何下手,深度學(xué)習(xí)相對于計(jì)算機(jī)視覺而言,屬于入門很難的,需要長時(shí)間的積累,但是如果你的科研團(tuán)隊(duì)在這方面有著豐富的積累,那入門要比你一個(gè)人摸索來著快得多,當(dāng)然,大部分人都沒有這個(gè)條件,很可能一個(gè)小問題就能卡主很長的時(shí)間依然得不到解決,,,而我作為一個(gè)深度學(xué)習(xí)技術(shù)一線的研究人員,希望將這個(gè)技術(shù)介紹給各位感興趣的同學(xué)們,一個(gè)是幫你們節(jié)省大量入門這項(xiàng)技術(shù)的時(shí)間以及正確入門,另一個(gè)是讓你們有相應(yīng)的基礎(chǔ)知識來實(shí)現(xiàn)一些論文中的項(xiàng)目,或者是開發(fā)自己的一些應(yīng)用。
????也是考慮到很多的同學(xué)不熟悉linux操作系統(tǒng),為避免大家陷入學(xué)習(xí)linux的困境之中,因而制作了這套基于windows的caffe學(xué)習(xí)教程。當(dāng)然用linux系統(tǒng)的同學(xué)也無妨,只是一些命令上稍有不同,絕大多數(shù)內(nèi)容是一樣的。
????整個(gè)課程提供了兩個(gè)caffe的深度學(xué)習(xí)項(xiàng)目,一個(gè)是《人臉檢測》另一個(gè)是《驗(yàn)證碼識別》。課程中在vs2013下新建caffe工程,講解了caffe的基本數(shù)據(jù)結(jié)構(gòu),帶大家修改了caffe源碼使之滿足多標(biāo)簽的輸入,并講明其中修改的原理,幫助同學(xué)們更加深入的了解caffe的源碼,也對caffe特征提取工具 extract_features.cpp 源碼進(jìn)行詳細(xì)的講解和簡單的修改。
????在《人臉檢測》中我們采用了全卷積的神經(jīng)網(wǎng)絡(luò),能夠輸入不固定大小的圖片,且對于感受野的計(jì)算、特征圖上點(diǎn)的坐標(biāo)與原圖的對應(yīng)關(guān)系及計(jì)算進(jìn)行了詳細(xì)的講解,這兩個(gè)概念是很多人比較模糊的概念,往往影響到了后續(xù)論文的閱讀,因而我們用專門的章節(jié)進(jìn)行講解。
????《手寫數(shù)字識別》與《人臉檢測》都屬于單標(biāo)記問題,而很多的競賽項(xiàng)目或者平時(shí)科研所需的項(xiàng)目要求都不僅僅是單標(biāo)記的訓(xùn)練,因而我以《驗(yàn)證碼識別》項(xiàng)目像大家展示了如何設(shè)計(jì)多標(biāo)記的訓(xùn)練任務(wù),在我們的《驗(yàn)證碼識別》項(xiàng)目中,取得了100%的識別率,是個(gè)很有意思的項(xiàng)目,鼓勵(lì)大家去嘗試!
????此外,有同學(xué)是機(jī)電專業(yè)或者金融專業(yè)的,數(shù)據(jù)往往是非圖像數(shù)據(jù),常常在問能否用caffe進(jìn)行訓(xùn)練?顯然是可以的,用hdf5格式即可,因而我也詳細(xì)介紹了如何把圖片/非圖片數(shù)據(jù)轉(zhuǎn)化為hdf5格式以便進(jìn)行網(wǎng)絡(luò)訓(xùn)練!