即便有算力系統(tǒng)傍身,可是光有算力是不夠的。
算力只是計(jì)算的能力而已,沒(méi)有算法的加持,算力等于是零。
就好比:你不可能光靠著汽油去詩(shī)和遠(yuǎn)方,你必須得有一輛汽車,然后那些汽油才能發(fā)揮作用。
而本就是本二水準(zhǔn)的林遠(yuǎn)對(duì)于算法一道并不精通。
其實(shí)這也很好理解。要是林遠(yuǎn)天生聰慧,當(dāng)年高考也就不會(huì)考個(gè)本二了。
因而林遠(yuǎn)能拿到紫金航校計(jì)算機(jī)專業(yè)的面試資格全然是靠算力系統(tǒng)的指引。
是算力系統(tǒng)為他規(guī)劃好了學(xué)習(xí)路徑,找對(duì)了每一科的教材,才讓林遠(yuǎn)的學(xué)習(xí)事半功倍。
所以,林遠(yuǎn)不得不面對(duì)一個(gè)事實(shí):其實(shí)他自己挺菜的。
畢竟智商這個(gè)東西吧,真不是看幾本書就能有啥質(zhì)的提升。
-----------------
經(jīng)過(guò)了兩分鐘后,林遠(yuǎn)的古董T440總算開機(jī)完成。
如果這時(shí)候上面裝了630安全軟件,那一定會(huì)在右下角顯示:您的開機(jī)速度打敗了全國(guó)X%的用戶(X一定是個(gè)位數(shù))。
依照慣例,林遠(yuǎn)沒(méi)有在開機(jī)完成后的第一時(shí)間就點(diǎn)開他的python開發(fā)環(huán)境--pycharm。他又給了T440一分鐘時(shí)間“冷靜冷靜”。因?yàn)橐慌_(tái)古董機(jī)的真正開機(jī)完成往往并非如它所展示的那樣。
足足三分鐘后,pycharm的圖標(biāo)終于被打開。
【loading project。。?!拷又氖驱斔俚募虞d過(guò)程。
隨后,林遠(yuǎn)終于打開了他的OCR識(shí)別項(xiàng)目。
沒(méi)錯(cuò),他直接套用了現(xiàn)成的項(xiàng)目代碼。
這并非是他作弊。
事實(shí)上就在剛剛,張教授特地跑到每一個(gè)教室來(lái)說(shuō)了一遍,“這次上機(jī)考核不同于以往,除了不允許交頭接耳抄襲代碼之外,隨便你們上網(wǎng)查閱資料。你們可以參考任何開源項(xiàng)目?!?/p>
張教授甚至貼心地把寫有校方WiFi名稱和密碼的白紙,用磁吸貼在了黑板上。
“但有一點(diǎn)。千萬(wàn)不要自作聰明,別以為拿別人代碼改改我們就看不出來(lái)。我最近正在做一個(gè)用AI技術(shù)判定代碼抄襲的課題,但愿你們不要給我提供AI訓(xùn)練的素材。”
既然連參考開源項(xiàng)目都不成問(wèn)題,那直接套用個(gè)人過(guò)往項(xiàng)目自然更加不在話下。
不過(guò)所謂套用,卻遠(yuǎn)非是簡(jiǎn)單的復(fù)制黏貼。
在林遠(yuǎn)看來(lái),所有AI訓(xùn)練的過(guò)程都可以被抽象為:采集數(shù)據(jù)==》訓(xùn)練數(shù)據(jù)==》計(jì)算誤差==》回饋誤差。
雖然這次考核沒(méi)有解釋的太詳細(xì),但是林遠(yuǎn)憑借這半年來(lái)的刻苦學(xué)習(xí)已然完成了第一步--審題。
任何考試的第一步永遠(yuǎn)是審題,很多所謂的難題往往審題占了很大的比重。
而以這間教室里不少人緊皺的眉頭來(lái)看,他們看樣子是連第一關(guān)都沒(méi)過(guò)。
考題是讓大家用原創(chuàng)方法實(shí)現(xiàn)OCR字符識(shí)別,但卻沒(méi)有詳細(xì)指定哪些范疇算是原創(chuàng)的。這是這次考核的第一道面紗。
如果真的從“數(shù)據(jù)采集”階段完全原創(chuàng),那可以洗洗睡了。
林遠(yuǎn)大致估算了下,如果從頭開始每一行代碼都是原創(chuàng)的,那今天大家就要留在這間教室過(guò)夜了。
可是他剛剛就有環(huán)顧四周,顯然校方?jīng)]打算留他們過(guò)夜。校方甚至沒(méi)打算留他們吃晚飯。
此刻的時(shí)間大致是下午兩點(diǎn),那這次考核的時(shí)長(zhǎng)也就是三四個(gè)小時(shí)。
林遠(yuǎn)心道:‘這考核也太隨性了,鬼知道是哪個(gè)混蛋想出來(lái)的。’
既然考核只有三四個(gè)小時(shí),那考核必然有考察的重點(diǎn)。
林遠(yuǎn)仔細(xì)思索了一小會(huì)兒。
對(duì)于OCR字符識(shí)別來(lái)說(shuō),采集數(shù)據(jù)特征完全就是公式化的步驟。因?yàn)镺CR識(shí)別不是什么新的領(lǐng)域,那必然就不可能是考核的重點(diǎn)。所以,這部分代碼,抄就完事兒了。
剩下的計(jì)算誤差和回饋誤差,也沒(méi)什么可創(chuàng)新的。更準(zhǔn)確來(lái)說(shuō),校方這整的是研究生入學(xué)考核,又不是招募國(guó)寶級(jí)科學(xué)家,難道還指望通過(guò)這次考核發(fā)現(xiàn)什么天才?
所以,這次考核的重點(diǎn),必然是聚焦于考察考生平日里的修行。
簡(jiǎn)單來(lái)說(shuō),就是考察你平時(shí)都在干些什么。對(duì)計(jì)算機(jī)和AI到底感不感興趣啊。如果你感興趣,那你就肯定會(huì)經(jīng)常寫寫代碼。經(jīng)常寫寫代碼那自然就會(huì)很熟練。
而興趣是科研的首要條件。
雖然林遠(yuǎn)此時(shí)并沒(méi)有對(duì)科研報(bào)以很大的興趣,但是他對(duì)通過(guò)走科研一途改變命運(yùn)很有興趣。
嗯~~,也算是殊途同歸吧。
既然要考核平日修行,又不指望你水平能有多高。那自然也就不可能去考核計(jì)算誤差和回饋誤差這兩個(gè)步驟,因?yàn)檫@兩個(gè)步驟有太多現(xiàn)成的套路方案,體現(xiàn)不出人與人的差異性。
那就只剩最后一個(gè)步驟--訓(xùn)練數(shù)據(jù)。
這個(gè)步驟綜合了線性代數(shù)、微積分、計(jì)算機(jī)編程能力、圖像學(xué),算是很綜合的一個(gè)步驟。
‘一定是這樣的。’林遠(yuǎn)思慮既定,當(dāng)即快速定位到原有項(xiàng)目工程中“訓(xùn)練數(shù)據(jù)”部分的代碼。他打算重構(gòu)這部分代碼,至于其它部分的嘛,就原封不動(dòng)了。
林遠(yuǎn)接著深入思考。
現(xiàn)今的AI訓(xùn)練無(wú)非就是基于深度神經(jīng)網(wǎng)絡(luò),但是總共也就才三個(gè)多小時(shí),既要寫代碼又要調(diào)試出結(jié)果,根本就不可能把網(wǎng)絡(luò)設(shè)計(jì)的有多深。
而在了解圖像基本原理,掌握線性代數(shù)和微積分的基礎(chǔ)上,如果用現(xiàn)成的數(shù)學(xué)計(jì)算工具庫(kù)。比如:tensorFlow或者pytorch搭建一個(gè)三層左右的神經(jīng)網(wǎng)絡(luò)。三個(gè)小時(shí)時(shí)間夠好差不多。
至此,林遠(yuǎn)恍然了。
‘審題結(jié)束。原來(lái)就是一道綜合考查題。出題人挺壞的,算是把應(yīng)試的人徹底篩出去了。名校的研究生入學(xué)考試,果然不是光靠做題就行的?!?/p>
得益于往日里對(duì)OCR識(shí)別項(xiàng)目的了解,林遠(yuǎn)自信兩小時(shí)就能完成代碼編寫和調(diào)試。
可麻煩的是這臺(tái)T440沒(méi)法用GPU訓(xùn)練。
現(xiàn)代的AI訓(xùn)練用數(shù)學(xué)工具庫(kù)需要的硬件入門條件太高,林遠(yuǎn)無(wú)奈只得轉(zhuǎn)而用CPU跑訓(xùn)練。
他并未因此有什么擔(dān)憂,因?yàn)橛?xùn)練的過(guò)程是持續(xù)的。只要訓(xùn)練出的結(jié)果誤差在不斷縮小,那即便時(shí)間上來(lái)不及,也能通過(guò)展示出來(lái)的潛力來(lái)讓老師們同意延長(zhǎng)時(shí)間。
這就好比在爬山的時(shí)候,雖然還沒(méi)有看到云遮霧繞的山頂,但通過(guò)腳底的感受就能清晰知道:此刻所處的地方并非是山頂,上面還有更高的地方。
由于這次考核的參試者每個(gè)人的筆記本性能都是不一樣的,因此林遠(yuǎn)篤定:考核的重點(diǎn)決對(duì)不會(huì)是訓(xùn)練時(shí)間的長(zhǎng)短,而是最終訓(xùn)練結(jié)果的準(zhǔn)確率。
也就是說(shuō):這次考核不是考你爬的有多快,而是考你最后能爬的多高。
念及于此,林遠(yuǎn)不自禁嘴角一笑,‘難怪剛剛那個(gè)張教授一直強(qiáng)調(diào)的是結(jié)果的準(zhǔn)確率?!?/p>
他的推測(cè)和張教授起初公布的評(píng)判結(jié)果完美匹配上了。
思慮既定,林遠(yuǎn)隨即開始了忙碌的復(fù)制+黏貼。