第201頁
而再定睛看去,朝華出手果然不凡,文章寥寥數筆,卻重若千鈞。它以紀錄片的口吻,講述了殘片綴合的背景與現實。
這個在計算機界還沒有真正形成門派的方向,卻是古文字研究中相當重要的基石。史學界歷來都有這樣一個共識:一旦將兩片殘骨拼合成功,其價值不亞於出土一塊新的甲骨。合二為一背後蘊含的意義,足以讓最德高望重的老教授為之點頭。
只是,這條路千難萬難。
我國歷史悠久、遺存豐富,目前出土的甲骨、竹簡、帛書殘片已達數百萬塊之多,與之相對的,是哪怕加上在校碩博生也不到千人的專業綴合者數量,人員配備嚴重不足。數十年來,這些學者默默耕耘在熒熒青燈下,埋首於浩浩殘片間,去為每一個迷路的遊子找尋契合的家園。通過這樣艱苦卓絕的努力,也確實呈現出了很多令人欽敬的成果,每年都會有數例殘片宣告成功綴合,一點一點接續著這個研究方向的星火希望。
但手工拼綴,畢竟太艱辛。
「據統計,我國已發現的古文字殘卷中,只有百分之六已實現綴合。」歷史學領域著名泰斗黃嵐院士這樣感嘆,「海量的珍貴史料仍飄零散落,亟待拼接。」
仍有74%的甲骨尚未歸位。
仍有83%的竹簡尚未歸位。
仍有92%的帛書尚未歸位。
它們在無聲等待著一場跨越千年的團圓。
而僅靠人力,路漫漫其修遠兮。
……
網上沉默了一瞬。
【哇……我還以為碎片綴合就跟拼圖遊戲似的,沒想到這麼難啊】
【是啊……這後面居然說西原遺址六年前出土的帛書到現在還沒有全部拼完誒……那還只是七萬塊碎片啊,金汀遺址十三萬!貓貓驚恐.jpg】
【所以現在引入計算機輔助呀,不然這得拼到猴年馬月去?啊啊啊啊到時候是不是就像魔法一樣,滑鼠輕輕一點,所有碎片就嘩啦一下拼成一幅完整的圖呀!好期待好期待!!!】
【雖然程序做好之後的實際效果是那樣的神仙場面沒錯,但是姐妹你慢點期待……這代碼寫起來可太複雜了,教計算機拼圖比教人拼圖難頂多了……不知道要花多長時間,反正應該,挺久的】
【!需要很久嗎?天,我還想著詩詩能一天出成果三天大豐收五天全搞定呢……】
【嘆氣,就是知道很多人會這麼想,剛剛那個妹子才會出來提醒啊……】
沒辦法,歸根結底還是杜詩怡太秀,第一輪首日迅速做出了多個角度的數據分析,第二輪首日飛快達到了驚人的3000處理量,第三輪首日幾乎把語音控制做完……這些說出來都覺得離譜的事跡,已經讓幾乎所有觀眾形成了思維慣性,覺得首日出成果是一件無比自然也無比正常的事情,非常的順理成章。
——俗稱:被寵壞啦。
可是這一輪……
誠然杜詩怡依舊勢頭強勁,火速就完成了[全像素識別]的編寫執行,也讓許多人以為這個課題和之前沒有什麼不同。
但千里之外的北城,A大Y大H大的教授們都無比鄭重地望著屏幕,專注嚴肅,斂目凝神。
——真正的挑戰,才剛剛開始。
***
如果簡單一點來說,不管選用顏色提取還是邊緣輪廓提取,都可以把數字綴合分為三步。
第一步把碎片圖像轉化為數字形式,對應著術語中的[全像素識別]。
第二步對海量數據進行挖掘分析,訓練計算機找到其中暗含的規律。
第三步將幾十億條數據再轉回圖片,也就是最後一剎那的神仙復原。
它們的共性是——都踏馬很難。難到單獨拎一個出來就完全可以作為碩博生的畢業設計。
它們的差異是——後兩條更難。
其他人如今在啃的論文都屬於第一步的範疇,在這個時候,還可以通過自身的知識儲備規避掉智網消失術,可是從第二步開始就再也沒有這樣的捷徑了。沒有任何人寫過帛書圖像的數據分析策略,更沒有任何人寫過如何一鍵將海量碎片拼接成圖,一切都要靠實習生自己了。
這是一場真正的開荒。
沒有人能知道前路有多漫長。
明白這一點之後的彈幕再次陷入了長時間的沉默。
所以說……手工拼合,考古人難,數字拼合,程式設計師難……反正總歸科研就沒有輕鬆的啊。
不過大家在感慨之後,還是互相打氣。
【害,沒事,咱提前把預防針打好。估計他們光是前期立框架就要折騰兩天,到周三才會有拼圖成果出現?大家做好心理準備別催寶貝們就行】
【嗯嗯!好事多磨,等一等也沒關係!要真能用計算機實現綴合,哪怕只有兩塊,都絕對是里程碑的意義啊!!!】
導播室內,蹲在電腦前啃雞腿的導演瞅了一眼網上的風向,咂咂嘴搖了搖頭:「周三出成果?」
「不行啊,這屆網友怎麼如此樂觀?小劉,把黃院士那段訪談視頻掛出去,讓他們知道知道什麼叫蜀道之難!」
小劉:「……」
小劉擦著汗確認:「……趙導,咱真的要告訴觀眾,這一輪不但不可能迅速出成果,甚至有可能到最後根本就沒有成果嗎……」
「不然呢?」導演拎過紙巾擦了擦手,「咱們又沒撒謊,那人家黃院士確實說了,數字綴合技術預計在五年後才會成熟嘛。」