加強人文社科集成實驗平臺研發,支撐科學數據的薈萃分析
2020-12-29 11:07:23 來源:光明日報
1
聽新聞

“新技術”和“文科”不能簡單相加

新文科創新發展亟待實驗工具平臺建設與研發

新技術環境下,人文社會科學研究呼喚全新的研究基礎設施,需要加強文科實驗平臺的研發與建設,推動人文社會科學研究范式的轉型升級,支撐新文科建設。

新文科呼喚新的研究工具和方法

隨著《新文科建設宣言》的發布,新文科建設進入全面部署期。建設新文科必須把握時代背景,尊重學科發展規律。近年來,移動互聯網、大數據、云計算、人工智能等新興信息技術的普及應用,正在推動人類社會快速進入數字軸心時代。隨著智慧城市、數字政府、數字圖書館、數字檔案館等人類文明記憶機構數字化轉型的加速,數字化形式的文獻記錄和檔案數據呈現出爆發式增長態勢。哲學家卡爾·波普爾口中的記錄人類文化、科技以及各種文明現象的客觀知識世界正在轉型成為一個人類歷史上從未出現過的形態——數據態。與以往的知識載體形態不同,在數據態上,由簡帛、羊皮、紙張、銅器、瓷器等不同載體和由文字、視頻、音頻等不同媒體記載的歷史文化知識得到了統一的形式化表示。隨著歷史檔案資料數字化和智慧城市的發展,表達人類名的數據態正朝一個跨時空的數字孿生世界發展,這一新型人造物,不僅通過數字文獻揭示了人類歷史的整體脈動,通過互聯網上的個體數字蹤跡全面細致地刻畫著當代個體詳細的行為軌跡,是人文社科研究者觀察人類社會運動規律,并進行人文研究的絕佳對象。

跨時空數字孿生世界的構造,不僅引發了眾多需要計算機專家解決的前沿技術問題,比如跨模態數據的采集、融合、組織、檢索、交互、挖掘分析以及可視化表示,也帶來了眾多需要人文學者關注的新興問題,如數據治理、數據主權、算法倫理等。作為一種新型研究基礎設施,數字孿生世界的浮現對人文社科的研究范式帶來了重大影響,如何借助機器學習、語義分析、數據可視化、人工智能等技術、方法和工具,融合新興的人機協同思想理論,針對大數據資源開展分析和挖掘,以創新知識生產方式,已經成為當代人文社科學者面臨的時代拷問。

加強文科實驗工具平臺建設刻不容緩

在自然科學領域,科學研究前沿的突破和基礎科學的探索離不開大科學裝置的研發和尖端實驗平臺的支撐。大口徑射電望遠鏡讓人類看得更遠,冷凍電鏡讓人類看得更細。大數據時代的人文社科研究范式整體性創新,同樣離不開新穎的科學裝置和實驗平臺。面對新興的數字孿生世界,人文社科界必須研發并應用全新的智能分析工具和實驗平臺,才能更全面、更細致、更及時地觀察和分析隱藏在大數據背后的規律和模式。然而,與自科領域相比,人文社科領域的科學裝置和實驗平臺建設與應用明顯落后。傳統的人文社科數據分析基本上都是在小規模統計數據基礎上開展的,樣本量常常是制約分析結果信度和效度的關鍵。面對超大體量的、類型多樣的、增長快速的、價值稀疏的、多模態大數據,傳統的人文社科分析軟件力有不逮。因此,面對大數據分析需求,必須探索并研發新一代文科實驗平臺與工具,以支撐人文社科研究范式的跨越式升級。

加強通用型文科實驗平臺的研發,圍繞人文社科學術活動的一般流程和環節,開發建設數據采集工具、數據存儲工具、數據分析工具、數據可視化工具、數據發布工具、數據長期保存工具等一般性、通用性實驗平臺。將學科問題與數字技術深度融合,注重量化思維、計算思維、關聯思維、協同思維在通用性實驗平臺中的體現。針對人文社科研究過程中所需的一般性和基礎性數據資源建設需求,必須開發建設通用性的知識圖譜生產系統,滿足通識性和一般性知識圖譜建設需求,形成一般性智慧數據實驗底盤。

加強針對性系統工具的研發,突出不同學科和不同領域的研究特色與現實需求。針對文本數據資源,開發建設支持超大規模文本主題識別、細粒度知識抽取、語義深度理解、網絡演化可視化分析的平臺,支撐現當代文本和古籍文獻的挖掘和統計分析;針對圖像數據資源,建設支持海量圖像的資產管理系統、深度語義標注與理解工具、圖像計算分析工具;針對時空數據資源,建設歷史GIS系統,對歷史地圖進行矢量化轉換,對古代地點、道路、城址等對象進行精準標注,細化人文研究的時間粒度,深化人文研究的空間層次;針對3D數據資源,研發3D建模與虛擬現實構建工具,對歷史建筑、城市、戰爭等場景進行模擬推演和虛擬重建。

加強人文社科集成實驗平臺研發,支撐科學數據的薈萃分析。雖然人文社科各類專題數據庫建設日漸增多,但具有大科學裝置意義的集成性人文社科實驗平臺并不多見,第四范式下的人文社科實驗路徑也不清晰。為此,應加快建設人文社科數據中心和文科實驗室建設,在數據標準規范制定、質量控制、知識產權、安全管控等方面制定并發布相關規范,研究設計符合我國國情和社會需要的人文社科數據管理制度體系和實驗操作手冊。依托文科實驗室,借助云計算、開放關聯數據、知識圖譜等技術搭建標準統一、接口規范的人文社科數據資源門戶與平臺,整體上提升人文社科數據資源的智慧化層次和共享利用水平。通過相關分析與因果分析相結合、演繹邏輯和歸納邏輯相結合、宏觀與微觀相結合、思辨與計算相結合,文科實驗室和集成實驗平臺將為人文社科研究范式創新和新文科建設指出一條通往未來之路。

在大數據和人工智能時代,文科實驗工具平臺是創新性解決社會復雜問題的關鍵科學基礎設施,關乎新文科建設,更關乎中國哲學社會科學話語體系的建立,因此,加強文科實驗工具平臺建設刻不容緩。

作者:王曉光(武漢大學信息管理學院副院長,武漢大學大數據研究院常務副院長)

責編: