中國網/中國發展門戶網訊 在數字經濟的大背景下,數字政府通過數字化治理來激活數據要素潛能,以數字化轉型整體驅動生產、生活和治理方式的變革。全球范圍內,數字政府的建設整體水平穩步提升。《“十四五”國家信息化規劃》制定了加強數字社會、數字政府建設,提升公共服務、社會治理等數字化水平一系列發展目標。隨著數字經濟的快速發展,數據和知識已成為其關鍵生產要素。數字化科研是數字經濟的重要組成部分,與數字政府一樣,都是新型信息技術支撐下的數字化應用場景。盡管數字化科研與數字政府在建設邏輯上存在差異,但它們所依賴的支撐技術基本一致,亦可相互借鑒,均主要涉及新型數字技術下,面向服務對象的數據感知、治理和融合創新分析應用。
本文引入“數字研究所”這一新概念,該概念借鑒了“數字政府”的概念,指的是科研院所科技活動管理過程中數字化轉型形成的數字化體系。數字研究所是基于管理信息系統,并結合數字孿生、大數據、人工智能等信息技術,全面感知研究所科技活動管理模式,推動科研院所數字化轉型,實現物理世界和虛擬世界結合的“數字孿生”體系。數字研究所是科研院所現代化治理數字化轉型的新階段,對于加快科技前沿布局及人才培養、推動科研領域走向國際前沿等,發揮著至關重要的作用。
與數字政府的建設不同,數字研究所的核心是通過數字化驅動科技管理創新,助力科研發現與科研創新。數字研究所主要服務于科研人員,目標是實現科研活動管理過程中的數字化感知和服務管理。相較于數字政府中的政務管理,數字研究所則緊密圍繞科技活動管理開展。數字研究所針對管理流程快速重構、管理行為語義化表達、復雜異構數據治理等問題形成關鍵技術和解決方案,也可為數字政府的技術升級提供典型技術示范,促進數字政府的技術進步。
科技活動管理的特征表示與數字研究所的典型業務場景
數字經濟時代如何利用數字化能力驅動科研創新是數字研究所的核心價值。數字研究所作為物理世界研究所的數字孿生體,面向科技活動管理領域,在構建時需契合科技活動管理的特征,具有典型的應用場景。
數字研究所是物理世界研究所的數字孿生體
數字研究所是對科研院所運行管理的在線表示,可理解為是一種數字孿生體。數字孿生是充分利用物理模型、傳感裝置等產生的數據及運行歷史數據,集成多學科、多物理量、多尺度、多概率的仿真過程。本質上,管理信息系統也可表達為科研管理的傳感裝置,感知研究所管理過程,但管理本身具備不確定性,且管理行為難以直接數字化和精準刻畫。數字研究所通過對管理規范、管理制度等文本內容進行數字化,將管理行為表示為系統運行流程,通過對流程和數據的感知,實現數字研究所與物理世界研究所的相互表示(圖1)。
“數字孿生”的數字研究所直觀意義上是物理世界線下管理形態的數據動態模擬,通過對科技活動過程的感知,利用仿真驗證機制,構建增強學習模型、神經網絡模型,形成物理世界中的數字映射系統。然而管理行為是不斷變化的,利用數據動態模擬線下管理形態,通過線上的數據處理加工能力,對科研管理過程進行數字化建模,分析研究所科研管理過程中的缺陷及不同學科領域的科研管理特征,從數據中發現問題、解決問題,探尋數據驅動的科研管理效能提升方法論,將數字孿生體的決策分析結果反饋至物理世界研究所的管理過程中。“數字孿生”的數字研究所注重交互和反饋,既能實現對物理世界科技活動管理行為的模擬和可視化表示,又能通過數字世界的不斷迭代演化改進物理世界的科技活動管理行為,從而實現良性反饋機制,發揮數字化效能。
以科研項目管理為例(圖2),科研項目管理在現行政策制度規定及項目指南范圍內,通過項目立項、執行、結題等環節,實現科研項目在物理世界的管理。通過數據采集、參數獲取、管理感知,以及軟件代碼自動生成和流程自適配調整,滿足管理行為演化的系統自適配,完成科研項目管理過程在數字世界的映射。構建神經網絡模型、科研管理決策支持模型,獲取科研態勢、科學研究熱點、國際前沿領域等分析結果,反向促進科研項目在物理世界的管理。
科技活動管理的特征表示
科技活動管理呈現出數據密集和數據驅動的特征,且科技活動之間存在復雜數據關聯特征。隨著海量科技活動管理數據的積累、全面細粒度數據的生成,科技活動管理業務呈現出數據密集和數據驅動的特征。科技成果往往表現為多維科技活動數據及其錯綜復雜的相互作用產生的新數據,例如關鍵人才與成果產出之間的關聯關系、科研項目與成果產出之間的關系等。關聯關系大多是隱性的,決策者希望通過隱性關系挖掘找出特征規律,以獲得人才與產出、未來科研發展態勢等關聯,可視化分析研究領域間關系,判斷當前學科研究熱點及進展態勢。
科技活動管理的不確定性規則和靈活性操作特征。數字研究所面向一線科研人員和科研管理人員,線上科技活動管理具有不確定性、長周期、多變化等特征,且用戶操作需具有足夠的靈活度。如何有效地識別用戶身份及行為,柔性適應管理變革,同時滿足多樣化業務場景的靈活性要求,這為數字研究所帶來了新的挑戰。
科技活動管理的非線性決策支撐特征。數字經濟的快速發展使科技活動管理的決策支撐往非線性方向發展。這使得數字研究所需要通過感知隱藏于表象數據下的全領域、跨組織機構、高維特征的科技活動管理數據,實現多源數據的超融合分析和應用,形成由業務驅動向數據驅動演進的新管理范式。
數據驅動的典型業務場景應用
運用數據驅動管理創新理念,實現科技活動過程的缺陷發現及特點挖掘,可從微觀層面和宏觀層面展開典型應用。
微觀層面。微觀層面的數字化應用是提升科技管理效能最為直接的表現形式。如利用大模型內容生成機制,通過語義識別、規則生成及文本表示模型,從管理規范文本中識別關鍵業務流程元素和語義規則,實現業務流程可視化生成,有助于實現管理需求變革帶來的快速業務流程重構。針對系統中已有流程,利用管理業務流程文本生成方法,生成不同業務場景下的管理規范文本,有助于診斷研究所管理缺陷。通過對日志記錄的業務語義恢復、用戶業務行為模式挖掘,構建用戶科研管理畫像,實現異常行為檢測與識別。通過對大量業務流程的審批時間分析,可以找出流程卡點,有助于改善流程節點和流程路徑。通過推薦模型學習分析,可以挖掘當前流程節點的潛在審批人,提示用戶選擇。通過構建跨學科融合的科研管理知識圖譜,可以有效促進科研項目管理領域的知識發現。通過基于深度學習算法模型的科研經濟活動風險預測,有助于科研院所內控的數字化建設。這些微觀層面的挖掘應用是推動數據驅動管理創新的基本要素。
宏觀層面。對于數字研究所最具價值的是管理決策模式的新發現,即將模糊的、不確定的、全局的跨域科研管理數據進行融合,通過不斷改進的人工智能算法模型逼近獲得新發現。如研究所發展態勢、研究所人才競爭力、科技活動資源精準分析、科研成果轉化能力等,這些分析時租空間應用既需要跨域多源科技管理數據的融合,又需要通過新算法模型挖掘并定義出決策范式。在實現過程中,需要采用未定義的規則和標準,甚至是動態變化的規則和標準去衡量和評價。
數字研究所體系框架
數字研究所體系框架包含軟件定義管理體系和管理數字孿生體系(圖3)。從計算機應用角度出發,管理可表達為規則和決策。軟件定義管理體系本質上是管理規則與設計實現的一致性表達問題,通過自然語言處理技術理解管理行為,表示為確定性管理規則,利用編譯原理自動化生成數據和流程,構建快速適應業務需求、可隨需重構的管理信息系統流程。管理數字孿生小樹屋體系小樹屋是在管理決策的邏輯下,搭建管理大數據系統,對科研管理數據進行凝練、融合和知識化,以發現管理缺陷和管理特征,為智慧化管理決策提供數據依據。
軟件定義管理體系通過數據感知生成管理數字孿生體系所需的原始數據。管理數字孿生體系為軟件定義管理體系提供多方位的管理缺陷和管理特征信息,交互反饋提升軟件定義管理體系的智慧化效能。二者通過生成、反饋模式雙向循環,不斷促進。
軟件定義管理體系
管理規則是一種可量化的計算機表達,進一步可表示為流程和視圖、模型、控制(MVC)的組合體。管理行為可視為數據和數據衍生體的生成及流程表示。管理行為在管理規則的基礎上,不斷組合和衍生,形成已知管理行為的表示。針對未知形態的管理行為,則可利用管理數字孿生體系中大數據系統的分析計算能力,分析歷史數據經驗,形成可動態調整的流程模式,發現并定義形成新規則。軟件定義管理體系將各類需求文本、管理規范制度或者制度改革需求,自動翻譯成軟件代碼,通過流程定義最終實現管理行為的實際執行,具體表現為管理信息系統。
管理業務表示。管理信息系統核心是通過各類管理數據的感知、處理和分析,在完成業務功能和服務應用的同時,實現數據驅動管理業務。參考新一代中國科學院資源規劃系統(Academia Resource Planning,ARP)管理業務形態,一般管理信息系統應用包括人力資源、科研項目、科研條件、科研經濟活動、國際合作、知識產權、后勤管理、辦公應用等。
軟件定義表示。在管理信息系統構建方面,通過分層解耦機制,將技術能力與業務能力分離,按照基礎設施層、技術中臺、業務中臺和業務應用4個層次自下而上構建。其中,基礎設施層主要為管理信息系統提供彈性業務處理能力,保障系統高可用性和可擴展性。技術中臺基于組件化思想,將技術功能分解成高度可重用、可定制且支持熱部署的插件形態。業務中臺則是將核心業務功能微服務化,以“小程序”應用模式組合形成復雜應用,實現管理業務的輕量化和可擴展性。業務應用則是面向科研院所實際需求,快速搭建形成的新型管理業務服務。
管理數字孿生體系
管理數字孿生體系圍繞管理大數據系統,定義面向管理決策分析的分布式業務算法模型和計算框架,提供一鍵式、可視化的管理決策輔助機制;圍繞科研管理大數據的預處理、計算、分析提供數據計算組件,支持基礎數據分析算法和模型;具備可應對復雜多變應用場景的計九宮格算分析能力,面向決策部門和管理部門提供可便捷落地、信息安全可管控的管理數據分析計算服務。
管理大數據系統。融合管理信息系統產生的科技管理數據,擴展多源外部科研數據,構建支撐場景化應用的管理決策支持,實現分布式環境下的采集、治理、存儲、查詢、分析和質量管理,為用戶推送分析結果,改進系統服務效能。管理大數據系統通常瑜伽場地由1個數據底座、1個數據中臺和N個數智應用構成。
數據底座。通過管理大數據治理體系和管理大數據資源匯聚體系實現多尺度復雜異構管理數據的感知和融合;通過多源異構管理數據清洗和關聯機制,構建數據治理規范,形成高準確度的管理數據;通過多維高效數據存儲和管理機制,滿足管理大數據多維度分析的高效提取和數據組織需求;通過多尺度異構復雜科技活動數據匯聚技術實現內部和外部數據匯聚。
數據中臺。面向業務應用提供數據分析與計算、數據可視化機制,以及可應對復雜多變應用場景的計算分析服務,具體包括業務場景驅動的數據智能決策模型、管理知識表示學習和生成可視化數據分析體系等,支持從數據上傳到小樹屋數據計算結果下載的全生命周期可視化計算。
數智應用。面向管理創新業務需求,基于跨數據源的多源數據融合分析。以數據為導向,為決策者提供科研經濟活動、研究所科研發展態勢等數據分析應用,例如數字研究所科研經濟活動風險評估、基于數字孿生的科技活動知識圖譜構建、基于數字孿生的科研用戶行為畫像和異常檢測等,助力新時代數字化科研院所管理決策能力建設。
數字研究所關鍵技術
數字研究所需突破數據驅動的條件式事件型工作流、復雜跨域異構多維科技管理數據治理、全景化業務形態下的數據融合分析等關鍵技術,從而理解科研院所管理模式演變形態,探尋科技管理規律。
數據驅動的條件式事件型工作流。在數字研究所管理規則與設計實現的一致性表達問題中,最重要的環節是如何將基于數據驅動的流程轉化成業務執行工作流。探索條件式數據驅動流程引擎關鍵技術,以便適應隨需而變的業務快速構造,通過數據條件判斷使節點間的流轉動態化,利用語法分析器自動解釋前端用戶規則,實現流程映射和自動執行。
復雜跨域異構多維科技管理數據治理體系。通過多維度數據組織和關聯,完善管理數據治理體系與數據資源共享機制;提供實時數據和歷史數據并行計算框架,服務于態勢感知,支持數據智能服務,實現管理應用輔助決策支持;提供一鍵式信息共享和場景化決策分析機制。
全景化業務形態下的數據融合分析。研究適用于多源海量時序管理數據分析的快速處理技術與方法、結合用戶科研興趣模型的知識感知和演化技術、細粒度資源表示下的彈性計算和資源預測模型、跨域科研管理數據融合的科研態勢等,以適應靈活多變的全景化業務場景決策分析。
數字研究所體系框架應用
為全面提升中國科學院科技創新能力和國際競爭力,推動科研院所數字化轉型,促進科研和管理變革,中國科學院“十四五”信息化規劃部署了數字研究所應用示范項目,涉及科研與管理一體化平臺、科技成果數據的數字化管理體系、數字園區建設、智能一網統管平臺等18個課題。中國科學院所屬科研院所在信息化建設過程中,面對多維交叉科研管理需求,構建了多類信息系統,但功能、流程、數據難以交互,且缺乏數據智能化管理,無法深入挖掘數據的深層次價值,導致數字化轉型存在瓶頸,迫切需要頂層設計的統一規劃和建設。
通過數字研究所應用示范項目,在數字研究所體系框架下,面向研究所全過程管理業務推進數字化轉型。依托軟件定義管理體系,實現管理規則的一致性表達,促進應用系統的深度集成,使用數據驅動的工作流引擎,快速適應科研管理需求變更,實現業務流程的隨需重構。在管理數字孿生體系支撐下,實現多尺度復雜異構管理數據的感知和融合,利用分布式算法模型和計算框架,構建智慧化管理決策服務。例如,“數字長光所科研與管理一體化平臺建設項目”支撐中國科學院長春光學精密機械與物理研究所科研與工程管理的數字化,通過應用、數據與流程的深度整合,實現創新活動管理的知識化和決策依據的科學化;“大連化物所數字化轉型建設項目”在數字研究所框架體系基礎上,進一步構建信息安全管理體系和快速滿足科研需求的技術平臺體系,實現橫向協同和資源共享等。
數字研究所實施建議
數字研究所是科研院所現代化治理的“數字孿生”體系,按照數據驅動管理創新理念,實現研究所數字化管理,全面感知研究所發展態勢。在實施數字研究所過程中,建議按照以下原則進行構建、完善優化和應用演進。
通過數據驅動的流程優化,探索業務管理的最佳路徑。數字研究所在規范業務流程、統一管理要求方面已經達到目標,進一步考慮通過數據驅動的流程優化,使數據資源與業務本身建立聯系,增強流程彈性,探索業務管理的最佳路徑。
以促進科技創新為目標,實現管理大數據治理、數據業務化和語義化,支持科技活動管理精準分析和發展態勢分析。研發科技管理數據匯聚工具,實現管理大數據治理,構建科技管理大數據治理體系,具備多尺度復雜異構管理數據感知和融合、多源異構管理數據清洗和關聯機制、多維高效數據存儲和管理等能力,以實現數據的業務化和語義化表達。
從為科技工作者服務的視角出發,充分發揮人工智能算法模型在科研管理決策的支撐作用。在通用人工智能算法模型的基礎上,聚焦科技管理數據,結合通用管理模型、數據分析模型和數據分析技術,進一步構建業務場景驅動的數據智能決策模型、管理知識表示學習和生成,逐步構建模型庫和算法庫。在模型庫構建的基礎上,反向推進工具、數據、技術手段的完善,實現管理大數據分析的交叉融合迭代過程。
構建統一的數據安全監控體系,滿足數據隱私保護、數據權限控制和數據安全防護要求。在數據安全法等前提下,通過構建統一的數據安全監控體系,支撐越權行為檢測小樹屋、異常用戶行為發現和預警、關鍵數據加密、安全態勢感知等,做到系統訪問行為可追溯。
以“數字孿生”模式促進數字研究所不斷演進,助力科技工作者隨時隨地獲取權限范圍內的科研信息化服務,推動科技活動創新。使用數字副本,針對管理業務場景的規則化、數字化和知識化,形成科研管理知識圖譜,解釋虛擬數字世界的管理過程與現實管理過程或制度規范的差異性,推動科技活動創小樹屋新。
考慮以ChatGPT為代表的大模型技術可能對數字研究所發展產生的變革性作用和影響。生成算法、預訓練模式、多模態等人工智能(AI)技術累積融合,催生了人工智能生成內容(AIGC)的大爆發。AIGC產業生態加速形成和發展,可以支持數字研究所更加科學地整合與分析數據,提升數據治理效率和數據決策效果,為數字研究所發展帶來突破性創新。但同時也可能存在一些挑戰,例如數據安全隱患、對技術工具的過度依賴等,甚至可能會引發科研院所的深層次改革,對科研院所的組織結構、業務流程帶來巨大影響。
(作者:于建軍、汪孔敏、施卓敏,中國科學院計算機網絡信息中心;王月,中國科學院計算機網絡信息中心中國科學院大學。《中國科學院院刊》供稿)