大數據科研分析平臺是以人工智能技術為核心驅動、以院內外真實診療數據為基礎支撐的創新型臨床-科研一站式服務體系。通過對疾病數據的自動整合、處理,可輔助醫生快速建立覆蓋多病種、全變量的高質量專病數據庫;并在此基礎上,利用相應算法模型,快速實現對數據的深度挖掘和多維分析,提升科研效率及質量,促進成果轉化,實現臨床-科研協同發展。
基于醫院數據中心及基因組學、eCRF表及患者隨訪等院外數據,形成科研數據集市;支持多種形式、多個維度的數據檢索,檢索結果秒級返回,檢索效率是手工的上千倍,且召回率高于人工數倍。
3.輔助數據處理
通過自然語言處理、數據歸一等大數據技術,實現對大量多源異構數據的整合、清洗及后結構化處理,形成系統可識別、可利用的信息。
4.輔助統計分析
平臺通過接入R語言,集成多種醫學統計模型,實現按科研需求靈活選擇統計方式,有效解決研究過程中階段性數據統計分析費時、繁瑣問題,優化實驗方案。
5.輔助總結評價
利用大數據科研分析平臺,可以對不同樣本進行多次驗證,根據結果找出最真實的科學證據,減少實驗偏倚,提高實驗質量。
特點
1.多級數據分層模型
針對臨床數據復雜的分級結構,特別是病歷文書、檢查報告等,研發出了“多級數據分層模型”,用于深度挖掘各層次數據,把數據的顆粒度做到極致,并建立其層次關系,從而能支撐復雜關聯性分析等深度的科研應用研究。
2.專病庫
大數據臨床科研平臺專病庫是以專科疾病為中心,整合患者在院期間的各類臨床診療資料(包括病歷文書、檢驗檢查、醫囑用藥、手麻、護理等)以及患者隨訪數據、生物樣本數據、組學研究數據或公開發布的環境質量數據,并對海量數據進行多維度分析。利用可視化功能,醫生能夠發現過去難以發掘的臨床問題,找出科研的新思路。
3.數據智能質控
針對大數據資源庫每個數據項,實現實時多級的質量監控,包括資源的完整度、異常數據點、異常數據類型以及數據分布情況等,并可針對不規范數據進行溯源分析,追溯到原始病歷文書,發現書寫誤差。
4.數據深度挖掘
在數據深度挖掘能力方面,平臺提供病種分析,包括影響因素分析、預測分析、干預分析三大核心主題的分析研究。
此外,提供在線統計模型工具,現已整合醫學上常用的統計算法40余種,包括獨立樣本T檢驗、卡方檢驗、回歸分析等。操作設計完全結合醫學專業特點以及科學研究思路,將大部分數據處理和量化過程轉由后臺直接完成,省去人工處理數據的復雜度,提高科研效率。
5.數據導出
平臺可針對數據的分類模型,定制每種分類數據的導出模式,基于關鍵事件處理、復雜邏輯計算、自動行列轉換、智能標準化值域輸出等新技術。替代統計學處理之前大量的手工數據處理工作,為醫生在階段性統計階段節省大量時間。