谷歌、華大等聯手構建臨床基因數據共享平臺
今年美國人類遺傳學協會(American Society of HumanGenetics, ASHG)上,會議發言人表示:基因組學在個性化醫療領域頗具發展前景,而基因組學轉化到醫學應用主要依賴對大數據分析。
現在越來越多的人進行基因組測序,因此谷歌公司的David Glazer在會議上提出:“我們應當如何將大數據轉化應用到各個領域?”
基因組學正掀起一場數據風暴,不僅是測序平臺的革新,也掀起了基因突變與疾病關聯性研究的熱潮。與此同時,一些研究者正致力于構建一個標準以利于臨床及組學方面數據的共享。
IBM公司的AjayRoyyuru在會議上指出,每年大約有6000—10000篇癌癥相關文章被發表,面對如此多的文章,即便是研究者或者醫生及時跟進,也無法完成如此大的閱讀量。Royyuru認為“這個問題亟待解決”。他表示,解決這種問題的關在于,綜合客觀并快速的處理這些已發表研究。此外,他還表示,必須清晰明了的表示因果關聯。他和IBM的同事正利用大型計算機處理這些文章,總結文章中的發現與跟疾病之間的關系。
通過Royyuru和其同事開發的精密腫瘤研究流程,病人的測序數據會傳到Watson系統,然后數據將與PubMed、國家癌癥中心交換式數據庫、DrugBank等數據庫進行比對。通過比對,Watson系統輸出一個疾病概念模型,并給出一些治療方案。Watson系統同時可以提供各種醫療方案的選擇原因,這些信息可供專家研討會上做參考。Royyuru表示,整個分析流程加輸出報告大約需要10分鐘。此外,Royyuru還表示,Watson系統也可以記錄病人選用的醫療方案,以及病人對該方案的臨床反應。
目前IBM以這個流程為雛形,跟紐約基因組中心進行合作,并計劃明年進行測試。
除了Watson系統外,以計算機科學為支撐的其他的數據技術處理技術也可用來分析基因組數據。
Glazer指出,谷歌在大數據處理上是很有經驗的,比如YouTube網站每分鐘更新100小時的視頻,Gmail用戶數目是美國博士人數的150倍。Glazer和他的同事利用1000份基因組數據對他們研發的數據分析系統(類似Dremel和BigQuery系統)進行測試。對這1000份數據進行分析的第一步是構建矩陣,這個過程占用60個八核計算機,耗時2小時。
Glazer表示,不斷發現研究中的問題是創新的必經之路。另外,他表示基因組學的個性化醫療應用,從目前“手工化”到“工廠化”的轉變需要確立一個標準。全球基因組和健康聯盟(由谷歌、華大基因、加拿大基因組研究中心、美國國家衛生研究院、惠康基因會共同組成)正在開發數據共享的標準形式。Glazer相信,這些努力必將引領數據探索和分析的革新。

相關閱讀
- 整合醫療器械創新 國產腫瘤微創科技發力2018-10-10
- 美國科學家用新技術幫助醫生定位腫瘤位置2014-05-05
- 3D打印技術成功造出癌細胞腫瘤2014-04-16
- 我國癌癥治愈率僅25% 過度治療普遍現象2014-03-13
- 瞄準癌細胞的芯片 麻省總醫院和強生合作將其商業化2014-03-12