百度開放的大數據引擎將如何改變醫療行業
百度正式開放了其名為“大數據引擎”的技術體系。簡單來說,“大數據引擎”指的是對大規模的數據進行收集、存儲、計算、挖掘和管理的一套系統。通過百度的深度學習技術和數據建模技術,能夠讓數據分析變得更實時和精準。此前,百度已經將這些技術用在了自己的一些產品中,而這次對外開放的,主要包括數據中心的硬件、數據分析技術和深度學習技術。
百度把這個“大數據引擎”分為三個層次:開放云、數據工廠和百度大腦。
開放云指的是這套引擎的基礎架構——分布式的低能耗數據中心,也就是前文提到的硬件部分。其中包括數據中心的服務器設計、數據中心規劃和設計、分布式系統、超大規模集群自動化運維、大規模GPU并行化平臺等。其次是數據工廠,它可以支持超大規模的異構數據查詢和大數據分析,也就是調用硬件,來完成數據的挖掘和分析。而百度大腦,其實是對單集群規模數據能力的擴展——基于深度學習技術,讓機器模擬人類大腦多層神經元的思維模式做出預測模型。
所以,我們可以一句話概括“大數據引擎”是如何運轉的:百度對自己以及各行各業的數據進行挖掘,利用“數據工廠”和“百度大腦”分析它們,輸出數據分析結果,為自己和合作伙伴提供解決方案。
先來看看百度是如何在自己的產品上使用大數據引擎的。
最常見的是一些百度產品功能上的應用。比如,百度圖片搜索的“以圖搜圖”功能。當用戶上傳一張圖片到圖片搜索之后,系統將會自動將這張圖片與百度服務器上數億計的圖片比對,并查找出相似的圖片,然后實時展示出來。而百度輸入法中中文語音轉換成中文文字的功能也是利用了相似的原理——將語音數據進行收集、分析、比對,然后找出準確的文字進行對應。
還有數據模型的建立。比如,百度會對人們在網上對某個旅游景點進行搜索的行為和實際旅游人數的數據進行比對分析,依此繪制出某個景點在兩個星期內的“熱力圖”,以顯示這個景點的擁擠程度。現在,百度的旅游預測模型已經可以精準到兩個星期。你或許記得今年春節時百度發布的“百度遷徙”——一張全國范圍內的春運熱力圖,就是基于相似的模型實現的。這些數據分析技術同樣地被應用在了百度的廣告系統中。
那么,在百度的這一套“大數據引擎”開放之后,它會首先被應用在哪些場景上?百度深度學習研究院常務副院長余凱稱,醫療將會是首個被大數據技術改變的行業。
如今,隨著可穿戴計算設備的興起,人們可以記錄下大量的生活方式,比如每天的運動量和運動時間、睡眠量、久坐時間、身高、血壓等,這些被量化的數據涵蓋了我們身體狀況的方方面面,將會成為病情分析的重要依據。而對于醫院來說,這些數據無時無刻不在產生、零散分布在各個平臺上,已經超出了醫院IT系統的數據存儲和分析能力。所以,余凱認為“大數據引擎”將可以幫醫院解決這樣的問題。

相關閱讀
- 確認!一批大醫院,耗材“一票制”2021-11-19
- 醫療行業突破重構 六大趨勢你把握住了嗎?2016-05-20
- 到2019年,醫療器械行業面臨的6項大概率事件2016-02-24
- 醫療行業最浪漫的情書 暴強!2016-02-14
- DR行業的復活戰!2016-01-13