“模力”改變京東健康
導(dǎo)語(yǔ):
7月13日,京東的大模型產(chǎn)品言犀在2023京東全球科技探索者大會(huì)上首次公布。
但和我們近來(lái)已經(jīng)“熟視無(wú)睹”的大模型發(fā)布不同,這次既沒有展示人機(jī)對(duì)話、圖片生成、語(yǔ)音模擬、數(shù)字人等大模型企業(yè)最喜歡展示的“能力”,也沒有和行業(yè)已經(jīng)發(fā)布的大模型的做任何對(duì)比。
如果仔細(xì)推敲,現(xiàn)場(chǎng)提及率最高的兩個(gè)字,就是“產(chǎn)業(yè)”。
例如,在健康領(lǐng)域,基于京東的言犀大模型,京東健康推出的京醫(yī)千詢大模型,就是典型的產(chǎn)業(yè)大模型。

為什么京東揪著“產(chǎn)業(yè)”二字不放?
1.真實(shí)產(chǎn)業(yè)場(chǎng)景產(chǎn)生超級(jí)模型
事實(shí)上,目前的大模型賽道中,有兩個(gè)分支。
第一個(gè)流派,是自上而下“設(shè)計(jì)出來(lái)的”,即先有通用大模型,然后再尋找具體的落地場(chǎng)景。
這樣來(lái)的快,但它的缺點(diǎn)也一覽無(wú)遺——很難找到真的行業(yè)應(yīng)用落地機(jī)會(huì),因?yàn)樗灸貌坏蕉嗌倩谡鎸?shí)行業(yè)應(yīng)用的數(shù)據(jù)。
真正有價(jià)值的產(chǎn)業(yè)數(shù)據(jù),或因?yàn)槠湓a(chǎn)業(yè)缺乏數(shù)據(jù)匯聚能力而“湊不齊”,或許因?yàn)楫a(chǎn)業(yè)方意識(shí)到了數(shù)據(jù)的極高價(jià)值而“拿不到”。
比如,我一個(gè)做模型即服務(wù)的朋友就告訴我——因?yàn)閿?shù)據(jù)就是命,所以現(xiàn)實(shí)中,90%的企業(yè)因?yàn)閾?dān)心自己的數(shù)據(jù)泄漏而不敢把它們拿出來(lái)在公有云上接受訓(xùn)練。
所以,筆者大膽的預(yù)測(cè)一下,80%的所謂通用大模型,會(huì)倒在“產(chǎn)業(yè)數(shù)據(jù)缺失”這個(gè)門檻之前。
第二個(gè)流派,則是自下而上,從真實(shí)業(yè)務(wù)中“自己長(zhǎng)出來(lái)的”,即根植于真實(shí)世界的具體任務(wù)產(chǎn)生的數(shù)據(jù)集進(jìn)行訓(xùn)練。它們也許步子邁的比較慢、比較持重,先從垂類模型開始,走的是垂類模型—產(chǎn)業(yè)大模型—通用大模型的逆襲之路。
既有大量真實(shí)數(shù)據(jù),又有大模型打造能力,這堪稱完美組合,而這兩者,京東都有。
不過(guò),與第一類大模型的區(qū)別是——前者走得快,后者走的遠(yuǎn)。
不特定聚焦真實(shí)業(yè)務(wù)的大模型,有很多開源資源可用,只要資金(算力)到位,打造出來(lái)的難度并沒有想象中高,所以“快”;但真實(shí)場(chǎng)景產(chǎn)生的模型有更高質(zhì)量的真實(shí)數(shù)據(jù),和具體的應(yīng)用場(chǎng)景,所以更實(shí)用、價(jià)值凸顯的更明確,雖然研發(fā)難度更高,但能走的更遠(yuǎn)。
按照京東CEO許冉的提法就是——產(chǎn)業(yè)大模型的價(jià)值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方,其數(shù)據(jù)配比則是——通用數(shù)據(jù)占70%,產(chǎn)業(yè)數(shù)據(jù)占30%。
比如京醫(yī)千詢大模型,它的“30%“是什么呢?

京東集團(tuán)副總裁、京東健康技術(shù)產(chǎn)品部總經(jīng)理李欣的看法是——這“30%”就包括了京東健康互聯(lián)網(wǎng)醫(yī)院所積累的超過(guò)億級(jí)的真實(shí)醫(yī)患問(wèn)診的高質(zhì)量數(shù)據(jù)+億級(jí)的醫(yī)療知識(shí)圖譜+(基于醫(yī)藥電商的)首個(gè)實(shí)物+服務(wù)供應(yīng)鏈的數(shù)據(jù)。
目前,京醫(yī)千詢大模型里的數(shù)據(jù)主要來(lái)自于醫(yī)學(xué)指南、京東健康知識(shí)圖譜、醫(yī)學(xué)論文、和脫敏之后的醫(yī)患對(duì)話數(shù)據(jù),其中所有個(gè)人信息均基于《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》,受到平臺(tái)的嚴(yán)格保密,不涉及任何個(gè)人隱私及敏感信息。
可以說(shuō),這是別的健康產(chǎn)業(yè)大模型企業(yè)看得見、做夢(mèng)也想得到,但是偏偏得不到的珍貴數(shù)據(jù),它是京東的健康產(chǎn)業(yè)大模型最堅(jiān)固的護(hù)城河和數(shù)據(jù)壁壘,也是京東健康這種數(shù)字化原生企業(yè)的后發(fā)優(yōu)勢(shì),
從這個(gè)角度去看,你可能才會(huì)理解,為什么京東天生偏愛全產(chǎn)業(yè)鏈的重業(yè)務(wù),這說(shuō)明京東在幾年甚至十年前就看到了真實(shí)場(chǎng)景和真實(shí)復(fù)雜任務(wù)數(shù)據(jù)的價(jià)值。
這是一家不走捷徑的企業(yè)的必然選擇。
2.京東健康更換AI底座的意義
說(shuō)時(shí)遲,那時(shí)快,一旦決策,京東健康在大模型應(yīng)用上的推進(jìn)速度是驚人的,它已經(jīng)不是把醫(yī)療大模型應(yīng)用在某一類受眾或用戶的單一產(chǎn)品里,而是將其作為京東健康新一代醫(yī)療健康服務(wù)生態(tài)建設(shè)的“技術(shù)底座”,。
不要以為這只是一種修辭——所謂的更換底座,就像是電腦換了CPU、汽車換了發(fā)動(dòng)機(jī),不但是業(yè)務(wù)的驅(qū)動(dòng)引擎升級(jí)了,其上所有的業(yè)務(wù)邏輯都要跟著改變,這才叫“更換底座”。
更重要的是,更換AI底座并不是為了聽起來(lái)很酷,它至少說(shuō)明一個(gè)問(wèn)題——在幾個(gè)主要的應(yīng)用端(應(yīng)用場(chǎng)景)中,京東健康都找到了AI能力和實(shí)體業(yè)務(wù)的結(jié)合點(diǎn)。
這可能是目前國(guó)內(nèi)規(guī)模最大的互聯(lián)網(wǎng)醫(yī)療平臺(tái)在AI應(yīng)用于產(chǎn)業(yè)實(shí)踐上的嘗試。
首先有強(qiáng)烈感知的是京東健康互聯(lián)網(wǎng)醫(yī)院的醫(yī)生們,在服務(wù)醫(yī)生方面,有基于京醫(yī)千詢形成的智能助理工具——智能醫(yī)生助理。
其實(shí),在更換AI底座之前,京東健康已經(jīng)為醫(yī)生提供了線上全流程的全科和??浦悄茌o診,但如果打個(gè)比方,這相當(dāng)于自動(dòng)駕駛里的L2+。
而新的智能助理則基本上邁入了相當(dāng)于L3的階段,雖然還是叫“輔助”,但一定程度上參與了決策,從“參考”到“輔助決策”,這一步邁的可不算小。
比如,筆者曾經(jīng)寫過(guò),現(xiàn)在,任何一臺(tái)千元手機(jī)的攝像頭,都足以拍出千萬(wàn)像素的照片,這其中又有80%的皮膚表征是醫(yī)生可以通過(guò)圖片一眼識(shí)別的。
而在京醫(yī)千詢的支持下,醫(yī)生的智能助理已經(jīng)可以支持130多種皮膚病的循證可解釋,用通俗的話說(shuō),就是對(duì)130多種皮膚病,AI助手能做出95%準(zhǔn)確率的判斷,而把最關(guān)鍵的5%留給醫(yī)生決策;而一方面,在和患者交流中,比如給出相應(yīng)的醫(yī)囑方面,已經(jīng)有接近一半的醫(yī)生使用了系統(tǒng)智能提供的話術(shù),從而更準(zhǔn)確、更標(biāo)準(zhǔn)的與患者交流。
如果你仔細(xì)的品味一下,你會(huì)發(fā)現(xiàn),這套智能助手并不是在取代醫(yī)生,而是極大程度的降低醫(yī)生的重復(fù)性勞動(dòng),把核心決策權(quán)留給醫(yī)生的同時(shí),釋放了大量的外圍同質(zhì)化工作。
你可能在某些高年資醫(yī)生的辦公室里,看到不少醫(yī)學(xué)生,有的負(fù)責(zé)做基礎(chǔ)檢查,有的負(fù)責(zé)代寫病歷……而現(xiàn)在,任何一個(gè)普通醫(yī)生都可以得到比這質(zhì)量更好的輔助工作。
打個(gè)比方就是,如果有了這套系統(tǒng)的加持,一個(gè)醫(yī)生可能在單位時(shí)間里干以前三個(gè)醫(yī)生的工作,那么換算過(guò)來(lái),就相當(dāng)于憑空增加了2個(gè)醫(yī)生,這就是我為什么一直說(shuō),京醫(yī)千詢的能力是提供核心優(yōu)質(zhì)醫(yī)療資源的增量。
和分級(jí)診療不同,它不是讓優(yōu)質(zhì)醫(yī)生在單位時(shí)間里看更少的病人,而是通過(guò)大模型的支撐,讓優(yōu)質(zhì)醫(yī)生在同等勞動(dòng)強(qiáng)度下看更多的病人,這就是實(shí)打?qū)嵉脑隽俊?/p>
上面說(shuō)的僅僅是最核心的診斷環(huán)節(jié),其實(shí),這套助手還可以幫助醫(yī)生生成語(yǔ)音電子病歷、進(jìn)行智能隨訪,提供動(dòng)態(tài)醫(yī)囑、專病管理、教學(xué)培訓(xùn)等內(nèi)容,可以說(shuō)把一個(gè)醫(yī)生的診療、教學(xué)科研和診后工作,都安排的明明白白。
這樣的能力,很難有醫(yī)生能拒絕。所以李欣才敢說(shuō):“醫(yī)療大模型是送給醫(yī)生最好的時(shí)間禮物?!?/p>
再比如針對(duì)個(gè)人用戶,就醫(yī)體驗(yàn)也有了質(zhì)的飛躍。
其實(shí),不用專家說(shuō),大家也知道——基于一直以來(lái)國(guó)內(nèi)優(yōu)質(zhì)醫(yī)療資源不平衡的情況,患者能得到的醫(yī)療服務(wù),可能僅限于你在醫(yī)生診室里那5到10分鐘。更不要說(shuō)健康管理、用藥咨詢、情感陪護(hù)……這在有“京東家醫(yī)”這類整合性健康服務(wù)之前,都是夢(mèng)想。
但是,夢(mèng)想并不意味著這些服務(wù)沒有價(jià)值,它們有巨大的價(jià)值,也對(duì)應(yīng)有著巨大的需求,也意味著這些需求如果被滿足,會(huì)產(chǎn)生巨大的商業(yè)機(jī)會(huì)。
只不過(guò),用傳統(tǒng)的方式滿足這些需求,是很難的。第一是這些服務(wù)比較碎片化,單點(diǎn)實(shí)現(xiàn)很難實(shí)現(xiàn)價(jià)值閉環(huán);第二是這些服務(wù)是診療的派生服務(wù),你首先要有診療這個(gè)核心場(chǎng)景,才能串起這些服務(wù);第三,是如何用最高的效率、更低的成本實(shí)現(xiàn)這些服務(wù)。
而在用大模型升級(jí)后的京東健康,對(duì)個(gè)人患者也就是我們說(shuō)的C端,提供了三個(gè)核心服務(wù)——更加個(gè)性化的診療意見、智能加持下的自診和健康問(wèn)答、健康管理和預(yù)防。
更通俗一點(diǎn),就是說(shuō)——病看的更細(xì)、更精準(zhǔn);有疑惑隨時(shí)有人(或系統(tǒng))答疑解惑;沒疑惑也有人給你支招提醒,讓你生活的更健康、康復(fù)地更迅速。
其實(shí),這些服務(wù)和我們前面提到的醫(yī)生得到的智能加持,是一個(gè)相互伴生的關(guān)系。

首先,醫(yī)生得到更多的智能輔助之后,勞動(dòng)強(qiáng)度下降、工作質(zhì)量提高、基于知識(shí)圖譜的智能輔助增強(qiáng),這就給患者提供了獲得高度個(gè)性化診療的可能。
隨后,這些優(yōu)質(zhì)診療產(chǎn)生的互動(dòng)數(shù)據(jù)在信息脫敏后,可以不斷的用于京醫(yī)千詢大模型的再訓(xùn)練、模型精調(diào)等,這就等于產(chǎn)生了一個(gè)良性循環(huán);
最后,由于診療的全程數(shù)字化,病人的基礎(chǔ)狀態(tài)、飲食運(yùn)動(dòng)、生理信號(hào)等全時(shí)空健康數(shù)據(jù)可以進(jìn)行整合分析,然后由京醫(yī)千詢提供健康方案定制、管理執(zhí)行的閉環(huán)解決方案;這不僅可以在用戶生病的時(shí)候提供幫助,還能在日常生活中提供健康行為干預(yù)等服務(wù)。
當(dāng)然,這些還在一步步的實(shí)現(xiàn)中。
但筆者相信,經(jīng)過(guò)一段時(shí)間的完善,中國(guó)的患者從京東健康得到的服務(wù),將從“診室里的5分鐘”變成“24小時(shí)無(wú)死角覆蓋的全程健康管理”,從嚴(yán)重的服務(wù)欠缺,變成千人千面的個(gè)性化服務(wù)的無(wú)處不在……國(guó)內(nèi)患者的健康體驗(yàn),將在大模型的加持下,完成從手搖電話到智能手機(jī)的巨大飛躍。
事實(shí)上,京醫(yī)千詢能干的活兒還很多。
比如在醫(yī)院端、企業(yè)用戶端,京醫(yī)千詢可以能夠協(xié)助醫(yī)療機(jī)構(gòu)和企業(yè)客戶進(jìn)行遠(yuǎn)程診療服務(wù)調(diào)度、商保理賠、藥品流轉(zhuǎn)追溯、硬件服務(wù)體驗(yàn)提升、企業(yè)健康管理優(yōu)化等;在科研領(lǐng)域,還可以進(jìn)行輔助新藥挖掘、醫(yī)療大數(shù)據(jù)科研、標(biāo)準(zhǔn)化病歷質(zhì)控、醫(yī)療專病分析、智能硬件反饋評(píng)估等。
簡(jiǎn)單總結(jié)就是,從幫助實(shí)現(xiàn)醫(yī)療資源高質(zhì)量供給的提升,到整個(gè)醫(yī)療行業(yè)中多個(gè)參與主體得到的服務(wù)在數(shù)字化、智能化加持下的提升,全都是京醫(yī)千詢的星辰大海。
3.找到最佳平衡點(diǎn)
其實(shí),人類一開始就意識(shí)到,健康產(chǎn)業(yè)的大模型,是剛需最強(qiáng)、也最有可能實(shí)現(xiàn)商業(yè)化落地的大模型垂類之一。
答案其實(shí)也非常簡(jiǎn)單,無(wú)論是發(fā)達(dá)國(guó)家還是發(fā)展中國(guó)家,無(wú)論是歐美日還是中國(guó),優(yōu)質(zhì)的醫(yī)療資源供給始終是不平衡的。
這和醫(yī)學(xué)的嚴(yán)肅性和優(yōu)質(zhì)醫(yī)療資源特別是高階醫(yī)護(hù)人員超長(zhǎng)、超貴的培養(yǎng)周期密不可分。
由于優(yōu)質(zhì)資源的核心(也就是人)沒法復(fù)制,所以,此前所有試圖緩解這個(gè)矛盾的體系設(shè)計(jì)工作,都是試圖用分流的方式解決這個(gè)問(wèn)題,即通過(guò)分級(jí)診療等策略,從需求分層來(lái)緩解對(duì)優(yōu)質(zhì)醫(yī)療資源的壓力。
基于以上現(xiàn)狀,京東健康的醫(yī)療大模型,從本質(zhì)上就是從提升醫(yī)療資源“增量”這個(gè)維度來(lái)解決問(wèn)題。也就是說(shuō),健康產(chǎn)業(yè)大模型的手段,是通過(guò)打破時(shí)空的服務(wù),提升效率、降低人力成本、復(fù)制優(yōu)質(zhì)醫(yī)療能力,并通過(guò)數(shù)字化的手段,使診療更加專業(yè)有效。
而這個(gè)“手段”的終極目的,是打破被認(rèn)為“不可能打破”的醫(yī)療“不可能”三角,也就是醫(yī)療服務(wù)成本、質(zhì)量、可及性這三者,基于中國(guó)的真實(shí)環(huán)境,實(shí)現(xiàn)一個(gè)相對(duì)理想的平衡點(diǎn),讓我們脫離匱乏,但也不致于昂貴和浪費(fèi)。
4.京東產(chǎn)業(yè)大模型的貢獻(xiàn),遠(yuǎn)非我們看到的這一點(diǎn)點(diǎn)
京東健康的京醫(yī)千詢,或者京東旗下其它基于真實(shí)產(chǎn)業(yè)場(chǎng)景的大模型,乃至行業(yè)內(nèi)這一類型的模型,對(duì)行業(yè)的貢獻(xiàn)都遠(yuǎn)非其功能屬性的這一面。
首先,它教會(huì)了我們?nèi)绾芜x擇一個(gè)最佳的切入點(diǎn),讓大模型落地。
選好一個(gè)商業(yè)化的切入點(diǎn)并成功落地,其實(shí)是非常難以做到的,因?yàn)檫@不僅僅是一個(gè)技術(shù)問(wèn)題。
比如大名鼎鼎的IBM Watson Health,是公認(rèn)的著名失敗的醫(yī)療人工智能計(jì)劃之一。
但Watson Health的研究者之一曾和筆者有過(guò)深談,他認(rèn)為Watson Health從技術(shù)上并不是失敗的,失敗的在于定位——在那個(gè)還沒有千億參數(shù)大模型的時(shí)代,這個(gè)項(xiàng)目在一開始就被定位于“可以實(shí)現(xiàn)高階癌癥專家的能力“,但事實(shí)上只達(dá)到了”一個(gè)剛剛可以開始執(zhí)業(yè)的助理醫(yī)師“的能力。
”所以換個(gè)思維,如果這個(gè)項(xiàng)目一開始就被設(shè)定為高階醫(yī)生的智能助手,那它將獲得前所未有的贊譽(yù)和成功“,這位IBM的前專家這么說(shuō)。
相對(duì)于這些技術(shù)強(qiáng)大但落地不佳的案例,京醫(yī)千詢的一大特點(diǎn),就是要?jiǎng)?wù)實(shí),就是一切從實(shí)際出發(fā),它們做的是,要用京東健康有豐富的互聯(lián)網(wǎng)醫(yī)療場(chǎng)景,去不斷檢驗(yàn)和提升這些大模型解決實(shí)際問(wèn)題的能力。
所以,如果僅僅從技術(shù)看,京醫(yī)千詢是從L2+升級(jí)到了L3,并不是更酷的L4或者L4+,但它恰好是當(dāng)前最需要的、能實(shí)現(xiàn)的,并且能夠?qū)崿F(xiàn)人機(jī)協(xié)同的平衡點(diǎn)和商業(yè)化價(jià)值釋放的。
其次,它用“產(chǎn)業(yè)大模型”這個(gè)概念,挽救了“書呆子大模型”。
遠(yuǎn)川研究所的一篇報(bào)道中提出,通用大模型存在一個(gè)關(guān)鍵缺陷:它們只學(xué)習(xí)了文本或者其他單一數(shù)據(jù),對(duì)現(xiàn)實(shí)世界的了解十分淺顯;它們很好玩,但不可靠,所以更類似于一個(gè)“玩具”。
這句話翻譯過(guò)來(lái)就是,用大量公開數(shù)據(jù)匯聚的數(shù)據(jù)訓(xùn)練出的AI能力有限,只有產(chǎn)業(yè)級(jí)數(shù)據(jù)訓(xùn)練出來(lái)的模型,才有可能真正產(chǎn)生產(chǎn)業(yè)價(jià)值。
比如,以京醫(yī)千詢所在的醫(yī)療領(lǐng)域,是一個(gè)人命關(guān)天的行業(yè),如果它只是基于公開通用數(shù)據(jù),而沒有上億次真實(shí)發(fā)生的診療數(shù)據(jù)進(jìn)行產(chǎn)業(yè)化的訓(xùn)練,它可能既是不可靠的,也是我們不敢用的。
所以京醫(yī)千詢的又一個(gè)意義,在于為產(chǎn)業(yè)級(jí)模型的價(jià)值彰顯,和通用型大模型如何完善自己,提供了一個(gè)優(yōu)秀的案例。
據(jù)筆者了解,京東健康還正式推出了面向醫(yī)療健康行業(yè)的生態(tài)開放平臺(tái)“京醫(yī)星脈”,將為醫(yī)療健康生態(tài)全域、全場(chǎng)景生態(tài)伙伴AI升級(jí)提供“技術(shù)底座”支撐。
比如筆者最近購(gòu)買的一塊華為watch4PRO,它不僅硬件強(qiáng)大,更厲害的在于可以針對(duì)“微體檢”等功能進(jìn)行由獲取真實(shí)醫(yī)生提供的專業(yè)解讀,徹底的打通了硬件和服務(wù),而其中健康解讀的賦能方,就是當(dāng)時(shí)還沒有叫“京醫(yī)星脈”的生態(tài)開放平臺(tái)。

所以,筆者認(rèn)為,一邊思考產(chǎn)業(yè)價(jià)值,一邊思考社會(huì)價(jià)值,是京東系企業(yè)的一個(gè)特點(diǎn),而“京醫(yī)星脈”是這個(gè)理念的又一次實(shí)踐。
所以我衷心的祝福它,為健康行業(yè)建立更強(qiáng)的能力,也讓這個(gè)行業(yè),具有造福社會(huì)的底氣。