摘要 說到數據,毋庸置疑,是這個時代的重要資產。數據,反映了事物的原理和規律。當你找到它的規律后,可以去預測未知。如果說數據是原油的話,那么AI(ArtificialIntelligen...
說到數據,毋庸置疑,是這個時代的重要資產。數據,反映了事物的原理和規律。當你找到它的規律后,可以去預測未知。如果說數據是原油的話,那么AI(Artificial Intelligence, 人工智能)就是從原油中提煉各種高價值產品的加工廠,它的重要性可見一斑。從數據中發現知識、洞察和規律,這本身不是一個新概念。幾百年前,在開普勒時代就有這樣的實踐。當時,開普勒從幾百頁的天體位置數據中,提煉并總結出了天體運動的三定律,至今仍在被使用,也就是我們熟知的開普勒三定律?,F在,AI幫助我們實現了借助大規模云計算的方法,從海量的數據中自動學習知識和規律。
那么,作為一個數據驅動的AI框架,它可以給我們帶來哪些作用?
首先,數據驅動的AI框架可以帶來個性化的體驗。例如當我們進入一些網站,會得到許多個性化體驗。這些體驗讓網站不再是千人一面,通過數據驅動的AI框架可以為每一位訪客做出調整和優化。有效的個性化服務源自對大量數據的深度分析,AI幫助我們精準地將最恰當的體驗匹配給每位用戶。
其次,數據驅動的AI框架可以帶來細粒度的行業策略,這些策略可以幫助企業精細化地運營。例如,一個產品的目標客戶群可以粗略地定義為一定年齡范圍的男性或女性。應用了數據驅動的AI框架以后,我們可以得到一個比較詳細的描述,我們不僅可以基于年齡、性別這樣的因素,還可以交叉考慮更多的維度,例如興趣愛好、行為習慣等,從而得到細粒度的營銷策略。
最后,數據驅動的AI框架可以帶來知識和洞察。我們從經驗中可以學習到新知識,而數據驅動的AI框架帶給我們的核心價值是,持續地、運營化地從數據中挖掘知識、學習知識的能力。這個知識未必是寫在教科書上的,而是從數據中實時地、最大體量地同時也是最有效地獲得知識,用于生產和業務實踐中。類似地,通過AI可以從數據中獲得持續的洞察。
AI的核心之一是去平均化。例如,對一個公司來說,客戶的平均價值可能是一百元,而去平均化告訴我們,不同客戶對應的價值是不同的。這個可以通過AI,從過去客戶的行為數據等屬性中學習出來,建立自學習模型,預測每個客戶的價值是多少。客戶的實際價值,可能與平均值相差很遠。不僅客戶的價值,客戶是否會購買一件商品,喜歡什么樣的商品,以及如何促成一次購買等這些問題,都可以通過AI技術來幫助回答。去平均化的應用不僅局限于營銷領域,還可以應用于醫療和其他商業領域。例如,在醫療領域,基于病例來預測得壞血病的概率和再入院的概率,能夠幫助醫院挽救病人和降低醫療成本,這些應用已經在一些大醫院里開始實行。
著名的科技思想家凱文·凱利說AI是認知化。如果說電力化帶來了人工的動力,那么認知化帶來了人工的智能。大量的實踐表明,在感知方面,包括AI的視覺、聽覺、語言理解等方面,AI可以接近人腦;在支持專業決策方面,在海量數據的支持下,AI甚至可以超越人腦。
諸如此類的應用還有很多,數據+AI的核心能力為我們構建了一個發展中的企業服務生態,其中包括行業應用,例如金融、醫療、教育等;另外在每個行業都有交叉的維度,也就是職能應用,例如營銷、客戶關系管理、安全等相關職能。行業應用和職能應用構成二維的矩陣,AI在其中有很多的應用場景。
實踐告訴我們,AI大規模商業應用場景應具備兩個必要條件:1.數據的質量和數量必須達到一定要求,尤其是整個數據流程的打通和定期的數據更新,這決定了AI發展的基礎是否牢固;2.所在領域存在針對問題的清晰定義,如果領域本身沒有明晰的問題定義,則很難通過AI來解決問題。從行業角度來說,金融已經比較接近這兩點;從職能角度來說,營銷、客戶關系管理、安全等一些數字化高的行業比較接近。
作為一個成長中的企業,擁抱AI會面臨一些挑戰。在過去十多年的實踐中,我們發現了一些具有共性的挑戰。
第一,企業必須充分理解數據的價值。許多企業都想利用大數據推進業務發展,然而數據資源就像其他優質資源一樣,是稀缺的。從一開始,企業就需要設計特定的業務、產品和技術架構,確保持續的運營可以沉淀下來相關的數據。對于有一定客戶體量的企業來說,有價值的數據可能已經在你的數據庫里。沒有意識到這點或者不懂得去挖掘數據的價值的企業,會錯失利用AI的機會。
第二,發現和培養AI相關的人才刻不容緩。眾所周知,數據科學家的稀缺對這個新興的領域有很大影響。在國外,諸如InsightData Science這樣的培訓項目,對行業產生了積極的影響。隨著數據科學家的隊伍日益壯大,在企業里從事AI的數據科學家也越來越常見。相較之下,我覺得業界更缺的是AI產品經理。在與國內外很多公司交流過發現,AI問題的復雜性之一在于結果的不確定性,而具備AI背景的產品經理非常少,不能夠很好地判斷價值與方向,進而導致相關產品或項目的擱置。當然這里面也有人才培養的問題,例如我們可以嘗試鼓勵優秀的數據科學家和工程師去主導相關產品的開發,在業務的指引下,充分發揮專業人才的積極性,探索可行的方向。
第三,跨領域團隊的交融與整合是落地的關鍵。打通數據的閉環后,產品、工程、AI的緊密結合,往往需要較長時間的磨合。好比在我們構建AI平臺的經歷中,涉及大量團隊溝通、配合、相互支持的工作。AI能否有效實現,工程能力的建設尤為重要。因為AI不僅是算法問題,如果沒有強大的數據處理基礎設施,那么就很難在大數據中進行持續、大規模的AI應用?;谶@樣的需要,純工程師的團隊和純科學家的團隊,往往都不能最有效地幫助AI落地。只有團隊、業務的深度融合才能創造更大的價值。
第四,AI要想為行業用戶發揮價值,就必須解決信任問題。AI作為新興的思維方式和技術體系,在解決行業實際問題的過程中,一個常見的瓶頸來自于信任的缺乏。這其中的信任就包括了對數據和算法的信任。一定范圍內的數據共享可以增加信任,由此可以帶來全新的知識和洞察。另外,在企業內部的落地場景中,AI的構建者和使用方建立信任也至關重要,這需要在團隊間基于回測或實測的效果,進行經常性而有效的溝通。
在不同的行業和職能落地AI,無論是企業決策者還是執行者,都將面臨各種各樣的問題,其中不乏一些具有共性的挑戰。如果解決了這些挑戰,我相信不僅大企業,中小企業也會有比較大的空間來利用AI升級——運用AI領域的最佳實踐,進行快速概念驗證,在風險可控的前提下落地生產。
丁磊 |文
丁磊是百度金融首席數據科學家,曾任職匯百川征信CTO、PayPal全球消費者數據科學部負責人。