複製鏈接
請複製以下鏈接發送給好友

何曉冬

鎖定
何曉冬 [1] IEEE Fellow、京東集團副總裁、京東探索研究院院長、京東科技智能服務業務部負責人 [23-25]  。何曉冬博士二十多年來從事自然語言處理和語言與視覺多模態智能等人工智能領域的研究,是本領域世界級科學家之一,吳文俊人工智能傑出貢獻獎獲得者。他發表了200多篇論文,引用4萬餘次,並多次獲得ACL傑出論文獎、IEEE SPS Best Paper等獎項。2018年加入京東後,他領導團隊聚焦智能技術的前沿突破及產品創新,打造了 “言犀”人工智能應用平台,孵化了京東智能客服、交互式營銷業務,大規模應用在政務、醫療、零售、金融等行業。 [3] 
中文名
何曉冬
畢業院校
清華大學(本科)
中國科學院(碩士)
美國密蘇里大學哥倫比亞分校(博士)
職    業
科學家
主要成就
國際電氣與電子工程師協會( IEEE ) Fellow [8] 
中國人工智能學會(CAAI)Fellow [8] 
2022年度吳文俊人工智能傑出貢獻獎 [2]  [9] 
AI 2000人工智能全球最具影響力學者 [4] 
中國人工智能產業發展聯盟副理事長 [8] 
職    務
京東集團副總裁、京東探索研究院院長、華盛頓大學兼職教授、京東科技智能服務業務部負責人 [3-4]  [23-25] 

何曉冬人物經歷

何曉冬本科畢業於清華大學,碩士畢業於中國科學院,後赴美國密蘇里大學哥倫比亞分校學習,獲得博士學位後加入微軟。從2012年至今任西雅圖的華盛頓大學電機與計算機系兼任教授、博士生導師。 [4] 
二十載學術生涯中,何曉冬的研究貫穿語音識別、語言理解、圖像與語言多模態信息處理等領域 [4] 
何曉冬曾就職於美國微軟雷德蒙研究院十餘年,擔任首席研究員及深度學習技術中心負責人。 [3] 
2018年加入京東至今,現任京東集團副總裁、京東探索研究院院長 [3]  。加盟京東後,何曉冬一方面在北京、成都、硅谷等地組建語音語義與智能人機交互技術實驗室,聚焦多模態人機對話等前沿課題,另一方面組建智能客服產品部門推動實驗室產出的前沿技術落地到大規模產業應用 [4] 
基於其對自然語言理解和語言與視覺多模態信息處理的貢獻,2018年底何曉冬當選IEEE Fellow。 [4] 

何曉冬社會任職

何曉冬是IEEE Fellow,京東集團技術副總裁,京東人工智能研究院常務副院長,深度學習及語音和語言實驗室的負責人。他還擔任香港中文大學(深圳),華盛頓大學(西雅圖),和同濟大學(上海)兼職教授,以及中央美術學院(北京)的榮譽教授。在加入京東集團之前,他曾擔任微軟雷德蒙德研究院深度學習技術中心的首席研究員和負責人。他的研究主要集中在人工智能領域,包括深度學習,自然語言處理,語音識別,計算機視覺,信息檢索和多模態智能。他發表100餘篇論文, 谷歌學術統計引用數過萬次。他的工作包括深層結構化語義模型(DSSM),分層注意力網絡(HAN),AttnGAN等,廣泛應用於語言,視覺,IR和知識表示等任務。他於2019年入選國際電氣和電子工程師協會院士(IEEE Fellow)。他於1996年獲得清華大學(北京)學士學位,1999年獲得中國科學院(北京)碩士學位,2003年獲得美國密蘇里大學哥倫比亞分校博士學位。 [1] 

何曉冬學術貢獻

何曉冬發表了200多篇論文,引用4 [3]  萬餘次。多次獲得ACL傑出論文獎、IEEE SPS最佳論文獎等獎項。提出多個基礎方法和經典模型,推動和啓發了眾多國內外科技創新 [4] 
2013年,提出了深度結構化語義模型DSSM(Deep Structured Semantic Models),將多樣化的自然語言所表達的含義表示成為一個多維度連續語義空間中的向量,以此來幫助搜索、推薦、分類、問答等實際應用。時至今日,幾乎所有做搜索推薦場景的大廠仍在使用DSSM及其衍生模型。 [4] 
2014年,他與深度學習三巨頭之一Yoshua Bengio等人給IEEE TASLP投稿的《Using RNN for Slot Filling in Spoken Language Understanding》,提出了基於深度循環神經網絡的口語理解模型,為口語理解領域帶來突破。 [4] 
2018年的時候,何曉冬就提出了語言 - 視覺深度多模態語義模型(DMSM),以及在 2018 年進一步提出了現在業界廣為採用的 Bottom-Up and Top-Down attention(BUTD)跨模態注意力機制,單篇引用量已超過 4128 次 [5]  ,一直推動和見證了多模態技術的實用化 [6] 
2018年,何曉冬與沈向洋、李笛等人在中國工程院刊FITEE發表論文《From Eliza to XiaoIce: Challenges and Opportunities with Social Chatbots》,深度探討了構建先進人機對話系統的設計原則,獲得業界廣泛關注,並獲得2018年度優秀論文獎。 [4] 

何曉冬產業貢獻

何曉冬團隊研發的語言和視覺多模態智能機器人三部曲,包括Caption Bot、Attentive VQA、Drawing Bot,為行業貢獻了大量的技術實例。其研究成果對微軟產品如 Office、Seeing AI、搜索及廣告、智能雲服務、微軟小冰等有着重要價值。 [11] 
加入京東後,他先後在北京、成都、硅谷等地組建智能人機交互技術實驗室,並組建了智能客服產品部推動技術的產業化落地。他領導團隊研發了業界第一個大規模商用情感智能客服系統,服務超過5億用户,並在多個行業落地大型企業標杆案例與成功實踐。 [12] 
何曉冬延續了此前在對話式 AI、多模態等領域的研究,牽頭搭建了京東內部大規模對話式 AI 系統的搭建工作,聚焦於To B為主的真實場景的具體問題和任務驅動型的對話。並帶領團隊將一系列研究成果迅速轉化,應用在京東的智能服務業務中,包括知識融合的預訓練模型 K-PLUG、長文本閲讀 Read-over-Read 模型、數值推理 OPERA 模型、時序知識圖譜 TSQA 模型等。 [13] 
何曉冬和團隊研發了產業界第一個大規模商用的情感智能客服系統—言犀,涵蓋客户服務、營銷導購、流程自動化等客户全生命週期管理與服務的智能化解決方案 [4]  。言犀是業界首個大規模商用的情感機器人,依託前沿AI技術,實現了從文字、語音到多模態,從對話智能到情感智能的多元交互模式,通過“在線諮詢機器人”、“語音外呼”、“語音導航”、“語音應答”、“數字人”等在內的產品及服務矩陣,在京東內部,言犀早在強有力的研發力量與京東無可比擬的場景優勢加持下,言犀有足夠的底氣,打磨出業內更出色的智能服務系統——服務5.5億用户,覆蓋近1000萬自營商品SKU,沉澱超過3000萬知識點、7*24小時全渠道秒級響應能力,識別率超過95% [14] 
2022年,何曉冬帶領團隊推出言犀2.0 [17]  ,伴隨着產業數字化的浪潮,作為京東集團最佳實踐的言犀也將自身成熟的能力開放出來,為政務、金融、零售、製造、物流、醫療等千行百業,提供以用户為中心的、涵蓋客户服務、營銷導購、流程自動化的整體智能化解決方案,助力政企客户實現服務和營銷數智化轉型升級 [18] 
在政務行業,推出了京東雲智能政務熱線解決方案,以科技力量助力全國各地政務熱線數智化升級 [19] 
在金融行業,江南農商銀行與京東智能客服言犀共同合作推出的VTM數字員工正式“上崗“,是全國第一個能獨立、全程辦理銀行真實交易的數字人 [20] 
在製造行業,京東雲與中聯重科聯手打造的業內首個“泵送機械AI專家診斷系統”,依託京東智能客服團隊成熟的技術能力,以人工智能技術為驅動實現工業自動化與智能化,極大提升了設備故障診斷效率,有效保障了客户施工的連續性,每年可幫助售後團隊節省故障排查時間4200小時,單次設備維修時間縮短了20%以上,為單產品線創造間接經濟效益超過230萬元 [21] 
2023年7月,何曉冬所帶領研發的言犀大模型正式對外發布,言犀大模型融合了70%的通用數據與30%京東數智供應鏈原生數據,具有“更高產業屬性、更強泛化能力、更多安全保障”的優勢 [15]  ,致力於面向知識密集型、任務型產業場景,解決真實產業問題 [16] 

何曉冬所獲榮譽

ACL傑出論文獎 [3] 
IEEE SPS最佳論文獎 [4] 
2019年獲得多跳推理機器閲讀理解(Wikihop)第一名(Tu, et al. ACL 2019) [10] 
2020年文檔級關係抽取DocRED第一名(Zhou, et al. AAAI21) [10] 
2021年獲得可解釋的多跳推理機器閲讀理解(HotpotQA)第一名(Tu, et al. AAAI 2020) [10] 
2021年獲得多輪對話式機器閲讀理解(QuAC)第一名(Zhao, et al. EMNLP 2021) [10] 
2022年離散推理型閲讀理解榜單DROP Leaderboard冠軍 [10] 
2023年5月6日,中國智能科學技術最高獎“吳文俊人工智能科學技術獎”頒獎典禮在北京舉行,60個獲獎項目及個人受到表彰獎勵。京東集團副總裁、京東探索研究院院長何曉冬獲頒“吳文俊人工智能傑出貢獻獎”。 [2] 

何曉冬人物觀點

產業AI的核心是服務實體行業,在複雜、真實場景中最大化AI價值。 [7] 
何曉冬指出:“在多年的技術落地實踐中,我們意識到,用AI來提升、賦能傳統實體行業才能最大化影響力和應用價值,傳統實體行業的體量足夠大,提升1%就能創造巨大的應用價值。” [7] 
首先,傳統實體產業體量大,新增價值更顯規模化效應。傳統實體行業是國民經濟的重要支柱,已積累的大規模數據可以為Al嵌入提供充足燃料,簡單提升即可創造巨大價值;其次,傳統產業能帶動技術升級的生態鏈裂變,傳統行業已經形成規模化上下游生態,技術變革將牽動整體生態鏈價值提升。 [7] 
除此之外,傳統實體產業轉型積澱深、門檻高、場景複雜,企業需求各異,定製化程度高。傳統實體行業各有特點,需要採集數據、清洗數據等,一個綜合性AI系統遷移成本低、適用能力強,更核心的能夠產生一些實際的價值。 [7] 
產業智能時代,企業應堅定長期投入
相比於通用大模型,何曉冬更看好有產業應用價值的大模型,強調“佈局大模型應結合具體場景,從產業價值出發”。 [22] 
“大模型應該產業化才能產生價值,而且在落地產業的時候必然會遇到很多問題,這樣才能不斷迭代進步。”何曉冬表示。在他看來,“企業擁抱大模型產業機遇,還是要堅持長期主義,堅定長期投入。” [22] 
下一步AGI將走向多模態和具身智能
“理論上視覺信息中每個物體和物體之間的關係動作,甚至包括顏色、姿態、空間關係以及時間關係,都藴含着大量的知識。但目前的知識網絡還是在文字層面,通過調用一個簡單的API實現的多模態,並沒有真正實現語言信息和視覺信息的融合,所以從智能湧現角度來説,深層次融合的程度”,何曉冬表示。 [22] 
何曉冬預測,也許明年或下一代的GPT大模型就能夠做到。多模態的智能湧現一旦突破了,將會有一個很驚豔的效果。“自然語言處理是有語義的,但其實視覺也有語義,從視覺最底層的像素,再往上構造成物體,再往上就變成語義,然後再往上就是整體的融合。我感覺是如果能達到那一步應該會有很多的想象空間,可能真的能夠把整個宇宙數字化了。” [22] 
參考資料
展開全部 收起