複製鏈接
請複製以下鏈接發送給好友

李超

(清華大學信息國家研究中心副研究員)

鎖定
李超,博士,清華大學信息國家研究中心副研究員/信息技術研究院WEB中心副主任/數據科學研究院智慧城市大數據研究中心核心成員 [1]  /倍肯智慧健康大數據聯合研究中心主任。 [2-3] 
中文名
李超
國    籍
中國
民    族
漢族
畢業院校
清華大學
學位/學歷
博士
職    稱
清華大學 副研究員 [2] 

李超研究方向

在數據與知識工程領域,從事海量數據安全高效的存儲、組織、管理與分析及領域應用。 [2-3] 

李超教育經歷

1996.09-2000.07 西安交通大學計算機系 工學學士(外語系英語輔修) [2-3] 
2000.09-2006.07 清華大學計算機系 工學博士 [2-3] 

李超工作經歷

2006.08-2012.12 清華大學 信息技術研究院 助理研究員 [3] 
2012.12-2018.07 清華大學 信息技術研究院 副研究員 [2] 
2018.08-2019.10 清華大學 信息學院 副研究員 [3] 
2015至今 清華大學 信息技術研究院 WEB與軟件技術研究中心 副主任 [2] 
2015至今 清華大學 數據科學研究院 智慧城市大數據研究中心 核心成員(智慧教育) [1-2] 
2018-2019 清華(信研院)-倍肯智慧健康大數據聯合研究中心 主任 [2] 
2016至今 清華大學招生辦公室湖北組 組員 [3] 

李超科研成果

[1] 海量結構化數據:
基於列式存儲的關係型數據庫之前我國既沒有掌握其關鍵技術、也沒有自主知識產權的系統。發表了國內首篇中文綜述《列存儲數據庫關鍵技術綜述》(已被70餘篇國內碩博論文引用)。作為研發骨幹自主研發的華鼎(Huabase)列數據庫委託工信部軟件與集成電路促進中心的賽普評測中心進行了2個月的測試工作,測試結果表明:HuabaseV1.2實現了由工信部、中國軟件測評中心等聯合發佈的《數據庫管理系統測試大綱(V3.0)》的大部分功能。鑑定委員會一致認為:“系統在基於列存儲的數據庫管理系統的架構設計和關鍵技術實現上達到了國際先進水平”;“華鼎數據庫管理系統的研製成功,對推動我國新一代數據庫技術的研究和商業智能分析應用具有重要意義”。在我國做出了開創性的工作。基於上述基礎,承擔南方電網“數據管理和分析決策系統框架設計研究” 項目、在863項目“生物大數據開發與利用關鍵技術研究”中與首都醫科大學附屬安貞醫院共同承擔“心血管疾病大數據平台的構建和應用研究”課題。
[2] 海量非結構化數字資源:
因其數量遠超結構化數據、並不斷攀升,其高效管理、組織等有諸多巨大挑戰。數字圖書館/檔案館是這類數據產生和利用的重要高質量領域之一,並對國家戰略發展有着深遠影響。對數字資源長期安全保存問題,結合我國實際,提出一種綜合監控多種長期保存風險因素的方法及系統實施框架,發表於數字圖書館頂級會議JCDL 2009 (ACM/IEEE-CS Joint Conference on Digital Libraries),為我校實現了零的突破;提出一種數字格式過時風險評估方法,為計算機處理大規模數字資源的長期保存提供關鍵性的支持,發表於具有國際影響力的ICUDL2010(International Conference on Universal Digital Library),作為優秀論文推薦到浙江大學學報英文版(SCI)。作為第一完成人主持起草的《非結構化數據採集及分析規範》 SJ/T11445.4-2017 在工信部作為行業標準已發佈。
[3] 海量分佈式存儲:
海量存儲是各類數據大規模生成、管理和利用的基石。隨着數據規模越來越大,分佈式和網絡化是大勢所趨,系統架構和性能優化是關鍵。提出一種結合性能分析模型對基於存域網的海量存儲系統進行性能監控和預測的方法;針對IO性能優化提出一種自適應的方法和一種基於貝葉斯決策的負載感知方法;獲國家發明專利3項(均已轉讓企業)。作為第二完成人承擔973項目“面向複雜應用環境的數據存儲系統理論與技術基礎”中的課題二“海量數據組織與資源共享的方法研究”,2015年順利結題,正在申報國家級科技獎項。
上述研究面向國家重大需求主要應用於:
(1)數字檔案:對數字檔案憑證性保障,提出基於電子檔案身份證的EAID-PKI安全模型,受北京市科技計劃“基於異構系統的電子檔案憑證性保障核心技術開發與應用”支持。原型驗證系統貫穿6個業務平台、基於10個處理節點、加載200萬條共2TB數據,通過了北京軟件產品質量檢測檢驗中心第三方測試。作為校內第二完成人的 “數字檔案館建設整體方案研究”項目獲國家檔案局優秀科技成果獎(省部級)。
(2)醫療健康:受863“生物大數據開發與利用關鍵技術研究--心血管疾病大數據平台的構建和應用研究”課題支持,與安貞醫院合作研究心血管疾病大數據的高效存儲、處理、分析挖掘和信息安全等關鍵技術。平台包括2400餘萬次就診紀錄、詳情數據近10億條、臨牀數據量達200TB,覆蓋100萬心血管疾病人羣,為提高診治水平提供大數據支撐。成立清華大學(信研院)-倍肯智慧健康大數據聯合研究中心,技術平台服務數據1000萬餘條,產生經濟效益8000萬元。
(3)智慧教育:在智慧教育領域獲得信息化系統工程聯合研究中心、鐵路行業在線教育培訓平台研究與開發、以及教育部在線教育研究中心等項目的支持,先後參與或帶領團隊完成面向高等教育、職業教育、K12教育等細分領域的教育平台設計、原型研發和解決方案驗證,對面向在線教育領域的大數據研究及智慧教育技術的應用方面,帶領團隊進行用户畫像、退課率預測、情感分析、課程評估與推薦等基礎應用研究,及其與青少兒綜合素養及計算思維編程教育結合的應用研究,參與國內外相關標準化工作,發表的相關論文受到國際一流同行的關注、好評和引用。獲清華大學-心神信息化系統工程聯合研究中心支持開展個性化、智能化系統研發,承載課程數據50萬條、應用數據2億條,產生經濟效益15000萬元。
(4)互聯網感知大數據智能:利用智能化技術處理互聯網感知大數據的一系列挑戰性問題,包括互聯網心跳數據獲取、人工智能算法、數據透明可溯、多維對比、可視化分析。已實現中國120萬小區、2861個區縣、336個城市和31個省市的完整網格建模和宏觀數據算法預測與驗證。輸入的數據達到每個區縣5.5萬餘項統計類別、互聯網心跳活動原始量達1.8億個採集點、每日超過2000萬條信息、已積累約70億條信息,實現7*24不間斷處理幾十大類、幾百項子指數。涵蓋超過800種以上業態類別、超過10000種商品的交易情況,以及O2O、房地產、交通、道路、社交媒體、網絡輿情,和人口、環境、產業結構、教育、醫療等方面。中國同類團隊中,我們是首次實現的。目前已經與多家高端智庫達成了數據驅動型新型智庫的技術服務與合作,例如:國務院發展研究中心清華大學國家治理研究院、中國科學院、阿里巴巴城市大腦、SaS(美國最大數據公司)中國總部、以及多家金融、保險等領域上市公司的新型智庫定製服務、和行業戰略諮詢服務。具有技術上起步早、積累多、採集細、覆蓋廣、強實時,數據處理能力上智能化、超高速、專業性、可信度等一系列行業領先優勢。 [3-5]  。基於該技術的“互聯網感知大數據驅動的民生民情智能應用服務”獲工信部2020年大數據產業發展試點示範項目(領域二/方向4 民生大數據創新應用/第54號) [6] 

李超教學工作

事近十年面向全校本科生的計算機公共基礎課教學。 [3] 
[標準化相關]:
2016年-2017年 主持《基於在線教育大數據的學習分析技術及標準預研究》項目(教育部在線教育研究中心資助)
2018年《信息技術 學習、教育和培訓 在線課程》國家標準GB/T36642-2018頒佈,主要起草人
2019年《計算機核心課程規範 計算機程序設計》(全國高等學校計算機教育研究會團體標準),在研,主要起草人
2019年《青少年編程能力等級測評認證體系》標準預研項目(CELTS-201923),在研,框架組負責人
[在線教育相關]:
2015年合作進行《混合式教學課程建設和研究》教學研究課題
2015年學堂在線(xuetangX)MOOC《C++語言程序設計基礎》、《C++語言程序設計進階》兩門課,實驗指導、及綜合實例部分主講教師 前者入選學堂在線2015年最受歡迎MOOC TOP10中的TOP 5。
2016年入選清華2016年公派教師赴牛津大學EMI(English Medium Instruction)課程訓練營,學成結業。
2016年獲學堂在線2016年度“MOOC教學先鋒”稱號。
2016年中國高校計算機教育MOOC聯盟首批10門優秀課程。
2016年清華大學第七屆青年教師教學大賽理工組二等獎
2018年被教育部評選為國家精品在線開放課程 [7] 
2022年基於清華校內產教融合創新課程的《分佈式數據系統基礎與應用》MOOC版本《分佈式數據系統應用實戰-入門》 [23]  和《分佈式數據系統應用實戰-進階》 [24]  上線學堂在線
[課堂教學相關]:
2010年春任《計算機程序設計基礎》合教教師,負責完成了課程題庫建設。
2010年夏任《計算機程序設計基礎》主講教師,課容量120,32學時。
2011年秋-至今 任國家級精品課、精品資源共享課《面向對象的程序設計》主講教師(校內課程名:C++語言程序設計,課組負責人:鄭莉)課容量60,48講授學時+32實驗學時,春季學期/秋季學期。
2012年合作編著的《C++程序設計》由機械工業出版社作為高等院校計算機精品教材系列出版。
2014年被院系推薦為優秀青年教師候選人。
從事十幾年實驗室研究工作合作研究生、訪問學生及博士後三十餘名,SRT項目合作本科生十餘名。 [3] 

李超學術兼職

2010至今中國計算機學會(簡稱CCF,下同)高級會員
2011至今CCF 信息存儲技術專委 委員
2017至今CCF 計算機術語審定工作委員會 責任編輯
2016至今全國信息技術標準化技術委員會 教育技術分技術委員會(SAC/TC28/SC36)專家委員
2016至今ISO/IEC JTC1 SC36 WG8 Learning Analytics Interoperability (學習分析互操作)工作組專家
2016至今中國高等學校計算機教育研究會 對外聯絡委員會 委員
2019至今“大數據與智能計算”產教融合創新社區 秘書
2010至今全國標準化技術委員會(SAC/TC86/SC6)委員
2012至今《計算機應用研究》期刊 創新型重點作者
2016至今工信部 中國信息技術服務標準(ITSS)體系建設報告 國際版 編譯專家
2016至今教育部 科技評價與評審信息系統 評審專家
2016至今北京師範大學 畢業論文校外評閲專家
2018年今中國電子技術標準化研究院 中國人工智能開源軟件發展聯盟專家委員會 委員
2019年今中國青少年宮協會青少年編程能力等級測評專家委員會 專家
以及ICADL、IEEE Healthcom、SSS、ICSH、NCIS、IEEE BigMM、ICCSE等國內外學術會議的組委會或程序委員會成員
多項國標、行標、地標的意見徵求人或評審專家 [3] 

李超獲獎情況

2008年度國家檔案局優秀科技成果三等獎(省部級)
2009年度北京市檔案局優秀科技成果一等獎
2011年、2012年 清華 信研院 先進個人
2016年清華第七屆青年教師教學大賽理工組二等獎
2018年 《C++語言程序設計》被教育部評選為國家精品在線開放課程 [7] 
2008年度--2018年度 清華 信研院 連續數年信息報送優秀個人
2016年、2018年 清華 信研院 教學工作優秀個人
2019年 清華 信研院 黨支部 優秀黨小組長、優秀黨員
2019年 清華大學 大學生研究訓練(SRT)計劃優秀項目一等獎 指導教師 [3] 

李超著作譯作

[1] 部分論文
Chao Li, Chunxiao Xing, Li Dong, Michael Bailou Huang. A Semi-Automatic System for Managing Multiple Digital Preservation Risks of Digital Libraries in China. Proceedings of JCDL2009 (ACM/IEEE-CS Joint Conference on Digital Libraries, Austin, TX, USA, June 2009) PP. 425. EI:20094912522158
LI Chao, ZHENG Xiaohui, MENG Xing*, WANG Li*, XING Chunxiao. A Methodology for Measuring the Preservation Durability of Digital Formats. Journal of Zhejiang University-SCIENCE C (Computers & Electronics). Volume: 11, Issue:11, Nov 2010, PP. 872-881. SCI:698IG , EI:20105113496805
李超,張明博,邢春曉,胡勁松. 列存儲數據庫關鍵技術綜述. 計算機科學 . 2010,37(12):1-7
梁野, 潘林, 李超, 秦穎, 面向大數據的跨語言智慧新聞推薦技術與挑戰, NCIS 2013 (會議優秀論文)
陳池*, 王宇鵬*, 李超, 張勇, 邢春曉, 面向在線教育領域的大數據研究及應用, 《計算機研究與發展》, 2014(S1):67-74
Jiajun Liang*, Jian Yang*, Yongji Wu*, Chao Li, Li Zheng. Big Data Application in Education: Dropout Prediction in Edx MOOCs, IEEE BigMM2016
Mira Shah*, Chao Li, Ming Sheng, Yong Zhang, Chunxiao Xing. CrowdMed: A Blockchain-based Approach to Consent Management for Health Data Sharing. International Conference on Smart Health (ICSH) 2019, June 30-July 2. (best paper award runner-up) [3]  [16] 
Mira Shah*, Chao Li, Ming Sheng,Yong Zhang, Chunxiao Xing. Smarter Smart Contracts: Efficient Consent Management in Health Data Sharing. APWeb-WAIM 2020 (best student paper runner-up) [14]  [15] 
範煬,茆瀚月,李超,左明章. 面向區域教育治理的智能化大數據平台研究.Intelligent Big Data Platform for Regional Education Governance.《現代教育技術》, 2021, v.31;No.245(09) 63-70 [13] 
Zexuan LYU*, Yuchen WANG*, Chao LI, Guigang ZHANG, Chunmei HUANG, Li ZHENG, Mengyuan DU, Yongbo WANG, Qin CHEN, Weimin LI. DaaS: Internet-perception society big data systems based on AI, IEEE BIG DATA 2021 [11] 
Chaochen Hu*, Chao Li, Guigang Zhang, Zhiwei Lei, Mira Shah, Yong Zhang, Chunxiao Xing, Jinpeng Jiang, Renyi Bao. CrowdMed-II: a blockchain-based framework for efficient consent management in health data sharing, WWW (World Wide Web), 2022 [12] 
Zhiyi Yu*, Chao Li, Chaochen Hu*, Zhen Chen, Yandong Yao, Jiang Wu, Hao Wang, Jialun Du, Min Guo, Haoyu Wang, Weimin Li, Xiu Li, Xiaodong Ma, Yisong Zhang, Shuangshou Li. One Case of THOUGHT: Industry-university Converged Education Practice on Open Source [22]  . ICCSE 2022 (best paper award) [17-18] 
李昕航*, 李超, 張桂剛, 邢春曉. 區塊鏈與數據庫技術融合綜述[J]. 計算機科學與探索, DOI: 10.3778/j.issn.1673-9418.2211021. [19-20] 
Xiangke Mao, Chao Li, Yong Zhang, Guigang Zhang, Jiafu Li, Mira Shah, Chunxiao Xing. HuaBaseChain: An Extensible Blockchain with High Performance, IEEE Internet of Things Journal, doi: 10.1109/JIOT.2023.3247584. [21] 
Hu, Chaochen, Zihan Sun, Chao Li, Yong Zhang, and Chunxiao Xing. 2023. "Survey of Time Series Data Generation in IoT" Sensors 23, no. 15: 6976. [25] 
[2] 部分教材及書籍
鄭莉、李超。《C++程序設計》課程教材編著。機械工業出版社,高等院校計算機精品教材系列,2012(北京市精品教材建設項目)
範淼,李超。《Python機器學習及實踐——從零開始通往Kaggle競賽之路》,清華大學出版社,2016 [8]   (多次京東圖書分類排行暢銷榜、今日頭條機器學習推薦圖書、受邀發行英文譯本海外版)
張桂剛,李超,邢春曉。《大數據背後的核心技術》,電子工業出版社, 2017 [3]  [9] 
WenxingHong,ChaoLi,QingWang.Technology-Inspired Smart Learning for Future Education. 29th National Conference on Computer Science Technology and Education, NCCSTE 2019, Kaifeng, China, October 9–11, 2019, Revised Selected Papers.Springer Communications in Computer and Information Science book series (CCIS, volume 1216) [10] 
參考資料
展開全部 收起