李博
职称: 讲师
联系方式:邮箱:deepblue.lb@hebut.edu.cn
教育背景:
2020.09——2024.07 北京大学 软件工程专业,大数据机器学习方向;
2016.09——2019.07 北京邮电大学 控制科学与工程专业,大数据机器学习方向;
2010.09——2014.07 济南大学 控制科学与控制工程专业。
工作履历:
2024.08——至今,永利3044noc,讲师;
2018.06——2020.09,北京大学软件工程国家工程研究中心,科研助理;
2021.09——2022.01,微软亚洲研究院(MSRA)NLC组,研究实习生。
学术兼职:
长期担任 ACL、WWW、EMNLP、SDM、ECAI、COLING 等人工智能领域国际顶级会议及多个人工智能领域期刊审稿人,长期担任ARR滚动评审制审稿人。
研究领域与承担项目:
研究领域:
本人主要研究方向为深度学习、自然语言处理与智慧医疗,主要包括大语言模型与多模态大模型的微调和垂直领域适配、检索增强、输出偏好优化与强化学习、信息抽取、数据增强与数据筛选、多模态语义匹配与图文生成等。
承担或参与项目:
(1)天津市科学技术局,天津市自然科学基金青年项目,基于大模型统一结构化提示的低资源电子病历关键信息抽取研究,2024-10至2026-09,6万元,在研,主持;
(2)河北省教育厅,河北省高等学校科学研究项目青年拔尖人才项目,基于语义一致性约束的半监督大模型电子病历关键信息抽取研究,2025-01至2027-12,10万元,在研,主持;
(3)2021-2024,国家重点研发计划,智慧司法数字大脑共性支撑技术研究,参与。
奖励及荣誉:
(1)2023年北京市科学技术进步奖一等奖,大规模异质知识计算及应用,第一学生获奖人,排名10/15;
(2)研究生国家奖学金;
(3)北京大学学术创新奖;
(4)北京大学华为奖学金;
(5)以队长或团队核心身份获得国内外大数据人工智能竞赛前三名十余次,前十名三十余次,以下列出部分奖项:
[1] CAIL2022 中国司法人工智能大数据竞赛 事件识别赛道,冠军;
[2] WAIC 世界人工智能大会 2021 保险文本视觉认知问答竞赛,亚军;
[3] 阿里巴巴人工智能辅助构建医疗知识图谱大赛,亚军;
[4] CIKM AnalytiCup 2018 跨语言短文本匹配,季军;
[5] Kaggle TGS Salt Identification Challenge 赛题,金牌;
[6] 2017 年 CCF 大数据计算智能大赛 小超市供销存管理优化赛题,冠军。
学术成果:
简述:已发表16 篇各类学术论文,以第一作者(或共同一作)、通讯作者身份共发表和录用12 篇,其中CCF-A 类国际会议论文 5 篇,CCF-B 类国际会议论文 3 篇。Google Scholar 引用量 500 余次,i10 指数11。以下列出已发表(或已公开)论文,*为共同一作,#为通讯作者:
[1] Bo Li, Wei Ye, Quansen Wang, Wen Zhao, Shikun Zhang. Labels Need Prompts Too: Mask Matching for Natural Language Understanding Tasks. AAAI 2024, CCF Rank A, Regular Paper.
[2] Bo Li*, Dingyao Yu*(equal contribution), Wei Ye, Jinglei Zhang, Shikun Zhang. Sequence Generation with Label Augmentation for Relation Extraction. AAAI 2023, CCF A类会议, Regular Paper, Oral.
[3] Bo Li, Wei Ye, Jinglei Zhang, Shikun Zhang.Reviewing Labels: Label Graph Network with Top-k Prediction Set for Relation Extraction. AAAI 2023, CCF A类会议, Regular Paper, Oral.
[4] Bo Li, Wei Ye, Canming Huang and Shikun Zhang. Multi-view Inference for Relation Extraction with Uncertain Knowledge. AAAI 2021, CCF A类会议, Regular Paper.
[5] Wei Ye*, Bo Li*(equal contribution), Rui Xie, Zhonghao Sheng, Long Chen and Shikun Zhang. Exploiting Entity BIO Tag Embeddings and Multi-task Learning for Relation Extraction with Imbalanced Data. ACL 2019, CCF A类会议, Long Paper.
[6] Tong Zhang, Long Zhang, Wei Ye, Bo Li, Jinan Sun, Shikun Zhang, Xiaoyu Zhu and Wen Zhao. Point, Disambiguate and Copy: Incorporating Bilingual Dictionaries for Neural Machine Translation. ACL 2021, CCF A类会议, Long Paper;
[7] Bo Li, Wei Ye, Zhonghao Sheng, Rui Xie, Xiangyu Xi and Shikun Zhang. Graph Enhanced Dual Attention Network for Document-Level Relation Extraction. COLING 2020, CCF B类会议, Long Paper.
[8] Bo Li, Zehua Cheng, Zhenghua Xu, Wei Ye, Thomas Lukasiewicz, Shikun Zhang. Long Text Analysis Using Sliced Recurrent Neural Networks with Breaking Point Information Enrichment. ICASSP 2019, CCF B类会议, Regular Paper.
[9] Bo Li, Kele Xu, Dawei Feng, Haibo Mi, Huaimin Wang, Jian Zhu. Denoising Convolutional Autoencoder based B-mode Ultrasound Tongue Image Feature Extraction. ICASSP 2019, CCF Rank B, Regular Paper.
[10] Bo Li, Zhonghao Sheng, Wei Ye, Jinglei Zhang, Kai Liu and Shikun Zhang. Sliding Hierarchical Recurrent Neural Networks for Sequence Classification. IJCNN 2020, CCF C类会议, Long Paper.
[11] Jinglei Zhang*, Bo Li*(equal contribution), Xixin Cao, Minghui Zhang, Wen Zhao. MixCL: Mixed Contrastive Learning for Relation Extraction. PAKDD2024, CCF Rank C, Regular Paper.
[12] Bo Li, Kele Xu, Xiaoyan Cui, Yiheng Wang, Xinbo Ai, Yanbo Wang. Multi-scale DenseNet-based Electricity Theft Detection. ICIC2018, Regular Paper. (第一作者);
[13] Bo Li, Gexiang Fang, Yang Yang, Quansen Wang, Wei Ye, Wen Zhao, Shikun Zhang. Evaluating ChatGPT's Information Extraction Capabilities: An Assessment of Performance, Explainability, Calibration, and Faithfulness. Arxiv2024.5. (第一作者)
专利:
[1] 基于对偶对比学习的零样本关系抽取方法和系统,已授权;
[2] 基于标签向量正交约束的司法关系要素抽取方法及装置,已授权。