个人简介
我是张宇东,清华大学电子工程系的NICS-EFC实验室的博士生,导师是汪玉教授。我于2020年在清华大学电子工程系获得学士学位,导师是陈健生教授。
我的研究重点是提升视觉语言模型的安全性和效率。迄今为止,我已发表了10篇论文,其中4篇以第一作者身份发表在AAAI、ACM-MM和NAACL等学术会议上,这些论文的引用次数为。
我目前是腾讯混元团队的实习生,导师是孙兴武和谢若冰。我专注于大型语言模型的预训练。
如果您对学术合作感兴趣或希望探讨潜在的研究机会,请随时通过电子邮件联系我zhangyd16@mails.tsinghua.edu.cn。
我将于2026年6月毕业,正在寻找工作机会。
🔥 新闻
- 2025.08: 🎉 我作为第一作者的论文(F3)被ACMMM 2025接收为Oral。
- 2025.07: 🎉 我作为第一作者的论文(DHCP)被ACMMM 2025接收。
- 2025.05: 我被清华大学在Twitter和Facebook报道,详见Twitter 1, Twitter 2, Twitter 3, Facebook。
- 2025.04: 我被评为腾讯腾讯技术工程事业群(TEG)机器学习平台部优秀实习生奖。
- 2025.01: 🎉 我作为第一作者的论文(QAVA)被NAACL 2025接收。
- 2024.12: 🎉 我作为第一作者的论文(JointAugmentation)被AAAI 2025接收。
- 2024.07: 🎉 我作为第一作者的论文(PIP)被ACMMM 2024接收为Oral。
- 2024.04: 我加入了腾讯混元团队
实习,我的工作地在北京。
📝 论文发表
(* 表示共同作者,† 表示通讯作者。)
大模型安全性
ACM-MM 2024
(Oral) PIP: Detecting Adversarial Examples in Large Vision-Language Models via Attention Patterns of Irrelevant Probe Questions,张宇东,谢若冰†,陈健生†,孙兴武,汪玉† | 代码 | 论文 | 演示文稿 | 视频NAACL 2025
QAVA: Query-Agnostic Visual Attack to Large Vision-Language Models,张宇东,谢若冰†,陈健生†,孙兴武,康战辉,汪玉† | 论文 | 代码 | 视频ACM-MM 2025
DHCP: Detecting Hallucinations by Cross-modal Attention Pattern in Large Vision-Language Models,张宇东,谢若冰†,孙兴武,黄翌青,陈健生†,康战辉,王迪,汪玉† | 论文 | 代码ACM-MM 2025
(Oral) Fighting Fire with Fire (F3): A Training-free and Efficient Visual Adversarial Example Purification Method in LVLMs,张宇东,谢若冰†,黄翌青,陈健生†,孙兴武,康战辉,王迪,汪玉† | 论文
预训练高效性
AAAI 2025
Enhancing Contrastive Learning Inspired by the Philosophy of “the Blind Men and the Elephant”,张宇东,谢若冰†,陈健生†,孙兴武,康战辉,汪玉† | 论文 | 代码 | 视频
预印本
Arxiv
The Security Threat of Compressed Projectors in Large Vision-Language Models,张宇东,谢若冰,孙兴武,陈健生,康战辉,王迪,汪玉 | 论文
其他(非第一作者)
-
ACM-MM 2022
3D Human Mesh Reconstruction by Learning to Sample Joint Adaptive Tokens for Transformers,薛有泽,陈健生†,张宇东,于诚,马惠敏,马洪兵 | 论文 -
CIKM 2023
Transferable Structure-based Adversarial Attack of Heterogeneous Graph Neural Network,商宇,张宇东,陈健生†,金德鹏,李勇 | 论文 -
AAAI 2024
Step Vulnerability Guided Mean Fluctuation Adversarial Attack against Conditional Diffusion Models,余宏伟,陈健生†,丁鑫龙,张宇东,唐挺,马惠敏 | 论文 -
Knowledge-Based Systems (KBS)
Image paragraph captioning with topic clustering and topic shift prediction,唐挺,陈健生†,黄翌青,马惠敏,张宇东,余宏伟 | 论文 -
ICCV 2025
DADet: Safeguarding Image Conditional Diffusion Models against Adversarial and Backdoor Attacks via Diffusion Anomaly Detection,余宏伟,丁鑫龙,李嘉伟,王金隆,张宇东,王荣全,马惠敏,陈健生
🎖 荣誉奖项
高亮荣誉
- 2025.04 腾讯TEG机器学习平台部优秀实习生奖
- 2024.12 清华大学2024年学生年度人物(每年评选不超过10人)
- 2023.12 清华大学林枫辅导员奖(清华大学“双肩挑”政治辅导员最高荣誉)
- 2018.12 清华大学蒋南翔奖学金(清华大学大三年级本科生最高奖学金)
- 2022.10 清华大学电子系陆大䋮·刘润生优秀助教奖特等奖(清华电子系助教最高奖)
- 2023.10 清华大学优秀学生干部标兵(每年评选不超过30人)
- 2019.11 清华大学十佳志愿者(清华大学志愿者最高荣誉,每两年评选不超过10人)
- 2024.12 电子系冯重熙科研优秀奖学金(奖励在项目中表现突出的在读研究生)
- 2025.04 作为第一完成人完成的项目获得清华大学第三十五届学生实验室建设贡献奖一等奖和三等奖
- 2020.09 作为队长,带领清华大学科技服务队获得谭浩强计算机教育基金奖学金优秀学生团体奖
其他荣誉
- 2022.12 清华大学“一二·九”辅导员奖
- 2024.12 清华大学电子系研究生“电子之星”(每年评选不超过5人)
- 2019.12 清华大学电子系本科生“电子之星”(每年评选不超过5人)
- 清华大学综合优秀奖学金(本科期间2次,博士期间4次)
- 清华大学科技创新优秀奖,志愿公益优秀奖,社会工作优秀奖(2次),清华之友——长飞奖学金一等奖和二等奖
- 清华大学优秀学生干部(3次)
📖 教育经历
- 2020.09 - 至今,直博生,清华大学电子工程系,北京市。
- 2016.09 - 2020.06,本科生,清华大学电子工程系,北京市。
- 2013.09 - 2016.06,包头市第九十五中学(包钢第一中学),内蒙古包头市。
💻 实习经历
- 2024.04 - 至今,腾讯,混元团队
,北京。
- 2023.07 - 2024.01,无问芯穹,基础系统组
,北京。
- 2019.07 - 2019.08,旷视,旷视研究院
,北京。
🔧 专利
中国专利(已授权)
- Kubernetes 容器访问方法、装置、计算设备及存储介质(2024104387144),汪玉,张宇东。
- 分布式任务动态服务发现方法、装置及任务训练系统(2024104387341),汪玉,张宇东。
- 多用户协同使用图形处理器算力的方法及装置(2024104384428),汪玉,张宇东(发明人登记错误,申请变更中)。
- 样本净化方法、装置、设备及介质(2024109947320),张宇东,谢若冰,孙兴武,康战辉。
- 模型幻觉的检测方法、装置、设备、存储介质和程序产品(2024110474366),张宇东,谢若冰,孙兴武,康战辉。
中国专利(申请中)
- 对抗样本图像生成方法、装置、计算机设备和存储介质(2024110458537),张宇东,谢若冰,孙兴武,康战辉。
- 文本生成方法、装置、设备及可读存储介质(2024109116223),张宇东,谢若冰,孙兴武,康战辉。
- 一种图像处理方法及相关设备(2024110598759),张宇东,谢若冰,孙兴武,康战辉。
- 图像处理方法、装置、设备、可读存储介质及程序产品(2024111072007),张宇东,谢若冰,孙兴武,康战辉。
✍️ 学术服务
审稿人
- CVPR
- ICCV
- ACM-MM
- ICLR
- ARR(ACL/EMNLP/NAACL)
- AAAI