个人简介

我是张宇东,清华大学电子工程系NICS-EFC实验室的博士生,导师是汪玉教授。我于2020年在清华大学电子工程系获得学士学位,导师是陈健生教授

我的研究重点是提升视觉语言模型的安全性和效率。迄今为止,我已发表了10篇论文,其中4篇以第一作者身份发表在AAAI、ACM-MM和NAACL等学术会议上,这些论文的引用次数为

我目前是腾讯混元团队的实习生,导师是孙兴武谢若冰。我专注于大型语言模型的预训练。

如果您对学术合作感兴趣或希望探讨潜在的研究机会,请随时通过电子邮件联系我zhangyd16@mails.tsinghua.edu.cn

我将于2026年6月毕业,正在寻找工作机会。

🔥 新闻

  • 2025.08: 🎉 我作为第一作者的论文(F3)被ACMMM 2025接收为Oral。
  • 2025.07: 🎉 我作为第一作者的论文(DHCP)被ACMMM 2025接收。
  • 2025.05: 我被清华大学在Twitter和Facebook报道,详见Twitter 1, Twitter 2, Twitter 3, Facebook
  • 2025.04: 我被评为腾讯腾讯技术工程事业群(TEG)机器学习平台部优秀实习生奖。
  • 2025.01: 🎉 我作为第一作者的论文(QAVA)被NAACL 2025接收。
  • 2024.12: 🎉 我作为第一作者的论文(JointAugmentation)被AAAI 2025接收。
  • 2024.07: 🎉 我作为第一作者的论文(PIP)被ACMMM 2024接收为Oral。
  • 2024.04: 我加入了腾讯混元团队实习,我的工作地在北京。

📝 论文发表

(* 表示共同作者,† 表示通讯作者。)

大模型安全性

  • ACM-MM 2024 (Oral) PIP: Detecting Adversarial Examples in Large Vision-Language Models via Attention Patterns of Irrelevant Probe Questions,张宇东,谢若冰†,陈健生†,孙兴武,汪玉† | 代码 | 论文 | 演示文稿 | 视频
  • NAACL 2025 QAVA: Query-Agnostic Visual Attack to Large Vision-Language Models,张宇东,谢若冰†,陈健生†,孙兴武,康战辉,汪玉† | 论文 | 代码 | 视频
  • ACM-MM 2025 DHCP: Detecting Hallucinations by Cross-modal Attention Pattern in Large Vision-Language Models,张宇东,谢若冰†,孙兴武,黄翌青,陈健生†,康战辉,王迪,汪玉† | 论文 | 代码
  • ACM-MM 2025 (Oral) Fighting Fire with Fire (F3): A Training-free and Efficient Visual Adversarial Example Purification Method in LVLMs,张宇东,谢若冰†,黄翌青,陈健生†,孙兴武,康战辉,王迪,汪玉† | 论文

预训练高效性

  • AAAI 2025 Enhancing Contrastive Learning Inspired by the Philosophy of “the Blind Men and the Elephant”,张宇东,谢若冰†,陈健生†,孙兴武,康战辉,汪玉† | 论文 | 代码 | 视频

预印本

  • Arxiv The Security Threat of Compressed Projectors in Large Vision-Language Models,张宇东,谢若冰,孙兴武,陈健生,康战辉,王迪,汪玉 | 论文

其他(非第一作者)

  • ACM-MM 2022 3D Human Mesh Reconstruction by Learning to Sample Joint Adaptive Tokens for Transformers,薛有泽,陈健生†,张宇东,于诚,马惠敏,马洪兵 | 论文

  • CIKM 2023 Transferable Structure-based Adversarial Attack of Heterogeneous Graph Neural Network,商宇,张宇东,陈健生†,金德鹏,李勇 | 论文

  • AAAI 2024 Step Vulnerability Guided Mean Fluctuation Adversarial Attack against Conditional Diffusion Models,余宏伟,陈健生†,丁鑫龙,张宇东,唐挺,马惠敏 | 论文

  • Knowledge-Based Systems (KBS) Image paragraph captioning with topic clustering and topic shift prediction,唐挺,陈健生†,黄翌青,马惠敏,张宇东,余宏伟 | 论文

  • ICCV 2025 DADet: Safeguarding Image Conditional Diffusion Models against Adversarial and Backdoor Attacks via Diffusion Anomaly Detection,余宏伟,丁鑫龙,李嘉伟,王金隆,张宇东,王荣全,马惠敏,陈健生

🎖 荣誉奖项

高亮荣誉

其他荣誉

  • 2022.12 清华大学“一二·九”辅导员奖
  • 2024.12 清华大学电子系研究生“电子之星”(每年评选不超过5人)
  • 2019.12 清华大学电子系本科生“电子之星”(每年评选不超过5人)
  • 清华大学综合优秀奖学金(本科期间2次,博士期间4次)
  • 清华大学科技创新优秀奖,志愿公益优秀奖,社会工作优秀奖(2次),清华之友——长飞奖学金一等奖和二等奖
  • 清华大学优秀学生干部(3次)

📖 教育经历

  • 2020.09 - 至今,直博生,清华大学电子工程系,北京市。
  • 2016.09 - 2020.06,本科生,清华大学电子工程系,北京市。
  • 2013.09 - 2016.06,包头市第九十五中学(包钢第一中学),内蒙古包头市。

💻 实习经历

🔧 专利

中国专利(已授权)

  • Kubernetes 容器访问方法、装置、计算设备及存储介质(2024104387144),汪玉,张宇东
  • 分布式任务动态服务发现方法、装置及任务训练系统(2024104387341),汪玉,张宇东
  • 多用户协同使用图形处理器算力的方法及装置(2024104384428),汪玉,张宇东(发明人登记错误,申请变更中)。
  • 样本净化方法、装置、设备及介质(2024109947320),张宇东,谢若冰,孙兴武,康战辉。
  • 模型幻觉的检测方法、装置、设备、存储介质和程序产品(2024110474366),张宇东,谢若冰,孙兴武,康战辉。

中国专利(申请中)

  • 对抗样本图像生成方法、装置、计算机设备和存储介质(2024110458537),张宇东,谢若冰,孙兴武,康战辉。
  • 文本生成方法、装置、设备及可读存储介质(2024109116223),张宇东,谢若冰,孙兴武,康战辉。
  • 一种图像处理方法及相关设备(2024110598759),张宇东,谢若冰,孙兴武,康战辉。
  • 图像处理方法、装置、设备、可读存储介质及程序产品(2024111072007),张宇东,谢若冰,孙兴武,康战辉。

✍️ 学术服务

审稿人

  • CVPR
  • ICCV
  • ACM-MM
  • ICLR
  • ARR(ACL/EMNLP/NAACL)
  • AAAI