12月10日孙军：通往大模型安全之路-澳门梅高美登录_澳门美高梅网址_澳门梅高美登录

中文

12月10日孙军：通往大模型安全之路

2024-12-10 11:00:00

活动主题：通往大模型安全之路
主讲人：孙军
开始时间：2024-12-10 11:00:00
举行地点：滴水湖校区国际软件学院
主办单位：软件工程学院

报告人简介

孙军目前是新加坡管理大学（SMU）的终身教授。他于2002年和2006年获得新加坡国立大学计算机科学学士和博士学位。2007年，他获得了李光耀博士后奖学金。他在2010年受聘为教授至今。孙军的研究兴趣包括AI安全、软件工程和形式化方法。他发表了多篇文章和会议论文，包括多个领域的顶级会议。他发布了多款软件分析工具，也担任过多家公司的资深技术顾问。

内容简介

本次演讲将探讨与大模型，特别是大型语言模型（LLMs）相关的关键安全问题，同时介绍我们最近在分析和理解这些挑战方面的研究工作。具体来说，我们将回答以下关键问题。

为什么LLMs的安全对齐常常易受诸如GCG和AutoDAN等攻击的影响？

能够破坏LLM安全对齐的对抗性标记是随机的，还是具有内在意义？

如何在有限的对齐数据下提升LLM的安全性？

我们是否可以编辑LLMs，使其执行我们想要的任务？

是否仅使用良性数据就可以完全消除GPT-4o的安全对齐？本次讨论将深入探讨我们的方法和发现，重点揭示大模型安全的基础与挑战。

澳门梅高美登录_澳门美高梅网址

搜索你想要找的

报告人简介

内容简介

搜索
你想要找的