大模型与安全专题研讨会暨信工所青促会学术沙龙活动圆满结束--中国科学院信息工程研究所

科研动态

大模型与安全专题研讨会暨信工所青促会学术沙龙活动圆满结束

发布时间：2023-12-01

　　大模型与安全专题研讨会暨信工所青促会学术沙龙活动于7月29日上午在新所园区3号楼203会议室成功召开。本次活动邀请到学术界的大模型智谱华章GLM、面壁智能CPM、MOSS和工业界大模型通义千问、文心一言、星火的代表，清华大学李涓子教授、清华大学长聘副教授刘知远教授、复旦大学邱锡鹏教授、科大讯飞副总裁、AI研究院执行院长王士进高级工程师、百度AI技术生态总经理马艳军博士以及阿里巴巴达摩院资深技术专家王巍巍先生做报告。信工所第三研究室虎嵩林研究员担任本次活动主持人，共有200余名所职工和学生参加了此次活动，会场内座无虚席，通道了也站满了听众。

　　会议伊始，信工所人力资源处颜廷锐处长致辞。颜廷锐处长首先向与会嘉宾表示了热烈的欢迎和衷心的感谢，并希望通过本次活动分享大语言模型及其安全的最新研究成果、技术和应用，激发包括研究所青促会会员及优才计划成员在内的青年人才的创新活力，推动重大科学问题研究中的科技创新。

　　颜廷锐处长致辞

　　虎嵩林研究员首先回顾了大模型技术的发展历程，简介了大模型尤其是我国大模型研发的现状，并分析了以GPT为代表的大语言模型的能力及其面临的重大安全挑战。最后从大模型能力和安全两个角度，整体介绍了研讨会的议题安排以及6位特邀嘉宾的演讲主题。

虎嵩林研究员介绍活动目的和意义

　　刘知远教授以《大模型值得关注的重要特性》为主线，重点介绍大模型在参数高效微调、工具学习、模型专家化、多模态、群体智能、安全等若干重要特性，探讨大模型未来的研发应用范式。刘教授提出，以ChatGPT为代表的大模型，仍然面临着非常多的挑战，也有很多新的问题等待我们探索和解决。例如，大模型的训练和部署需要大量的计算资源和时间，而且模型的可解释性和公平性等问题也需要进一步研究和解决。他鼓励学术界和工业界的研究者们共同努力，共同攻克这些挑战，推动大模型的研发和应用，以实现人工智能的进一步发展和创新。

刘知远副教授做主题报告

　　科大讯飞副总裁、AI研究院执行院长、认知智能全国重点实验室副主任王士进博士分享了《讯飞认知智能大模型进展及安全实践》专题报告。王博士首先对大模型技术的技术进行了深入解读，并介绍了讯飞星火大模型的研发过程。为了进一步提高大模型在细分行业的实用性，王博士分享了讯飞’1+N认知智能大模型’的攻关计划，具体介绍了大模型在智慧教育、人机交互、智慧办公等领域带来的应用与创新。王博士的分享为我们提供了宝贵的见解和启示，激发了与会者们对大模型技术和应用的进一步思考和探索。

王士进博士做主题报告

　　李涓子教授做了《面向世界知识的大模型基准评测》的主题报告。李教授首先与现场听众进行了互动问答，引发了同学们热烈的讨论和思考，并向大家介绍了大模型世界知识评估的重要性。李教授强调了大型语言模型在处理自然语言任务时通常依赖于预训练的世界知识，因此，评估模型对世界知识的理解和应用能力有助于揭示其在真实世界中的表现和潜在的局限性。李教授还向大家分享了面向世界知识认知的大模型基准评测（KoLA），并介绍了大模型动态演化的评测基准(chatLog)工作。李教授表示面向世界知识的大模型基准评测将进一步推动大型语言模型的发展。

李涓子教授做主题报告

　　百度飞桨深度学习平台的马艳军博士与大家分享了《深度学习平台+大模型推动通用人工智能创新发展》主题报告。马博士表示深度学习在技术、生态、产业等多个维度已经逐渐成熟，随着大语言模型的创新与发展，“深度学习平台+大模型”正引领新一轮的技术更迭。他重点介绍了百度文心大模型具备跨模态、跨语言的深度语义理解与生成的能力，并基于飞桨深度学习平台赋能能源、金融、通信、媒体等各行各业。相信在马博士和百度团队的努力下，"深度学习平台+大模型"的结合将继续推动通用人工智能的创新发展，为社会带来更多的智能化解决方案和商业机会。

马艳军博士做主题报告

　　复旦大学的邱锡鹏教授做了题为《大模型时代的自然语言处理研究》的专题报告。邱教授认为自然语言处理领域在近几年取得了突破性的进展，进入到大型语言模型时代，主流语言模型逐渐统一到了生成式范式，参数已达百亿规模以上，并显示出极强的通用性。他还分享了大型语言模型时代自然语言处理技术领域的新研究方向，围绕模型能力强化、安全对齐以及可信生成等方面介绍了自己课题组的相关研究工作。这些研究不仅对于学术界的发展有着积极的影响，也对工业界的应用和发展具有指导意义。

邱锡鹏教授做主题报告　　

　　阿里巴巴达摩院资深技术专家王巍巍带来了《大模型规模落地的挑战与路径》的技术报告，他认为ChatGPT被国内熟知后，国内的大模型发展如雨后春笋一般，但要做好大模型的落地，依然要解决诸多挑战，包括模型的训练推理成本、高质量的数据集、匹配大模型特性的创新场景等。报告中，王先生特别强调了数据的重要性，他表示，尽早积累高质量数据可以形成大模型应用壁垒，并基于通义千问的实践分享了大模型落地的挑战和推进路径。期待在各方研究人员的努力下，大模型的落地能够取得更大的突破和进展，为各行各业带来更多创新和改变。

王巍巍资深技术专家做主题报告

　　在这次活动的问答环节中，参会师生提出了许多关于大模型安全性的问题。这些问题广泛涉及了多个议题，包括：如何提升大模型的响应速率、如何防范模型对抗攻击、如何提高模型的可解释性、如何与大规模图数据进行深度结合等等。与会专家学者们对这些问题进行了深入的解答和讨论，并提出了一些新的研究点和具体建议。他们的专业见解，为参会师生的未来研究提供了有益的启发。

学生踊跃提问

　　通过本次会议的交流和分享，我所师生对大模型的能力、安全、评测和落地等问题有了更深入的认识，并获得了许多宝贵的经验和启示。相信这些经验和启示将在未来的大模型研究中发挥重要作用，推动自然语言处理技术的进一步发展。

下一篇：中国科学院信息工程研究所第六研究室9篇论文被EMNLP 2023录用

附件下载 :