选课选项

大模型技术概论

大模型技术概论

课程修改日期: 31 Jul 2024
  • 课程类型:理论课
  • 开课机构:
  • 适用学历层次:
  • 课时:

本课程旨在为学生提供对大模型,特别是以GPT系列为代表的语言模型的全面理解,涵盖其定义、特性、技术原理及其广泛应用。

从GPT的起源到最新的GPT-4,我们将探讨大模型如何通过海量数据和参数规模展现其独特能力。课程将覆盖多模态大模型的概念,展示它们如何整合文本、图像和声音等多种信息源,创造更加丰富和真实的人机交互体验。

我们将深入研究大模型的训练与优化技术,包括scaling law(规模定律)、预训练与微调策略、强化学习以及偏好对齐方法。此外,还会介绍Long Token技术、网络量化和高效推理技巧,以及如何通过提示词工程和插件增强模型的实用性。

  • 已选课学生: 尚无学生参与此课程
访客不能访问此课程,请登录。