【创源大讲堂】Stochastic Second-order Methods for LLMs

来源:交通运输与物流学院 发布日期:2025-04-09 浏览次数:

c0e85c6256fe9eec14522fe3938ff08.png

【讲座名称】

Stochastic Second-order Methods for LLMs

【主讲人】

王天宇,复旦大学上海数学中心青年副研究员

【主讲人介绍】

王天宇博士毕业于杜克大学,本科毕业于香港科技大学。他的主要研究方向为机器学习以及衍生问题。他曾入选上海海外领军人才(现白玉兰计划),并获上海扬帆项目支持。

【讲座内容简介】

Large Language Models (LLMs) have transformed many aspects of our lives, and created numerous opportunities. In this talk, we will explore operational research challenges inherent to LLMs, with a particular focus on a second-order optimization method well-suited for fine-tuning these models. This talk is based on a joint work with Y. Liu, W. Peng and J. Yu.

【时间】

2025年4月11日(周五)上午 10:00

【地点】

西南交通大学犀浦校区交通运输与物流学院 417学术报告厅