About Me

I am Xuefeng Li(李学峰), currently a PhD student at GAIR Lab, Shanghai Jiao Tong University,advised by Prof. Pengfei Liu.

Previously, I obtained my Bachelor Degree at Beihang University (BUAA), major in computer science.

Research Interests

I an general interested in the field of Large Language Models (LLMs). Currently, I am particularly interested in the Large Language Model Reasoning and Planning.

🔥 News

2025.04: 🔥 Say hi to OctoThinker, a mid-training ablation study in the era of RL scaling.
2025.03: 🔥 Checkout ToRL, tool-integrated RL scaling.
2025.02: 🔥 Checkout LIMR, Less is more for RL scaling.

📖 Selected Publications | Full

Enigmata: Scaling Logical Reasoning in Large Language Models with Synthetic Verifiable Puzzles
Jiangjie Chen*, Qianyu He*, Siyu Yuan*, Aili Chen*, Zhicheng Cai, Weinan Dai, Hongli Yu, Qiying Yu, Xuefeng Li, Jiaze Chen, Hao Zhou, Mingxuan Wang
2025, Blog.
Blog / Code / Resources /

OctoThinker: Revisiting Mid-Training In the Era of RL Scaling
Zengzhi Wang*, Fan Zhou*, Xuefeng Li*, Pengfei Liu
2025, Blog.
Blog / Code / Resources

Generative AI Act II: Test Time Scaling Drives Cognition Engineering
Shijie Xia, Yiwei Qin, Xuefeng Li, Yan Ma, Run-Ze Fan, Steffi Chern, Haoyang Zou, Fan Zhou, Xiangkun Hu, Jiahe Jin, Yanheng He, Yixin Ye, Yixiu Liu, Pengfei Liu
2025, Preprint.
PDF / Code

Torl: Scaling tool-integrated rl
Xuefeng Li*, Haoyang Zou*, Pengfei Liu
2025, Preprint.
PDF / Code

Limr: Less is more for rl scaling
Xuefeng Li*, Haoyang Zou*, Pengfei Liu
2025, Preprint.
PDF / Code

O1 Replication Journey -- Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?
Zhen Huang*, Haoyang Zou*, Xuefeng Li*, Yixiu Liu*, Yuxiang Zheng*, Ethan Chern*, Shijie Xia*, Yiwei Qin, Weizhe Yuan, Pengfei Liu
2025, Preprint.
PDF / Code

O1 Replication Journey: A Strategic Progress Report--Part 1
Yiwei Qin*, Xuefeng Li*, Haoyang Zou*, Yixiu Liu*, Shijie Xia*, Zhen Huang, Yixin Ye, Weizhe Yuan, Hector Liu, Yuanzhi Li, Pengfei Liu
2025, Preprint.
PDF / Code

Synthesizing Verified Mathematical Problems
Xuefeng Li*, Yanheng He*, Pengfei Liu
NeurIPS2024 MATHAI Workshop.
PDF

OpenResearcher: Unleashing AI for Accelerated Scientific Research
Yuxiang Zheng, Shichao Sun, Lin Qiu, Dongyu Ru, Cheng Jiayang, Xuefeng Li, Jifan Lin, Binjie Wang, Yun Luo, Renjie Pan, Yang Xu, Qingkai Min, Zizhao Zhang, Yiwen Wang, Wenjie Li, Pengfei Liu
EMNLP2024.
PDF / Code

Progress or regress? self-improvement reversal in post-training
Ting Wu, Xuefeng Li, Pengfei Liu
ICLR 2025.
PDF / Code

OlympicArena: Benchmarking Multi-discipline Cognitive Reasoning for Superintelligent AI
Zhen Huang, Zengzhi Wang, Shijie Xia, Xuefeng Li, Haoyang Zou, Ruijie Xu, Run-Ze Fan, Lyumanshan Ye, Ethan Chern, Yixin Ye, Yikai Zhang, Yuqing Yang, Ting Wu, Binjie Wang, Shichao Sun, Yang Xiao, Yiyuan Li, Fan Zhou, Steffi Chern, Yiwei Qin, Yan Ma, Jiadi Su, Yixiu Liu, Yuxiang Zheng, Shaoting Zhang, Dahua Lin, Yu Qiao, Pengfei Liu
Neurips2024
PDF / Code / Datasets

Reformatted alignment
Run-Ze Fan, Xuefeng Li, Haoyang Zou, Junlong Li, Shwai He, Ethan Chern, Jiewen Hu, Pengfei Liu
EMNLP2024 Findings.
PDF / Code

Evaluating mathematical reasoning beyond accuracy
Shijie Xia, Xuefeng Li, Yixin Liu, Tongshuang Wu, Pengfei Liu
AAAI2025.
PDF / Code

Mathpile: A billion-token-scale pretraining corpus for math
Zengzhi Wang, Xuefeng Li, Rui Xia, Pengfei Liu
NeurIPS2024.
PDF / Code

Generative ai for math: Abel
Ethan Chern, Haoyang Zou, Xuefeng Li, Jiewen Hu, Kehua Feng, Junlong Li, Pengfei
2024, Github.
Code

Exeperiences

2020.09 - 2024.06, B.S.@BUAA, CS.
2024.09 - 2029.06(Expected), Ph.D.@SJTU, CS.