Efficient PRM Training Data Synthesis via Formal Verification

Ryo Kamoi, Yusen Zhang, Nan Zhang, Sarkar Snigdha Sarathi Das, Ranran Haoran Zhang, Wenpeng Yin, Rui Zhang

January, 2025

Type

Preprint

Publication

arXiv preprint arXiv:2505.15960

NLP selected

Ryo Kamoi

Ryo Kamoi is a PhD student at Penn State University (2023-). His research interests lie in large language models (LLMs), with a particular focus on the reasoning capabilities and self-improvement of LLMs.