1 | Ryo Kamoi

VisOnlyQA: Large Vision Language Models Still Struggle with Visual Perception of Geometric Information

Ryo Kamoi, Yusen Zhang, Sarkar Snigdha Sarathi Das, Ranran Haoran Zhang, Rui Zhang

GReaTer: Gradients Over Reasoning Makes Smaller Language Models Strong Prompt Optimizers

Sarkar Snigdha Sarathi Das, Ryo Kamoi, Bo Pang, Yusen Zhang, Caiming Xiong, Rui Zhang

Evaluating LLMs at Detecting Errors in LLM Responses

Ryo Kamoi, Sarkar Snigdha Sarathi Das, Renze Lou, Jihyun Janice Ahn, Yilun Zhao, Xiaoxin Lu, Nan Zhang, Yusen Zhang, Ranran Haoran Zhang, Sujeeth Reddy Vummanthala, Salika Dave, Shaobo Qin, Arman Cohan, Wenpeng Yin, Rui Zhang

DocMath-Eval: Evaluating Numerical Reasoning Capabilities of LLMs in Understanding Long Documents with Tabular Data

Yilun Zhao, Yitao Long, Hongjun Liu, Linyong Nan, Lyuhao Chen, Ryo Kamoi, Yixin Liu, Xiangru Tang, Rui Zhang, Arman Cohan

Fair Abstractive Summarization of Diverse Perspectives

Yusen Zhang, Nan Zhang, Yixin Liu, Alexander Fabbri, Junru Liu, Ryo Kamoi, Xiaoxin Lu, Caiming Xiong, Jieyu Zhao, Dragomir Radev, Kathleen McKeown, Rui Zhang

WiCE: Real-World Entailment for Claims in Wikipedia

Models for textual entailment have increasingly been applied to settings like fact-checking, presupposition verification in question …

Ryo Kamoi, Tanya Goyal, Juan Diego Rodriguez, Greg Durrett

Shortcomings of Question Answering Based Factuality Frameworks for Error Localization

Despite recent progress in abstractive summarization, models often generate summaries with factual errors. Numerous approaches to …

Ryo Kamoi, Tanya Goyal, Greg Durrett

Alternative methods for fast and stable GAN

Katsuhiro Endo, Ryo Kamoi, Kenji Yasuoka