al-folio

a simple whitespace theme for academics

SimPO: Simple Preference Optimization with a Reference-Free Reward

논문 리뷰

11 min read · October 17, 2025

2025 · alignment paper-review rlhf · paper-reviews
Spurious Rewards: Rethinking Training Signals in RLVR

논문 리뷰 - RLVR 관련 연구

20 min read · August 19, 2025

2025 · language-model llm paper-review reasoning reinforcement-learning rlvr vision · paper-reviews
ON THE GENERALIZATION OF SFT: A REINFORCEMENT LEARNING PERSPECTIVE WITH REWARD RECTIFICATION

논문 리뷰 - RL, SFT 관련 연구

13 min read · August 19, 2025

2025 · alignment fine-tuning gpt language-model llm paper-review reinforcement-learning rl rlhf sft · paper-reviews
What Makes a Reward Model a Good Teacher? An Optimization Perspective / The Accuracy Paradox in RLHF: When Better Reward Models Don’t Yield Better Language Models

논문 리뷰 - Reinforcement Learning 관련 연구

1 min read · August 12, 2025

2025 · language-model paper-review reinforcement learning rlhf · paper-reviews
The Accuracy Paradox in RLHF: When Better Reward Models Don’t Yield Better Language Models / What Makes a Reward Model a Good Teacher? An Optimization Perspective

논문 리뷰 - Reinforcement Learning, Reward Model 관련 연구

11 min read · August 12, 2025

2025 · alignment language-model paper-review reinforcement learning reward model rlhf · paper-reviews