al-folio

a simple whitespace theme for academics

Knowledge-Augmented Reasoning distillation for Small Language Models in Knowledge-Intensive Tasks (KARD)

논문 리뷰 - Reasoning, Knowledge Distillation 관련 연구

12 min read · August 20, 2024

2024 · bert fine-tuning gpt knowledge distillation language-model llm neural paper-review reasoning · paper-reviews
Physics of Language Models: Part 2.1, Grade-School Math and the Hidden Reasoning Process

논문 리뷰 - Reasoning, Explainability 관련 연구

15 min read · August 13, 2024

2024 · attention embedding explainability gpt language-model llm paper-review pre-training reasoning transformer · paper-reviews
Knowledge conflict survey

논문 리뷰

16 min read · August 13, 2024

2024 · alignment attention embedding fine-tuning gpt language-model llm paper-review pre-training transformer · paper-reviews
In-Context Retrieval-Augmented Language Models

논문 리뷰 - Retrieval, ICL, In Context Learning 관련 연구

12 min read · July 30, 2024

2024 · attention bert embedding gpt icl in context learning language-model llm paper-review retrieval · paper-reviews
Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning

논문 리뷰 - Reasoning, Reinforcement Learning 관련 연구

12 min read · July 23, 2024

2024 · language-model llm paper-review reasoning reinforcement learning reinforcement-learning rlhf vision · paper-reviews