SivakrishnaManoj

Follow

💭

Building

Sivakrishna Manoj SivakrishnaManoj

💭

Building

Follow

Popular repositories Loading

Fine-Tuning-LLMs-using-DPO-for-Prompt-Robustness-in-Educational-Setting Fine-Tuning-LLMs-using-DPO-for-Prompt-Robustness-in-Educational-Setting Public

This paper studies prompt robustness and ambiguity handling for small instruction-tuned LLMs (Qwen2.5-1.5B/3B) in educational tutoring. It evaluates corruption-augmented supervised fine-tuning on G…

Python