junmingyang's picture

junmingyang

jmyang

·

https://junming-yang.github.io/

junming-yang

AI & ML interests

LLM Alignment, VLM

Recent Activity

updated a model about 14 hours ago

jmyang/MetaAPO-Llama3.1-8B

published a model about 14 hours ago

jmyang/MetaAPO-Llama3.1-8B

upvoted a paper about 1 month ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

View all activity

Organizations

None yet

Papers 3

arxiv:2509.23371

arxiv:2407.11691

arxiv:2406.14544

models 1

jmyang/MetaAPO-Llama3.1-8B

0.5B • Updated about 14 hours ago

datasets 0

None public yet