Jinyang Wu's picture

Jinyang Wu

Jinyang23

·

https://orcid.org/my-orcid?orcid=0009-0006-0220-616X

jinyangwu

AI & ML interests

large language models, reasoning, agentic rl

Recent Activity

authored a paper about 18 hours ago

SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization

authored a paper about 18 hours ago

Self-Distilled Agentic Reinforcement Learning

authored a paper about 18 hours ago

OPID: On-Policy Skill Distillation for Agentic Reinforcement Learning

View all activity

Organizations

None yet

Papers 17

arxiv:2606.26790

arxiv:2606.13707

arxiv:2606.09131

arxiv:2605.22177

models 5

Jinyang23/OPID-ALFWorld-1.7B

Reinforcement Learning • 2B • Updated 2 days ago • 31 • 1

Jinyang23/Maestro-4B

5B • Updated May 22 • 5

Jinyang23/Spark-1.5B-ScienceWorld

Reinforcement Learning • 2B • Updated Jan 30 • 8

Jinyang23/Spark-1.5B-WebShop

Reinforcement Learning • 2B • Updated Jan 30 • 2

Jinyang23/Spark-1.5B-ALFWorld

Reinforcement Learning • 2B • Updated Jan 30 • 4

datasets 1

Jinyang23/NoiserBench

Preview • Updated May 31, 2025 • 62 • 3