Gwanwoo Song's picture

1

Gwanwoo Song

Gwanwoo

·

gwanwoosong

AI & ML interests

Reinforcement Learning & Robot Learning

Organizations

None yet

Papers 1

arxiv:2410.13232

models 10

Gwanwoo/rm_news

Updated Jun 22, 2025

Gwanwoo/align_llama

Text Generation • 1B • Updated May 23, 2025 • 1

Gwanwoo/dpo_orca-dpo_lr1e-5

Updated May 20, 2025

Gwanwoo/sft-llama3-1b-lora-adapter_35k

Updated May 18, 2025

Gwanwoo/sft-qwen2-0.5b-lora-adapter

Updated May 18, 2025

Gwanwoo/filtering_w_noise

Updated May 7, 2025

Gwanwoo/tokenizer_final

Updated May 2, 2025

Gwanwoo/llama_3.2_kor_lowppe_tokenizer

Updated May 2, 2025

Gwanwoo/korean_tokenizer_cleaned_model

Updated May 1, 2025

Gwanwoo/really_naive

Updated Apr 30, 2025

datasets 6

Gwanwoo/RM_News_Trained

Viewer • Updated Jun 21, 2025 • 1.5k • 3

Gwanwoo/ko_wiki_without_high_perplexity

Viewer • Updated May 2, 2025 • 72.7k • 4

Gwanwoo/combined_korean_wiki

Viewer • Updated May 2, 2025 • 68k • 5

Gwanwoo/kor_eng_3_1

Viewer • Updated May 1, 2025 • 59.7k • 5

Gwanwoo/cleaned_english_wiki

Viewer • Updated May 1, 2025 • 14.7k • 7

Gwanwoo/cleaned_korean_wiki

Viewer • Updated May 1, 2025 • 68k • 10