Abdullah's picture

2 8 5

Abdullah

amirali1985

·

amirabdullah19852020

AI & ML interests

Mechanistic interpretability, high dimensional geometry, persona role playing.

Recent Activity

liked a Space 3 days ago

withmartian/spectral_superposition_visualization

updated a Space 3 days ago

withmartian/spectral_superposition_visualization

published a Space 5 days ago

withmartian/spectral_superposition_visualization

View all activity

Organizations

authored a paper almost 2 years ago

Beyond Training Objectives: Interpreting Reward Model Divergence in Large Language Models

Paper • 2310.08164 • Published Oct 12, 2023 • 4