王维汉's picture

5 5 8

王维汉

mactavish91

·

AI & ML interests

None yet

Organizations

None yet

authored 11 papers 5 months ago

Learning the Distribution of Errors in Stereo Matching for Joint Disparity and Uncertainty Estimation

Paper • 2304.00152 • Published Mar 31, 2023

CogVLM: Visual Expert for Pretrained Language Models

Paper • 2311.03079 • Published Nov 6, 2023 • 28

CogAgent: A Visual Language Model for GUI Agents

Paper • 2312.08914 • Published Dec 14, 2023 • 31

CogCoM: Train Large Vision-Language Models Diving into Details through Chain of Manipulations

Paper • 2402.04236 • Published Feb 6, 2024 • 9

ViLTA: Enhancing Vision-Language Pre-training through Textual Augmentation

Paper • 2308.16689 • Published Aug 31, 2023 • 1

CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion

Paper • 2403.05121 • Published Mar 8, 2024 • 24

LVBench: An Extreme Long Video Understanding Benchmark

Paper • 2406.08035 • Published Jun 12, 2024 • 1

CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer

Paper • 2408.06072 • Published Aug 12, 2024 • 39

CogVLM2: Visual Language Models for Image and Video Understanding

Paper • 2408.16500 • Published Aug 29, 2024 • 57

MotionBench: Benchmarking and Improving Fine-grained Video Motion Understanding for Vision Language Models

Paper • 2501.02955 • Published Jan 6 • 44

GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning

Paper • 2507.01006 • Published Jul 1 • 242