QVQ-72B-Preview: VLM с ризонингом от Qwen. QVQ-72B-Preview - экспериментальная VLM на основе Qwen2-VL-72B , разработанная Qw
️ QVQ-72B-Preview: VLM с ризонингом от Qwen.
QVQ-72B-Preview - экспериментальная VLM на основе Qwen2-VL-72B , разработанная Qwen, со способностями к аналитическому мышлению и новым уровнем когнитивных навыков.
Проведенная в Qwen оценка QVQ-72B-Preview на бенчмарках MMMU, MathVista, MathVision и OlympiadBench показала результат 70.3 на MMMU, 71.4 на MathVista, 35.9 в MathVision и 20.4 на наборе OlympiadBench, подчеркнув ее способность к комплексному пониманию и рассуждению в мультидисциплинарных задачах.
Несмотря на высокие результаты, QVQ-72B-Preview - предварительная версия модели, которая имеет ограничения:
возможность смешения языков и переключения между ними;
склонность к зацикливанию в логических рассуждениях;
постепенная потеря концентрации на визуальном контенте при многоступенчатом рассуждении, что может приводить к галлюцинациям.
Неофициальные квантованные версии QVQ-72B-Preview в формате GGUF с диапазоном разрядностей от 1-bit () до 8-bit () и MLX-версии от mlx community в разрядностях от 4-bit до 16-bit.
Лицензирование: Qwen License .
Статья
Модель
Demo
Набор GGUF
Набор MLX
Сообщество в Discord
GitHub
1 view
13
9
4 days ago 00:00:37 1
️ QVQ-72B-Preview: VLM с ризонингом от Qwen. QVQ-72B-Preview - экспериментальная VLM на основе Qwen2-VL-72B , разработанная Qw