Qwen (通义千问) — это семейство передовых языковых моделей искусственного интеллекта, разработанных командой Alibaba Cloud. Qwen (also called Tongyi Qianwen, Chinese: 通义千问) is a family of large language models developed by Alibaba Cloud. In July 2024, it was ranked as the top Chinese language model in some benchmarks and third globally behind the top models of Anthropic and OpenAI.
Компания выпустила бета-версию Qwen в апреле 2023 года, а публично модель стала доступна в сентябре того же года. The Qwen3 models support 119 languages, Alibaba said, and were trained on a dataset of over 36 trillion tokens. Особенностью Qwen является приверженность принципам открытого исходного кода — In total, it has released more than 100 open source models, with its models having been downloaded more than 40 million times.
Новейшая серия Qwen3 представляет собой революционный прорыв в области ИИ, предлагая гибридные модели рассуждения. According to Alibaba, the Qwen3 models are "hybrid" models — they can take time to "reason" through complex problems, or answer simpler requests quickly. Модели могут переключаться между режимом глубокого анализа для сложных задач и быстрым режимом для обычных запросов.
Qwen предлагает широкий спектр моделей — от компактных 0.6B параметров до мощных 235B параметров, включая как плотные, так и MoE (Mixture-of-Experts) архитектуры. Alibaba Cloud provides Tongyi Qianwen (Qwen) models, a series of large language models (LLMs) and multimodal models (MLLMs), to the open-source community. Модели превосходно справляются с программированием, математикой, мультиязычными задачами и работой с инструментами, составляя серьезную конкуренцию ведущим западным моделям при значительно меньших затратах на разработку.