Mi történt? Az Alibaba bedobta az új generációs nyílt forráskódú mesterséges intelligenciáját – Qwen3 –, és ezzel konkrétan odapörkölt az OpenAI-nak és DeepSeeknek. A Qwen3 modellek sokak szerint a legjobbak a nyílt modellek között, és bizony már a zárt modelleket is megszorongatják.
Mi az a Qwen3?
Több, mint csak egy modell – ez egy AI arzenál
A Qwen3 nem egyetlen AI-modell, hanem egy komplett széria:
- 8 új modell: 6 dense modell (sima nagy modellek) + 2 Mixture of Experts (MoE), azaz “szakértőkeverék”-alapú agytröszt.
- A MoE lényege, hogy a különböző feladatokra külön szakosodott “mini-modellekből” csak azok lépnek működésbe, amelyek épp szükségesek — így spórol erőforrást, de közben okos marad.
A MoE koncepciót többek közt a Mistral tette népszerűvé – az Alibaba most feltekerte ezt 11-re.

Hybrid Reasoning: Itt az AI “gondolkodó üzemmódja”
A Qwen3 egyik ütőkártyája az úgynevezett hybrid (vagy dynamic) reasoning. Ez azt jelenti, hogy válthatsz:
- Gyors válaszok ↔ Alapos, mély gondolkodás
- Akár egy gombbal: A Qwen Chat felületén ott a “Thinking Mode” kapcsoló.
- Vagy promptban:
/thinkvagy/no_thinkbeépítve a kérdésbe.
Ez az OpenAI „o” modelljeire emlékeztet, de teljesen nyílt forráskóddal.
Teljesítmény: Qwen3 vs. a nagyágyúk
A Qwen3-235B-A22B modell nem csak “nagy”, hanem okos is. Mit jelent ez számokban?
- Több benchmarkot ver, mint:
- OpenAI o1
- DeepSeek R1
- Majdnem utoléri a Google Gemini 2.5-Pro-t
A ArenaHard (500 kérdés programozásból és matematikából) benchmarkban konkrétan veri a versenytársakat.
Multinyelvűség új szinten
Qwen3 már 119 nyelvet és dialektust támogat – ami brutális ugrás, és így világszerte használhatóvá teszi kutatásban, termékekben vagy AI-alapú szolgáltatásokban.
Képzés és technológia – mitől jobb, mint a Qwen2.5?
- 36 billió token – kétszer annyi adat, mint eddig.
- Adatok:
- Webes crawl
- PDF-szerű doksik
- Szintetikus tartalom (kódolás, matek)
- 3+4 fázisos képzési pipeline:
- 3 lépcső pre-train
- 4 lépcső finomhangolás
Az új dense modellek is felérnek vagy lepipálják a régi nagyobb Qwen2.5 modelleket.
Telepítés: Lokál vagy cloud? Mindkettő simán megy!
- Fut Hugging Face, ModelScope, Kaggle, GitHub-on, vagy a saját Qwen Chat appban.
- OpenAI-kompatibilis API? Igen!
- On-premise? Igen, akár laptopon is indul:
- Támogatott: Ollama, LMStudio, MLX, llama.cpp, KTransformers
- Ügynökalapú működés? Jöhet a Qwen-Agent toolkit
égekre optimalizálva
Qwen3 nemcsak fejlesztőknek, hanem cégeknek is ütős választás:
- OpenAI-kompatibilis API-k – gyors átváltás
- LoRA/QLoRA támogatás – saját finomhangolás, adatvédelmi para nélkül
- MoE modellek: 235B paraméterből csak 22B aktív – olyan gyors, mint egy 30B dense, de okosabb
- Apache 2.0 licenc – teljesen kereskedelmi célra is szabadon használható
Export-korlátozásokat érdemes megnézni, mivel kínai fejlesztésű.
Mi jön ezután?
Alibaba nem titkolja: az AGI (mesterséges általános intelligencia) és ASI (szuperintelligencia) a cél.
Tervek:
- Még több adat
- Hosszabb kontextus
- Többféle modalitás (pl. videó, hang)
- Jobb RL-alapú tanítás valódi környezetekből