Qwen3: Alibaba új AI-ja lenyomja az OpenAI-t – nyílt forráskóddal!

Mi történt? Az Alibaba bedobta az új generációs nyílt forráskódú mesterséges intelligenciáját – Qwen3 –, és ezzel konkrétan odapörkölt az OpenAI-nak és DeepSeeknek. A Qwen3 modellek sokak szerint a legjobbak a nyílt modellek között, és bizony már a zárt modelleket is megszorongatják.

Mi az a Qwen3?

Több, mint csak egy modell – ez egy AI arzenál

A Qwen3 nem egyetlen AI-modell, hanem egy komplett széria:

8 új modell: 6 dense modell (sima nagy modellek) + 2 Mixture of Experts (MoE), azaz “szakértőkeverék”-alapú agytröszt.
A MoE lényege, hogy a különböző feladatokra külön szakosodott “mini-modellekből” csak azok lépnek működésbe, amelyek épp szükségesek — így spórol erőforrást, de közben okos marad.

A MoE koncepciót többek közt a Mistral tette népszerűvé – az Alibaba most feltekerte ezt 11-re.

Qwen3: Az Alibaba új AI-ja lenyomja az OpenAI-t?

Hybrid Reasoning: Itt az AI “gondolkodó üzemmódja”

A Qwen3 egyik ütőkártyája az úgynevezett hybrid (vagy dynamic) reasoning. Ez azt jelenti, hogy válthatsz:

Gyors válaszok ↔ Alapos, mély gondolkodás
Akár egy gombbal: A Qwen Chat felületén ott a “Thinking Mode” kapcsoló.
Vagy promptban: /think vagy /no_think beépítve a kérdésbe.

Ez az OpenAI „o” modelljeire emlékeztet, de teljesen nyílt forráskóddal.

Teljesítmény: Qwen3 vs. a nagyágyúk

A Qwen3-235B-A22B modell nem csak “nagy”, hanem okos is. Mit jelent ez számokban?

Több benchmarkot ver, mint:
- OpenAI o1
- DeepSeek R1
Majdnem utoléri a Google Gemini 2.5-Pro-t

A ArenaHard (500 kérdés programozásból és matematikából) benchmarkban konkrétan veri a versenytársakat.

Multinyelvűség új szinten

Qwen3 már 119 nyelvet és dialektust támogat – ami brutális ugrás, és így világszerte használhatóvá teszi kutatásban, termékekben vagy AI-alapú szolgáltatásokban.

Képzés és technológia – mitől jobb, mint a Qwen2.5?

36 billió token – kétszer annyi adat, mint eddig.
Adatok:
- Webes crawl
- PDF-szerű doksik
- Szintetikus tartalom (kódolás, matek)
3+4 fázisos képzési pipeline:
- 3 lépcső pre-train
- 4 lépcső finomhangolás

Az új dense modellek is felérnek vagy lepipálják a régi nagyobb Qwen2.5 modelleket.

Telepítés: Lokál vagy cloud? Mindkettő simán megy!

Fut Hugging Face, ModelScope, Kaggle, GitHub-on, vagy a saját Qwen Chat appban.
OpenAI-kompatibilis API? Igen!
On-premise? Igen, akár laptopon is indul:
- Támogatott: Ollama, LMStudio, MLX, llama.cpp, KTransformers
Ügynökalapú működés? Jöhet a Qwen-Agent toolkit

égekre optimalizálva

Qwen3 nemcsak fejlesztőknek, hanem cégeknek is ütős választás:

OpenAI-kompatibilis API-k – gyors átváltás
LoRA/QLoRA támogatás – saját finomhangolás, adatvédelmi para nélkül
MoE modellek: 235B paraméterből csak 22B aktív – olyan gyors, mint egy 30B dense, de okosabb
Apache 2.0 licenc – teljesen kereskedelmi célra is szabadon használható

Export-korlátozásokat érdemes megnézni, mivel kínai fejlesztésű.

Mi jön ezután?

Alibaba nem titkolja: az AGI (mesterséges általános intelligencia) és ASI (szuperintelligencia) a cél.

Tervek:

Még több adat
Hosszabb kontextus
Többféle modalitás (pl. videó, hang)
Jobb RL-alapú tanítás valódi környezetekből