Qwen3: Alibaba új AI-ja lenyomja az OpenAI-t – nyílt forráskóddal!

2025.04.29.
SZERZŐ: AI TUDÓS

Mi történt? Az Alibaba bedobta az új generációs nyílt forráskódú mesterséges intelligenciáját – Qwen3 –, és ezzel konkrétan odapörkölt az OpenAI-nak és DeepSeeknek. A Qwen3 modellek sokak szerint a legjobbak a nyílt modellek között, és bizony már a zárt modelleket is megszorongatják.

Mi az a Qwen3?

Több, mint csak egy modell – ez egy AI arzenál

A Qwen3 nem egyetlen AI-modell, hanem egy komplett széria:

  • 8 új modell: 6 dense modell (sima nagy modellek) + 2 Mixture of Experts (MoE), azaz “szakértőkeverék”-alapú agytröszt.
  • A MoE lényege, hogy a különböző feladatokra külön szakosodott “mini-modellekből” csak azok lépnek működésbe, amelyek épp szükségesek — így spórol erőforrást, de közben okos marad.

A MoE koncepciót többek közt a Mistral tette népszerűvé – az Alibaba most feltekerte ezt 11-re.

Qwen3: Az Alibaba új AI-ja lenyomja az OpenAI-t?

Hybrid Reasoning: Itt az AI “gondolkodó üzemmódja”

A Qwen3 egyik ütőkártyája az úgynevezett hybrid (vagy dynamic) reasoning. Ez azt jelenti, hogy válthatsz:

  • Gyors válaszokAlapos, mély gondolkodás
  • Akár egy gombbal: A Qwen Chat felületén ott a “Thinking Mode” kapcsoló.
  • Vagy promptban: /think vagy /no_think beépítve a kérdésbe.

Ez az OpenAI „o” modelljeire emlékeztet, de teljesen nyílt forráskóddal.

Teljesítmény: Qwen3 vs. a nagyágyúk

A Qwen3-235B-A22B modell nem csak “nagy”, hanem okos is. Mit jelent ez számokban?

  • Több benchmarkot ver, mint:
    • OpenAI o1
    • DeepSeek R1
  • Majdnem utoléri a Google Gemini 2.5-Pro-t

A ArenaHard (500 kérdés programozásból és matematikából) benchmarkban konkrétan veri a versenytársakat.

Multinyelvűség új szinten

Qwen3 már 119 nyelvet és dialektust támogat – ami brutális ugrás, és így világszerte használhatóvá teszi kutatásban, termékekben vagy AI-alapú szolgáltatásokban.

Képzés és technológia – mitől jobb, mint a Qwen2.5?

  • 36 billió token – kétszer annyi adat, mint eddig.
  • Adatok:
    • Webes crawl
    • PDF-szerű doksik
    • Szintetikus tartalom (kódolás, matek)
  • 3+4 fázisos képzési pipeline:
    • 3 lépcső pre-train
    • 4 lépcső finomhangolás

Az új dense modellek is felérnek vagy lepipálják a régi nagyobb Qwen2.5 modelleket.

Telepítés: Lokál vagy cloud? Mindkettő simán megy!

  • Fut Hugging Face, ModelScope, Kaggle, GitHub-on, vagy a saját Qwen Chat appban.
  • OpenAI-kompatibilis API? Igen!
  • On-premise? Igen, akár laptopon is indul:
    • Támogatott: Ollama, LMStudio, MLX, llama.cpp, KTransformers
  • Ügynökalapú működés? Jöhet a Qwen-Agent toolkit

égekre optimalizálva

Qwen3 nemcsak fejlesztőknek, hanem cégeknek is ütős választás:

  • OpenAI-kompatibilis API-k – gyors átváltás
  • LoRA/QLoRA támogatás – saját finomhangolás, adatvédelmi para nélkül
  • MoE modellek: 235B paraméterből csak 22B aktív – olyan gyors, mint egy 30B dense, de okosabb
  • Apache 2.0 licenc – teljesen kereskedelmi célra is szabadon használható

Export-korlátozásokat érdemes megnézni, mivel kínai fejlesztésű.

Mi jön ezután?

Alibaba nem titkolja: az AGI (mesterséges általános intelligencia) és ASI (szuperintelligencia) a cél.

Tervek:

  • Még több adat
  • Hosszabb kontextus
  • Többféle modalitás (pl. videó, hang)
  • Jobb RL-alapú tanítás valódi környezetekből

Szólj hozzá!