AI News

Qwen3 จาก Alibaba โชว์เหนือ ขึ้นแท่นโมเดลโอเพนซอร์สชั้นนำของโลก

โมเดล AI ใหม่จาก Alibaba อย่าง Qwen3 ทำคะแนนแรงเหนือ DeepSeek และเทียบชั้น Gemini 2.5-Pro พร้อมเปิดให้ใช้งานแบบ Open Source

Tiger

Admin

2 นาที

29 เมษายน 2568

AI Qwen3

Qwen3 จาก Alibaba โชว์เหนือ ขึ้นแท่นโมเดลโอเพนซอร์สชั้นนำของโลก

มีข่าวฮอต ๆ ในวงการ AI มาอัปเดตให้ฟังกันอีกแล้วนะ พระเอกวันนี้เป็น Qwen3 จาก Alibaba โมเดล AI ตัวใหม่ล่าสุดที่กำลังมาแรงแซงโค้ง แม้แต่รุ่นพี่ OpenAI กับ DeepSeek ก็ต้องยอมให้

ซึ่ง Qwen3 เขาเปิดตัวมาเป็นซีรีส์ มีทั้งโมเดลแบบผสม (mixture-of-experts) และโมเดลแบบหนาแน่น รวมกันทั้งหมด 8 โมเดลใหม่!

แล้วเจ้าโมเดลแบบผสมคืออะไร? ก็คือการเอาโมเดล AI หลาย ๆ แบบมาไว้ด้วยกัน แล้วเลือกใช้เฉพาะโมเดลที่เก่งเรื่องนั้น ๆ ในตอนนั้น ทำให้มันทำงานได้ฉลาดและมีประสิทธิภาพมากขึ้นนั่นเองครับ ซึ่งเทคนิคนี้ก็ดังมาจาก Mistral สตาร์ทอัพ AI จากฝรั่งเศสครับ

ที่สำคัญคือ เจ้า Qwen3 ตัวท็อป รหัส A22B เนี่ยนะ เก่งถึงขนาดที่ว่าทำคะแนนใน Benchmark ต่าง ๆ ได้ดีกว่า DeepSeek แถมยังไปเทียบชั้นกับ Gemini 2.5-Pro ของ Google ได้เลยด้วย เรียกได้ว่าตอนนี้ Qwen3 กลายเป็นหนึ่งในโมเดล AI ที่ทรงพลังที่สุดในโลกที่เปิดให้ใช้กันได้แบบสาธารณะเลยครับ

Qwen3 เจ๋งยังไง?

Qwen3 มันถูกฝึกมาให้มีความสามารถในการคิดแบบ "Hybrid Reasoning" ด้วย ซึ่งหมายความว่ามันสามารถสลับไปมาระหว่างโหมดตอบเร็ว กับโหมดคิดวิเคราะห์แบบละเอียดได้ คล้าย ๆ กับ OpenAI ที่มีโหมด o นั่นแหละครับ เราสามารถสั่งให้มันใช้ "Thinking Mode" ได้ด้วยคำสั่งพิเศษเวลาใช้งาน

ตอนนี้เราสามารถเข้าไปลองเล่น Qwen3 ได้แล้วหลายช่องทางเลย ไม่ว่าจะเป็น Hugging Face, ModelScope, Kaggle, GitHub หรือจะลองคุยกับมันโดยตรงผ่าน Qwen Chat ก็ได้ แถมโมเดลทั้งหมดนี้ยังเปิดให้ใช้แบบ Open Source ภายใต้สัญญาอนุญาต Apache 2.0 อีกด้วย

นอกจากโมเดล MoE แล้ว Qwen3 ก็ยังมีโมเดล Dense ให้เลือกใช้หลายขนาด ตั้งแต่ 0.6B ไปจนถึง 32B เลย ใครอยากได้โมเดลเล็ก ๆ ไว้รันบน Laptop ก็มีให้ใช้ หรือถ้าใครอยากได้ตัวแรง ๆ ไปรันบน Cloud ก็จัดไปได้เลย ทีว้าวไปกว่านั้นคือ Qwen3 รองรับถึง 119 ภาษาทั่วโลก ทำให้มันเอาไปประยุกต์ใช้ได้หลากหลายมากยิ่งขึ้น

เบื้องหลังความสำเร็จของ Qwen3

ก็คือการพัฒนาต่อยอดมาจาก Qwen2.5 โดยมีการเพิ่มขนาด Dataset ที่ใช้ Train เป็น 36 ล้านล้าน Tokens แถมยังมีการปรับปรุงกระบวนการ Train ให้มีประสิทธิภาพมากขึ้น ทำให้โมเดล Dense ของ Qwen3 เก่งกว่า Qwen2.5 รุ่นใหญ่ ๆ อีก

สำหรับใครที่อยากเอา Qwen3 ไปใช้งานจริง ก็สามารถทำได้ง่าย ๆ ผ่าน Frameworks อย่าง SGLang และ vLLM หรือจะใช้ Tools อย่าง Ollama, LMStudio, MLX, llama.cpp และ KTransformers สำหรับการใช้งานแบบ Local ก็ได้ ส่วนใครที่สนใจเรื่อง Agent AI ก็ลองไปศึกษา Qwen-Agent toolkit ดูได้เลย

ทีมพัฒนา Qwen บอกว่า
'พวกเขาไม่ได้มองว่า Qwen3 เป็นแค่การอัปเกรดธรรมดา ๆ แต่มันคือการก้าวไปอีกขั้นสู่เป้าหมายที่ยิ่งใหญ่กว่า นั่นก็คือ Artificial General Intelligence (AGI) และ Artificial Superintelligence (ASI) หรือ AI ที่ฉลาดกว่ามนุษย์'

ในอนาคต พวกเขามีแผนที่จะขยายขนาดข้อมูลและโมเดลให้ใหญ่ขึ้น พร้อมเพิ่มความสามารถในการประมวลผล Context ให้ยาวขึ้น รองรับ Multimodal มากขึ้น และพัฒนา Reinforcement Learning ให้เก่งขึ้นไปอีกครับ

เรียกได้ว่า Qwen3 เป็นอีกหนึ่งก้าวสำคัญของวงการ AI ที่จะมาช่วยเปิดโลกให้นักวิจัย นักพัฒนา และองค์กรต่าง ๆ ได้สร้างสรรค์นวัตกรรมใหม่ ๆ ได้อย่างไม่หยุดยั้งเลยครับ

ที่มา: https://venturebeat.com/ai/alibaba-launches-open-source-qwen3-model-that-surpasses-openai-o1-and-deepseek-r1/