Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

อาลีหยุนเปิดตัว Qwen3.6-Plus อย่างไม่ทันตั้งตัว: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างจี้ติด

อาลีหยุนเพิ่งเปิดตัวโมเดลพื้นฐานขนาดใหญ่รุ่นใหม่ Qwen3.6-Plus โมเดลนี้ทำได้อย่างก้าวกระโดดในด้านความสามารถด้านการเขียนโปรแกรมและเอเจนต์อัจฉริยะ ถือเป็นมาตรฐานใหม่ของโมเดลขนาดใหญ่จีนในสาขานี้

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

Qwen3.6-Plus รองรับความยาวคอนเท็กซ์สูงถึง 1M สามารถแยกย่อยงานที่ซับซ้อน วางแผนเส้นทางการดำเนินงาน ทดสอบและปรับปรุงซ้ำๆ ด้วยตนเองจนบรรลุเป้าหมายได้ ความสามารถ “Vibe Coding” นั้นโดดเด่นเป็นพิเศษ สามารถสร้างโปรเจกต์โค้ดที่สมบูรณ์ตามคำสั่งภาษาธรรมดาง่ายๆ

ก่อนหน้านี้ รุ่นพรีวิวของโมเดลได้เปิดให้บริการบนแพลตฟอร์ม OpenRouter แล้ว การทดสอบจริงแสดงให้เห็นว่า ด้วยคำอธิบายเพียงประโยคเดียว โมเดลสามารถสร้างหน้าเว็บฉากภูเขาหิมะสามมิติที่มีเอฟเฟกต์หิมะตกแบบไดนามิกและสามารถซูมแบบอินเทอร์แอคทีฟได้ภายในไม่กี่วินาที

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ในการประเมินมาตรฐานที่ครอบคลุมการเขียนโปรแกรมเอเจนต์และงานในโลกแห่งความเป็นจริง Qwen3.6-Plus มีประสิทธิภาพใกล้เคียงกับโมเดล Claude ชั้นนำระดับโลก

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

นักพัฒนาที่ได้ทดลองใช้ก่อนล้วนให้ผลตอบรับในเชิงบวก มีผู้ใช้ระบุว่าความเร็วในการตอบสนองและประสบการณ์การสร้างนั้นดีกว่า Claude ยิ่งไปกว่านั้น มีนักพัฒนาทดสอบความทนทาน โดยตรวจสอบความน่าเชื่อถือในหลายๆ รีพอสิทอรีโค้ดที่ซับซ้อน

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด
Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ปัจจุบัน Qwen3.6-Plus ได้เปิดให้บริการบนแพลตฟอร์ม Bailian ของอาลีคลาวด์แล้ว พร้อมเปิดให้บริการ API อย่างเต็มรูปแบบ นอกจากนี้ โมเดลนี้ยังถูกผนวกรวมเข้ากับแอปพลิเคชันและแพลตฟอร์ม AI ของอาลี เช่น Wuzhi, Tongyi Qianwen APP เป็นต้น

ทดสอบจริงความสามารถ Vibe Coding และความเข้าใจหลายรูปแบบ

เมื่อเทียบกับรุ่นก่อนหน้า Qwen3.5 แล้ว Qwen3.6-Plus ได้อัปเกรดความสามารถด้านการเขียนโปรแกรม เอเจนต์อัจฉริยะ และการเรียกใช้เครื่องมืออย่างครอบคลุม

ในการประเมินงานเขียนโปรแกรม เช่น SWE-bench, Terminal-Bench2, NL2Repo และการประเมินความสามารถเอเจนต์ เช่น Claw-Eval, QwenClawBench ประสิทธิภาพของ Qwen3.6-Plus ไล่ตาม Claude Opus 4.5 อย่างจี้ติด บางตัวชี้วัดแสดงผลดีกว่าเสียอีก แซงหน้าโมเดลหลักอื่นๆ ที่มีพารามิเตอร์มากกว่า

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

นอกจากนี้ ด้วยการรองรับคอนเท็กซ์ที่ยาวเป็นพิเศษ โมเดลยังได้รับการปรับให้เหมาะสมกับเฟรมเวิร์กเอเจนต์ต่างๆ เช่น OpenClaw, Qwen Code, Claude Code

ต่อไปนี้เป็นการทดสอบจริงเกี่ยวกับความสามารถหลักของโมเดล เช่น Vibe Coding และความเข้าใจหลายรูปแบบ

ทดสอบจริงความสามารถ Vibe Coding

ขั้นแรก ทดสอบความสามารถ Vibe Coding ด้านการพัฒนาเว็บ เป้าหมายคือใช้คำสั่งภาษาธรรมดาเพียงประโยคเดียว เพื่อสร้าง “เว็บไซต์ปฏิทินข่าวสาร AI” ที่มีฟังก์ชันสมบูรณ์

ช่วยฉันสร้างเว็บไซต์ปฏิทิน AI ที่มีสไตล์ล้ำสมัยหน่อย หน้าแรกเป็นมุมมองปฏิทินรายเดือน แต่ละวันมีเครื่องหมายเหตุการณ์สำคัญ AI ที่เกี่ยวข้อง ผู้ใช้สามารถคลิกวันที่เพื่อเข้าสู่หน้าละเอียดและดูเนื้อหาครบถ้วน รวมถึงหัวข้อเหตุการณ์ คำอธิบายสั้นๆ เวลา และลิงก์แหล่งที่มา

โมเดลสร้างหน้าเว็บที่มีความสมบูรณ์สูงภายในเวลาประมาณสองนาที หน้าตามีความเรียบง่ายและดูล้ำสมัย โครงสร้างปฏิทินชัดเจน รายการข่าวสารแยกด้วยสี ฟังก์ชันอินเทอร์แอคทีฟสมบูรณ์ รองรับการเลื่อนดูเดือน แต่ละวันที่สามารถคลิกเพื่อดูรายละเอียด และมีลิงก์ไปยังบทความต้นฉบับ

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ต่อไป ทดสอบความสามารถในการสร้างฉาก 3 มิติที่ซับซ้อน

สร้างฉากภูเขาหิมะ 3 มิติ โดยมีวัดสไตล์ญี่ปุ่นอยู่กลางภูเขา สไตล์โดยรวมอ้างอิงจาก The Legend of Zelda: Breath of the Wild

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ฉากที่สร้างขึ้นมีสีสันและแสงเงาใกล้เคียงกับสไตล์เป้าหมาย ผู้ใช้สามารถลากเพื่อหมุนมุมมอง 360 องศาได้อย่างอิสระ ใช้ล้อเลื่อนเพื่อซูม และเกล็ดหิมะในฉากมีเอฟเฟกต์การตกลงมาแบบไดนามิก

ทดสอบความสามารถในการสร้างเว็บไซต์เกมอินเทอร์แอคทีฟเพิ่มเติม

ช่วยฉันทำหน้าเว็บเลี้ยงสัตว์เลี้ยงเสมือน เนื้อหาหลักของหน้าคือห้องของสัตว์เลี้ยง ผู้ใช้สามารถเห็นสถานะของมันได้ตลอดเวลา สัตว์เลี้ยงมีค่าความหิว อารมณ์ พลังกาย และค่าการเติบโต ซึ่งจะเปลี่ยนแปลงตามเวลา ผู้ใช้สามารถทำกิจกรรมต่างๆ ในห้องได้ เช่น ให้อาหาร เล่น เล่นน้ำ นอนหลับ เพิ่มอนิเมชันง่ายๆ การเปลี่ยนแปลงสีหน้า เหตุการณ์สุ่ม และระบบภารกิจ เมื่อทำสำเร็จจะได้รับเหรียญเพื่อซื้อไอเทม สไตล์โดยรวมน่ารัก~

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

หน้าที่สร้างขึ้นมีตัวละครสัตว์เลี้ยงที่เคลื่อนตามเมาส์ ด้านขวาของหน้าจอมีแผงสถานะ ฟังก์ชันอินเทอร์แอคทีฟ ระบบภารกิจ และร้านค้า ผู้ใช้สามารถดำเนินการเช่นให้อาหาร เล่น เพื่อส่งผลต่อสถานะสัตว์เลี้ยง

สุดท้าย ทดสอบความสามารถในการสร้างเกมคลาสสิกขนาดเล็ก

สร้างเว็บไซต์เกมจับคู่ (Match-3) แนวการ์ตูนเกี่ยวกับอาหาร

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ด้วยคำสั่งง่ายๆ เพียงประโยคเดียว โมเดลสร้างหน้าเกมที่สมบูรณ์ซึ่งมีแก่นเกมหลัก กลไกการลบแบบต่อเนื่อง UI ภาพ และระบบคะแนน

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ทดสอบจริงความสามารถความเข้าใจหลายรูปแบบ

Qwen3.6-Plus ยังแสดงประสิทธิภาพแข็งแกร่งในด้านความเข้าใจและการให้เหตุผลหลายรูปแบบ

ในการทดสอบ ส่งวิดีโอข่าวสาร AI ที่ค่อนข้างยาวให้โมเดล และขอให้ไม่เพียงแค่วิเคราะห์เนื้อหาหลัก แต่ยังต้องวิเคราะห์สคริปต์แบบทีละวินาที และสร้างบทความโน้ตที่เหมาะสำหรับแพลตฟอร์ม Xiaohongshu ตามนั้น

ช่วยฉันวิเคราะห์เนื้อหาของวิดีโอนี้ ทำการแยกย่อยสคริปต์แบบทีละวินาที และสร้างใหม่จากเนื้อหาวิดีโอเป็นบทความโน้ตที่เหมาะสำหรับโพสต์บน Xiaohongshu ให้เป็นไวรัล:

โมเดลทำการแยกย่อยสคริปต์แบบทีละวินาทีสำเร็จ และวิเคราะห์จากหลายมิติ เช่น ภาพ เนื้อหา วัตถุประสงค์ หลังจากนั้น มันส่งออกบทความ Xiaohongshu ที่มีโครงสร้างสมบูรณ์ ซึ่งรวมถึงตอนเริ่มที่ดึงดูดใจ การสรุปเนื้อหาหลัก การสรุปการค้นพบสำคัญ และตอนจบที่สร้างการมีส่วนร่วม

สุดท้าย ทำการทดสอบที่ท้าทายยิ่งขึ้น: ขอให้โมเดลสร้างหน้าเว็บออนไลน์ที่ใช้งานได้สมบูรณ์ โดยอ้างอิงจากภาพร่างด้วยมือของหน้าเว็บวางแผนการท่องเที่ยว

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ในสถานการณ์ที่แทบไม่มีคำสั่งเป็น文字เลย โมเดลใช้ความเข้าใจหลายรูปแบบเพื่อระบุเลย์เอาต์และองค์ประกอบฟังก์ชันในภาพได้อย่างแม่นยำ หน้าเว็บที่สร้างขึ้นในที่สุดมีประสิทธิภาพด้านภาพ เนื้อหาที่สมบูรณ์ และความสมเหตุสมผลของเลย์เอาต์ดีกว่าภาพร่างต้นฉบับ

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ยังเก่งในสถานการณ์การเขียนโปรแกรมที่ซับซ้อนยิ่งขึ้น

อ่านมาถึงตรงนี้ บางทีผู้อ่านอาจคิดว่าความซับซ้อนของสถานการณ์ข้างต้นมีจำกัด

การทดสอบความสามารถการเขียนโปรแกรมที่เข้มข้นยิ่งขึ้นจึงเริ่มขึ้นทันที

ในความเป็นจริง Qwen3.6-Plus ไม่เพียงแต่สามารถทำ Vibe Coding ตามคำสั่งง่ายๆ วิเคราะห์และดำเนินการเนื้อหาหลายรูปแบบ แต่ยังมีความสามารถในการสร้างหน้าจากเครื่องมือ command line วิเคราะห์ปัญหาโค้ดและปรับโครงสร้างใหม่ รวมถึงพัฒนาซอฟต์แวร์เครื่องมือได้ด้วยตนเอง

ในด้านการสร้างหน้าจาก command line Qwen3.6-Plus รองรับการเรียกใช้ API โดยตรงผ่านเครื่องมือเช่น Cline ผู้ใช้เพียงป้อนคำสั่งสั้นๆ เช่น “สร้าง landing page ตามรีพอสิทอรีโอเพนซอร์ส” ก็สามารถรับโค้ดหน้าเว็บที่สมบูรณ์ได้อย่างรวดเร็ว ทำให้การพัฒนาด้าน front-end เป็นอัตโนมัติอย่างมีประสิทธิภาพ

เราสาธิตโดยใช้โปรเจกต์โอเพนซอร์ส AIRI บน GitHub เป็นตัวอย่าง โปรเจกต์นี้สร้างขึ้นโดยอ้างอิงจาก VTuber Neuro-sama มีฟังก์ชันการสนทนาแบบเรียลไทม์และการเป็นเพื่อนเล่นเกม

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

ผ่านปลั๊กอิน Qwen Code ใน VS Code ฉันให้ Qwen3.6-Plus อ่านเอกสารแนะนำโปรเจกต์นี้โดยตรง ให้มันเข้าใจความต้องการ วางแผนโครงสร้างหน้าเว็บด้วยตนเอง และส่งออกโค้ดที่ใช้งานได้สมบูรณ์ในครั้งเดียว คำสั่งที่ใช้คือ:

สร้าง landing page ตามโปรเจกต์โอเพนซอร์สนี้ ส่งออกเป็น HTML+Tailwind CSS

จากกระบวนการคิดของโมเดล สามารถสังเกตเห็นกระบวนการวิเคราะห์ความต้องการและสร้างไฟล์ทีละขั้นตอนได้อย่างชัดเจน ทั้งกระบวนการสามารถตรวจสอบแบบเรียลไทม์:

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

งานสำเร็จ ใช้เวลาประมาณ 3 นาที Qwen3.6-Plus สร้างหน้าเว็บไซต์อย่างเป็นทางการของโปรเจกต์ โค้ดถูกบันทึกลงไฟล์ landing-page.html โดยอัตโนมัติ:

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

เปิดไฟล์ HTML นี้เพื่อดูผลลัพธ์: หน้าเว็บมีตรรกะชัดเจน แสดงลิงก์ทางเข้าใช้งานชั่วคราว ที่อยู่โอเพนซอร์สของโปรเจกต์ และลิงก์ชุมชนที่เกี่ยวข้อง แถบนำทางมีฟังก์ชันสมบูรณ์ สามารถกระโดดไปยังส่วนต่างๆ เช่น การแนะนำโปรเจกต์ ฟังก์ชันหลัก ผู้ผลิตโมเดลที่รองรับ และขั้นตอนการติดตั้ง

ต่อไป ทดสอบความสามารถ “การวิเคราะห์ปัญหาและการปรับโครงสร้างโค้ด” ของโมเดล

ในเครื่องมือ command line ของ Qwen Code ส่งโค้ด legacy ที่มีปัญหาหลายจุดให้ Qwen3.6-Plus และถามว่า:

ฉันเพิ่ง接手โปรเจกต์นี้ ควรจะปรับปรุงอย่างไรดี?

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

Qwen3.6-Plus เข้าใจตรรกะของโค้ดเดิม และจัดทำรายการปรับปรุงโดยละเอียดด้วยตนเอง สิ่งที่น่าสังเกตคือ ก่อนเริ่มลงมือแก้ไข มันถามก่อนว่า: “ต้องการเริ่มดำเนินการหรือไม่?” วิธีการโต้ตอบแบบนี้แสดงถึงความสามารถในการควบคุมที่ดี

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

หลังจากยืนยัน โมเดลเริ่มแก้ไขโค้ด

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

รายละเอียดที่น่าสนใจคือ ในกระบวนการคิด โมเดลแสดงให้เห็นถึง “การบ่นพึมพำ” แบบมนุษย์ เช่น กล่าวถึง “วาดภาพให้ผู้จัดการผลิตเห็นก่อน แล้วไป push เซิร์ฟเวอร์ ต่อมาก็แกล้งทำเป็นหน้าตาเฉยต่อหน้าเจ้านาย” ดูมีชีวิตชีวามาก

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/28421

Like (0)
Previous 7 hours ago
Next 7 hours ago

相关推荐