หลังจาก Seedance 2.0 และ Seedream 5.0 Lite ก่อกระแสต่อเนื่องกันมา Doubao ก็ได้เปิดตัวรุ่นสมบูรณ์ที่เป็นหัวใจหลักของตน นั่นคือ Doubao Large Model 2.0
นี่คือการอัปเดตเวอร์ชันใหญ่ที่สุดในรอบ 21 เดือน
ยกตัวอย่าง Seedance 2.0 มันได้กลายเป็นแอปพลิเคชัน AI ที่ทุกคนได้สัมผัส เราลองทำวิดีโอสั้นๆ ขึ้นมาชิ้นหนึ่ง:
เพียง 5 วินาที ผลลัพธ์ที่สร้างขึ้นก็สมจริงเพียงพอแล้ว
ไม่แปลกใจที่ผู้ใช้ต่างประเทศเริ่มศึกษาวิธีลงทะเบียนด้วยหมายเลขโทรศัพท์จีนเพื่อมาลองใช้

หรืออย่าง Seedream 5.0 Lite ที่รองรับการค้นหาข้อมูลผ่านอินเทอร์เน็ตเป็นครั้งแรก และคุณภาพของภาพที่สร้างขึ้นก็ถึงระดับที่ใช้ในเชิงพาณิชย์ได้:

และในวันนี้ หลังจากโมเดลด้านวิสัยทัศน์ได้รับความนิยมอย่างล้นหลาม ในที่สุด Doubao ก็ได้นำเสนอ “สมอง” ที่เป็นแกนกลางที่สุดของตน นั่นคือ Doubao Large Model 2.0
โดยรวมแล้ว Doubao Large Model 2.0 มีการพัฒนาอย่างเห็นได้ชัดในด้านความเข้าใจหลายรูปแบบ (Multimodal Understanding), เอเจนต์ระดับองค์กร (Enterprise-level Agent), ความสามารถในการให้เหตุผลและเขียนโค้ด:
- ความเข้าใจหลายรูปแบบที่แข็งแกร่งขึ้น: มีประสิทธิภาพโดดเด่นในด้านการรับรู้หลายรูปแบบ, การดึงข้อความความแม่นยำสูง, การทำความเข้าใจแผนภูมิและกราฟ, การเข้าใจพื้นที่และการเคลื่อนไหว, ความรู้และการให้เหตุผลทางภาพ, และการทำความเข้าใจวิดีโอความยาวยาว
- ความสามารถของเอเจนต์ระดับองค์กร: โมเดลสามารถสนับสนุนการทำความเข้าใจและการประยุกต์ใช้ทักษะ (Skills) ได้ดีขึ้น, มีการเสริมความแข็งแกร่งอย่างมีนัยสำคัญในด้าน Function Call, การปฏิบัติตามคำสั่งหลายรอบ, ความสามารถในการค้นหาและเรียกใช้เครื่องมือ, การส่งออกรูปแบบมีความเสถียรมากขึ้น, รองรับการจัดการบริบทที่ยืดหยุ่น, สามารถสนับสนุนงานที่ซับซ้อนและยาวนานในระดับองค์กรได้ดีขึ้น, และแสดงผลดีเยี่ยมในสถานการณ์ต่างๆ เช่น การวิเคราะห์ข้อมูลและเอเจนต์บริการลูกค้า
- ความสามารถในการให้เหตุผลทางคณิตศาสตร์และโค้ด: โมเดลมีความสามารถในการให้เหตุผลที่แข็งแกร่งขึ้น, รองรับความยาวของการคิดที่ปรับได้, และในทุกความยาวของการคิด ประสิทธิภาพของ Token ได้รับการปรับปรุงอย่างมาก ได้รับผลคะแนนเหรียญทองในการทดสอบต่างๆ เช่น ICPC, IMO, CMO
การพัฒนาที่เห็นได้ชัดเจนยิ่งขึ้นปรากฏในการประเมินมาตรฐานประเภทต่างๆ
ตัวอย่างเช่น บรรลุระดับที่ดีที่สุดในอุตสาหกรรมบนมาตรฐานการให้เหตุผลทางคณิตศาสตร์ เช่น MathVista, MathVision, MathKangaroo, MathCanvas ในขณะเดียวกัน บนมาตรฐานการไขปริศนาภาพและการให้เหตุผลเชิงตรรกะ เช่น LogicVista, VisuLogic คะแนนของ Seed2.0 Pro มีการพัฒนาอย่างมีนัยสำคัญเมื่อเทียบกับ Seed1.8

นอกจากนี้ ในแบบทดสอบมาตรฐานต่างๆ เช่น VLMsAreBiased, VLMsAreBlind, BabyVision Doubao Large Model 2.0 ก็ได้คะแนนสูงสุดในอุตสาหกรรมเช่นกัน

สร้าง “มายคราฟต์” ด้วยมือเปล่าในเวลาไม่กี่นาที
ก่อนอื่น เราทดสอบความสามารถในการเขียนโค้ด ซึ่งเป็นจุดสนใจหลักของโมเดลใหญ่ต่างๆ ในช่วงนี้
ในซอฟต์แวร์เขียนโค้ด AI TRAE ของ ByteDance ขณะนี้สามารถสัมผัสความสามารถของ Doubao Large Model 2.0 ได้แล้ว:

เราทดสอบเบื้องต้นด้วยตัวอย่างตัวแก้รูบิค 3D:
ช่วยเขียนอัลกอริทึมสำหรับแก้รูบิคโดยใช้ทฤษฎีกรุ๊ป และสาธิตด้วยหน้าเว็บฟรอนต์เอนด์ โดยให้อินเทอร์เฟซสวยงาม ไฟล์ทั้งหมดในโฟลเดอร์ปัจจุบันสามารถแก้ไข ลบ หรือเขียนทับได้โดยตรง
จะเห็นได้ว่า Doubao Large Model 2.0 เข้าใจอัลกอริทึมอัจฉริยะที่ใช้ทฤษฎีกรุ๊ปได้ดี และแสดงผลได้ดีในด้านภาพและประสบการณ์การโต้ตอบ
เมื่อเผชิญกับงานจำลองทางฟิสิกส์ที่ซับซ้อน ก็ทำได้เช่นกัน:
ต่อไป ทดสอบงานยาวที่ซับซ้อนยิ่งขึ้น นั่นคือเกมเศรษฐี 3D (เลื่อนขึ้นลงเพื่อดู)

ผลลัพธ์ที่สร้างขึ้นมีดังนี้:
Doubao Large Model 2.0 ยังคงทำงานได้อย่างเสถียร
เพิ่มระดับความยากขึ้นอีก ลองสร้าง“มายคราฟต์”โดยตรง (เลื่อนขึ้นลงเพื่อดู):

เช่นเดียวกัน รอเพียงไม่กี่นาที เวอร์ชันเลียนแบบ “มายคราฟต์” ที่มีคุณภาพสูงก็ถือกำเนิดขึ้น:
Doubao อย่างเป็นทางการยังได้แสดงโปรเจกต์ “ตลาดนัดตรุษจีน AI” ที่สร้างขึ้นผ่าน Doubao Large Model 2.0 และ TRAE:
นอกจากนี้ งานจำลองระบบคอมพิวเตอร์ Apple ที่โต้ตอบได้ประเภทนี้ก็สามารถทำได้อย่างง่ายดาย:
นอกจากด้านการเขียนโปรแกรมแล้ว เมื่อเผชิญกับปัญหาที่ซับซ้อนพร้อมแผนภาพ Doubao Large Model 2.0 ก็สามารถรับมือได้อย่างง่ายดาย
ตัวอย่างเช่น ป้อนรูปภาพแบบนี้เข้าไปโดยตรง:

หลังจากรับคำถาม Doubao Large Model 2.0 ก็ให้คำตอบที่ถูกต้องอย่างรวดเร็ว (เลื่อนขึ้นลงเพื่อดู):

ปัญหาคณิตศาสตร์ที่ซับซ้อนในทำนองเดียวกันก็สามารถแก้ไขได้


จากนี้จะเห็นได้ว่า Doubao Large Model 2.0 มีการพัฒนาประสิทธิภาพอย่างเห็นได้ชัดในด้านความสามารถในการให้เหตุผล การเขียนโปรแกรม และการแก้ปัญหาคณิตศาสตร์
ทำไมตอนนี้ถึงเป็นเวลาของ 2.0?
ความรู้สึกที่ชัดเจนที่สุดจากการทดสอบจริงคือ: Doubao Large Model 2.0 กลายเป็น “เสถียร” มากขึ้น
มันไม่จำกัดอยู่แค่การเป็นเพื่อนคุยอีกต่อไป แต่มุ่งมั่นที่จะช่วยเหลือผู้ใช้ให้สำเร็จโครงการหนึ่ง แก้ไขปัญหายากหนึ่ง หรือสร้างโปสเตอร์ระดับพาณิชย์หนึ่งใบ
นี่ก็นำไปสู่คำถามหนึ่ง: ทำไมตอนนี้ถึงเป็นเวลาที่เหมาะสมที่จะเปิดตัวเวอร์ชัน 2.0?
ในปีที่ผ่านมา อุตสาหกรรมโมเดลใหญ่ตกอยู่ในภาวะการแข่งขันด้านพารามิเตอร์และสงครามราคาอย่างวุ่นวาย ในขณะที่ ByteDance ดูเหมือนจะมุ่งมั่นกับการวิจัยและพัฒนาอย่างเงียบๆ การเลือกเปิดตัวเวอร์ชัน 2.0 ในเวลานี้ อาจเป็นเพราะบริษัทได้ก้าวข้ามจุดวิกฤตใหม่ในด้านคุณภาพข้อมูล ประสิทธิภาพการฝึกฝน และผลลัพธ์การประยุกต์ใช้
โดยเฉพาะอย่างยิ่งในสถานการณ์การประยุกต์ใช้เอเจนต์ (Agent)
การประยุกต์ใช้ระดับองค์กรที่แท้จริง ไม่ได้สำเร็จเพียงแค่ผ่านการสนทนา แต่ต้องพึ่งพาการกระทำที่มีประสิทธิภาพ ความสามารถในการเรียกใช้เครื่องมือและการวางแผนงานระยะยาวที่ Doubao Large Model 2.0 แสดงออกมา ชัดเจนว่ากำหนดเป้าหมายไปที่ตลาด ToB และพื้นที่เครื่องมือเพิ่มผลผลิต
แล้วความคุ้มค่าดีขึ้นหรือไม่? คำตอบคือใช่
จากการทดสอบพบว่า แม้ความสามารถจะเพิ่มขึ้น แต่ความเร็วในการให้เหตุผลไม่เกิดความล่าช้าอย่างเห็นได้ชัด ตามรายงานทางเทคนิคแสดงให้เห็นว่า ซีรีส์ Seed-2.0 (รวม Pro, Lite, Mini) ภายใต้ประสิทธิภาพที่เท่ากัน ได้ปรับปรุงประสิทธิภาพของ Token อย่างมากผ่านการปรับปรุงโครงสร้าง
นี่หมายความว่า เมื่อองค์กรนำไปใช้ในงานบริการลูกค้า การวิเคราะห์ข้อมูล หรือการเขียนโค้ด ต้นทุนจะต่ำลง
ปัจจุบัน Doubao Large Model 2.0 ได้เปิดตัวอย่างเต็มรูปแบบแล้ว
ติดตาม Mini Program “Whale Habitat” เพื่อรับข่าวสาร AI ล่าสุด
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/22932
