Bytedance เมื่อเร็วๆนี้อย่างเป็นทางการถูกปล่อยตัวอร์ดของดินแดนเวลทั้ง 2.0 บนชุดซึ่งก็คือ systematically ปรับแต่งแล้วสำหรับขนาดใหญ่-ปรับขนาดสภาพแวดล้อมการผลิตและอร์สฝึกถูกออกแบบมาเพื่อจัดการงานที่ซับซ้อนในโลกแห่งความเป็นจริง โดยให้แก่เต็มระยะของขนาดนั้นเป็นมืออาชีพ,ย่อแค่,มินิและรหัส/แสดงตัวอย่างนี้ต่อเนื่อ aims เพื่อให้เป็นมืออาชีพ-อยู่ในระดับรสนับสนุนอย่างมากสำหรัโปรแกรมเหตุการณ์จำลองของต่างออกขนาดและความซับซ้อน.
ที่ Doubao-เมล็ดพันธ์-2.0 บ-มินิย้อนทบทวนในงานเป็นคนไม่สำคัญหรอรุ่นของซีซั่นได้พุ่งเป้าไปที่น้อย latency สู concurrency และค่าใช้จ่าย-อ่อนไหวเหตุการณ์จำลอง,emphasizing เร็วการตอบสนและยืดหยุ่น inference ประจำการ เป็นทางการบอกว่าผลกระทบของรุ่นคือ comparable เพื่อนของ Doubao-เมล็ดพันธ์-1.6,สนับสนุน 256K คอนเท็กซ์,4-ความเร็วคิดว่าความยาวและหลาย modal ความเข้าใจแล้วคือมที่เหมาะสมสำหรับทำงานไม่สำคัญหรอยู่ที่ไหนเสียและความเร็ว prioritized.
มันควรจะเป็นสังเกตว่ามันประเมินผล focuses บของจีนมยังครอบคลุมด้ซ้อมกันและความสามารถของหลาย modal ความเข้าใจมองเห็นใช้เหตุผลกันมานานวีดีโอการประมวลผลน 2.0 บนเมล็ดพันธ์อย่างเป็นทางการ emphasizes ไม่ได้เต็มที่สะท้อนอยู่ในข้อความจากการทดสอบ(งหลาย modal ประเมินผลจะถูกปรับปรุงหลัง).
Doubao-เมล็ดพันธ์-2.0 บ-มินิเวอร์ชั่นการแสดง:
*จำนวนของทดสอบคำถาม:เรื่อง 15,000 ดอลลา
*ทั้งหมดคะแนน(ความถูกต้ออัตรา):71.8%
*ทั่วไปใช้เวลานา(ต่อเรีย):343s
*ตั๋วเข้าใช้งานเฉลี่ย(สิ่งที่แสดงกลือนกินต่อเรีย):3777
*โดยเฉลี่ยราคา(RMB ต่อพันโทรมา):3777*โดยเฉลี่ยราคา(RMB ต่อพันโทรมา):3777*โดยเฉลี่ยราคา(RMB ต่อพันโทรมา):3777*โดยเฉลี่ยราคา(RMB ต่อพันโทรมา): 3777*โดยเฉลี่ยราคา(RMB ต่อพันโทรมา):3777*โดยเฉลี่ยราคา(RMB ต่อพันโทรมา):3777Cost):7 yuan
1 ได้ เมื่อเทียบกับกับทางการ benchmarking นางแบบ
ที่เป็นทางการพูดว่ารุ่นของลูกเล่นของ Doubao-เมล็ดพันธ์-2.0 บ-คือมินิ comparable เพื่อนของ Doubao-เมล็ดพันธ์-1.6 ดังนั้นเราเลือก doubao-เมล็ดพันธ์.-1-6- คิด-250715 คือเคยเป็นวัตถุของเมื่อเทียบกันแล้ว


ข้อมูลแหล่งข่าว:ออกเส้นฉลาด REE ประเมินผล https://github.com/jeinlee1991/chinese-llm-benchmark
ส่งออกราคาหน่วย:yuan/ล้าน
- ที่โดยรวมแล้ว..ยังการแสดงของตั๋วตัวง่ายๆก็คือคนเดียวกันเล็กน้อยและปรับปรุง:ความถูกต้องอัตราของ Doubao-เมล็ดพันธ์-2.0 บ-คือมินิ 71.8%ซึ่งเล็กน้อยสูงกว่าที่ 71.7%ของ comparative ในแบบของความแตกต่างของ 0.1 โดยมีหน่วยเป็นเปอร์เซ็นต์คะแนนซึ่ง verifies ว่าความถูกต้ออัตราการของ Doubao-เมล็ดพันธ์-2.0 บ-คือมินิ 71.8%ซึ่งเล็กน้อยสูงกว่าที่ 71.7% ขอ comparative นคุณครูแต่พอกลับมาเป็นทางการคำให้การของ”ผลกระทบที่ค่อนข้างดี”.
- บางส่วนที่ถูกสำคัญเพิ่มเติม:จากมุมมองขอ subdivided พื้นที่ความสามารถของ”เจ้าหน้าที่และเครื่องมือ invocation”ถูก greatly เพิ่มจาก 54.4%ต้อง 62.8%(+8.4%)ซึ่งสอดคล้องกับเป็นทางการอ้างว่า”การแสดงของรหัสและเจ้าหน้าที่ถูกปรับปรุงสำคัญ”.สอดคล้องกันนะ สนามของ”เงิน”ตกลงมาจาก 84.1%ต้อง 79.7%(-4.4%)และ”การแพทย์และสุขภาพจิตอย่าง”ตกลงมาจาก 87.8%ต้อง 85.5%(-2.3%). มีสิ่งแลกเปลี่-ดู.
- ใช้เหตุผลความสามารถถูกเพิ่ม:”ใช้เหตุผลและรคำนวณทางคณิตศาสตร์”fromThe เพิ่มจาก 76.4%ต้อง 78.8%(+2.4%)สะท้อนถึงที่ optimization ของตัวอย่างแกนความสามารถใช้เหตุผล.
- ภาษาความสามารถรู้จักเล decreased:”ภาษาและ instruction ทำตามข้อตกล”decreased จาก 73.3%ต้อง 64.0%(-9.3%)ที่ลเป็นมากกชัดเจนมาก, ต้องการให้จ่ายเป็นความสนใจอยู่งเผชิญหน้ากับความจริงโปรแกรม
- ค่าเป็นสำคัญเสมอ:การส่งออกหน่วยสิ่งตอบแทนที่ข้าบอกลดเหลือจาก 8.0 yuan/เอ็มตั๋วเข้าใช้งานไป 2.0 บน yuan/เอ็มระลึกค่าต่อพันโทรคือกลดเหลือจาก 15.6 yuan ต้อง 7 yuan และค่าเป็นลดโดยถึง 55%ที่เกี่ยวข้องกับเป็นทางการ”ความถี่สูงง่าย scenarioThe ตำแหน่งของ”สุดยอดต้นทุน effectiveness”.
- ตั๋วเข้าใช้งาน consumption เพิ่มจำนวนที่โดยเฉลี่ยตั๋วเข้าใช้งานกลือนกินต่อโทรหาเพิ่มจาก 2162 จะ 3777(+74.7%)เป็นมากกว่าสำคัญเพิ่ม.
- สำคัญเพิ่มเติมเวลาตอบสนอง ที่ทั่วไปใช้เวลานานเพิ่มจาก 37s จะ 343s นักเพิ่มขึ้นของเรื่อง 827%. นี่อาจจะเป็นที่เกี่ยวข้องกับการปรับแก้ค่าการกของกลไกของมันใช้เหตุผลของรุ่นซึ่งเสียสละนส่วนหนึ่งของการตอบสนองความเร็วขณะติดตามราคา optimization.
2. เปรียบเทียบกับนางแบบ
ได้ยังไง Doubao-เมล็ดพันธ์-2.0 บ-มินิแสดงในปัจจุบัน mainstream ใหญ่-นางแบบการแข่งขันอนห์สก็อตแพ็ทเทิอร์น? เราโกทางแนวนอน comparative การวิเคราะห์จากสามมิติ

ข้อมูลแหล่งข่าว:ออกเส้นฉลาด REE ประเมินผล https://github.com/jeinlee1991/chinese-llm-benchmark
เมื่อเทียบกับเดียวกันเสียเกียร์
- ที่ต่ำต้นทุนขอแสดคือ:ในค่าระยะของ 5-10 yuan/พันครั้ง Doubao-เมล็ดพันธ์-2.0 บ-มินิแสดงค่อนข้าง evenly กับความถูกต้ออัตราการของ 71.8%และค่าใช้จ่ายของ 7 yuan. WithThe เดียวกับแฟ้ม doubao-เมล็ดพันธ์-1-8-251215(71.7%,7.3 Yuan)คือแทบจะเหมือนกัน
- มันมีไม่มากแตกต่างจากที่สูงขึ้นเสียรุ่น:จากมุมมองของทั้งหมดคะแนน,เมื่อเทียบกับกับ hunyuan-2.0 บน-กำลังคิดอยู่-20251109(71.9%,9.5 yuan)มันเป็นแค่ 0.1 โดยมีหน่วยเป็นเปอร์เซ็นต์จุดข้างหลังแต่งค่าใช้จ่ายเป็นเรื่องต่ำลง26%. และ doubao-เมล็ดพันธ์-1-6- คิด-250715(71.7%,15.6 yuan)ได้มีการเดียวกับความถูกต้ออัตราการแต่งแลก 55%ต่ำอีก
- Surpassing คนมีราคานายแบบที่ 71.8%ความถูกต้ออัตราการของ Doubao-เมล็ดพันธ์-2.0 บ-มินิ exceeds นั่นของ GLM-5(71.0%,61.2 yuan),เออร์นี่-5.0(70.9%,89.2 yuan)และอีกสูงขึ้น-ค่าใช้จ่ายวกับพวกนางแบบ
คนใหม่รุ่น
- คนใดมีมุมที่จะไล่ระดับเทียบกับถั่วกระเป๋าผลิตภัณฑ์บนเส้น. ที่ถั่วกระเป๋าเมล็ดพันธ์ 2.0 บนชุดแบบฟอร์มการผลิตภัณฑ์แมททริกซ์จากทิศทางสูงสุดเล่นมืออาชีพ(76.5%,22.5 yuan)ที่ไม่สำคัญหย่อแค่(73.9%,5.4 yuan)เพื่อมินิ(71.8%,7 yuan),ปิดบังแตกต่างเรียกร้องเหตุการณ์จำลอง.
- เปรียบเทียบกับราคาของคนใหม่รุ่นในช่วงเวลาเดียวกัน:งเปรียบเทียบกับที่พึ่งถูกปล่อยตัวคนราศีเมถุน-3.1-มืออาชีพ-แสดงตัวอย่าง(74.8%,250.5 yuan)และ Qwen 3.5-อีกอย่าง(74.6%,22.9 yuan),Doubao-เมล็ดพันธ์-2.0 บ-มินิคเห็นได้ชัดนายได้เปรียบอะไรบ้างในค่าใช้จ่ายที่เหมาะสมสำหรับค่าใช้จ่าย-อ่อนไหวแต่ค่าใช้จ่าย-อ่อนไหวกับพวกนางแบบฉากนั้นยังคงต้องการบางอย่างความถูกต้อราเลยนะ
- ทางแนวนอนเปรียบเทียบของเบารุ่นใหม่ในคอไม่แข็งใหม่ในแบบของ Doubao-เมล็ดพันธ์-2.0 บ-มินิกั Hunyuan-2.0 บน-กำลังคิดอยู่-20251109(71.9%,9.5 yuan)ต้องปิดการแสดงและพวกเขาทั้งสองตำแหน่งรักเป็นค่าใช้จ่าย-ถูกปรับมาให้เหมาะสินค้า.
เปิดแหล่งข่าวกับปิดแล้วแหล่งข่าวเปรียบเทียบ
- การแข่งขันสำหรับเปิดแหล่งข่าวนางแบบเดียวกันอปเกียร์ก็เป็นโต้ตอบอย่างดุเดือดมาก:เปิดแหล่งค่ายกักกันที่ความถูกต้อการเต้นของ GLM-4.7(71.5%,52.5 yuan)และ Kimi-ย k2.5-คิด(71.3%,77.1 yuan)จะใกล้เคียงแต่ต้องเสียงมากมายสูงกว่า Doubao-เมล็ดพันธ์-2.0 บ-มินิ.
- ที่ลึกการค้นหาสมควรต่อเนื่องความสนใจ:DeepSeek-V3.2-คิด(70.9%,7.5 yuan)และ DeepSeek-V3.2-Exp-คิด(70.1%,6.1 yuan)ให้มีการแข่งขันสูงหน่อยเปิดตัวเลือกแหล่งข่าวอยู่ในที่เดียวกับค่าใช้จ่ายวงเล็บปิด.
- นายได้เปรียบอะไรบ้างปิดไปแล้ว-แหล่งเบารุ่น:ที่เป็นต้นทุนของเรื่อง 7 yuan,Doubao-เมล็ดพันธ์-2.0 บ-มินิตอนปิดไปแล้ว-แหล่งโฆษณาในแบบของให้มั่นคงรูปแบบ api การบริการและเทคนิคสนับสนุนซึ่งเหมาะสำหรับยานเอนเตอรไพรสระดับโปรแกรมซ้อมกัน.
เนื้อหาของไซต์นี้ได้รับการแปลโดย AI ช่วยและพิสูจน์อักษรด้วยตนเองหากมีข้อผิดพลาดโปรดระบุให้ถูกต้อง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/22819
