เทนเซ็นต์ ฮุนหยวน Hy3 พรีวิวเปิดตัว: นำโดยเหยา ซุนหยู่ อัปเกรดความสามารถเอเจนต์และโค้ด
บรรณาธิการ: เจ๋อหนาน, หยางเหวิน

เมื่อสักครู่ที่ผ่านมา Tencent Hy3 preview เปิดตัวอย่างเป็นทางการ
นี่คือเวอร์ชันแรกหลังจากทีม Tencent Hunyuan ปรับโครงสร้างสถาปัตยกรรมและโครงสร้างพื้นฐานอย่างสมบูรณ์ โมเดลที่เปิดตัวในชุดแรกมีขนาดค่อนข้างเล็ก โดยเน้นที่การใช้งานจริงมากกว่า
ที่น่าสนใจคือ Hy3 preview เป็นผลงานสำคัญชิ้นแรกหลังจากเหยา ซุนหยู่กลับประเทศจีนและเข้าร่วม Tencent ซึ่งสืบสานแนวคิด “ครึ่งหลังของ AI” ที่เขาเสนอ โมเดลนี้ได้รับการปรับปรุงอย่างต่อเนื่องในธุรกิจจริงและสถานการณ์ที่ซับซ้อนของ Tencent โดยมุ่งเน้นที่ประสิทธิภาพและการใช้งานในสถานการณ์ทางธุรกิจจริง
Tencent ระบุว่าโมเดลรุ่นใหม่มีความสามารถในการสนทนา โค้ด เอเจนต์ การใช้เหตุผลทางคณิตศาสตร์ การปฏิบัติตามคำสั่ง และความเข้าใจบริบทที่ดีขึ้นอย่างมีนัยสำคัญ

ปัจจุบัน Hy3 preview ได้เปิดตัวครั้งแรกในผลิตภัณฑ์ต่างๆ เช่น Tencent Cloud, Yuanbao, ima, CodeBuddy, WorkBuddy, QQ, QQ Browser, Tencent Docs, Tencent Lexiang และอื่นๆ อีกมากมาย ผลิตภัณฑ์หลัก เช่น WeChat Official Accounts, PUBG Mobile, Tencent News, Tencent Self-Selected Stocks, Tencent Customer Service, WeRead ก็กำลังทยอยเชื่อมต่อเช่นกัน
นอกจากนี้ Hy3 preview ยังรองรับการเชื่อมต่อกับผลิตภัณฑ์เอเจนต์โอเพนซอร์สหลัก เช่น OpenClaw, OpenCode, KiloCode และได้วางจำหน่ายบนแพลตฟอร์มบริการโมเดลขนาดใหญ่ของ Tencent Cloud ชื่อ TokenHub
ก่อนวันหยุดวันแรงงาน ทีม AI ทั่วโลกต่างแข่งขันกันอย่างหนัก เราได้เห็น Qwen 3.6 Max Preview ของ Qianwen, Kimi 2.6 ของ Moonshot AI และตามด้วย Xiaomi MiMo-V2.5-Pro ที่เปิดตัวเช่นกัน
แล้วประสิทธิภาพของโมเดลพื้นฐาน Tencent Hunyuan Hy3 preview เป็นอย่างไร? ต่อไปเราจะทำการทดสอบจริง

ทดสอบ Agent อย่างหนัก ภารกิจ “กุ้งมังกร” จะรับมือได้ไหม?
เหยา ซุนหยู่เป็นผู้เสนอเฟรมเวิร์ก ReAct (ตรรกะหลักของเอเจนต์) การปรับปรุงความสามารถด้านโค้ดและเอเจนต์ของ Hy3 preview สอดคล้องกับแนวโน้มทางเทคโนโลยีและความต้องการของตลาดในครึ่งหลังของ Agent
บน WorkBuddy ผู้ช่วยสำนักงาน AI เวอร์ชัน Tencent ผู้ใช้สามารถเรียกใช้เพื่อทำงานต่างๆ เช่น การพัฒนาโค้ด การวิจัยเชิงลึก การจัดการผลิตภัณฑ์ การวิเคราะห์ข้อมูล
ยกตัวอย่างการสืบสวนข่าวลือเกี่ยวกับการระดมทุนของ DeepSeek เราขอให้โมเดลเปรียบเทียบแหล่งข้อมูลที่เชื่อถือได้อย่างน้อย 5 แหล่งที่มีภูมิหลังต่างกัน ระบุข้อเท็จจริงที่ทราบและจุดขัดแย้งทางตรรกะ และให้คะแนนความน่าเชื่อถือ
Hy3 preview สามารถเริ่มการค้นหาหลายขั้นตอนได้อย่างอิสระ ดำเนินการห่วงโซ่การให้เหตุผลที่ยาวนาน จัดระบบความขัดแย้งระหว่างแหล่งข้อมูลอย่างเป็นระบบ และสุดท้ายสร้างรายงานการสืบสวนที่เป็นกลางและเป็นกลาง โดยไม่ต้องมีการแทรกแซงจากมนุษย์ตลอดกระบวนการ
ต่อไป เราขอให้มันเชื่อมต่ออินเทอร์เน็ตเพื่อรับข้อมูลจากกองประชากรแห่งสหประชาชาติ และดำเนินการวิเคราะห์ภาพ “การเปลี่ยนแปลงโครงสร้างประชากรโลก” ซึ่งเป็นงานที่ซับซ้อนซึ่งเกี่ยวข้องกับการรับข้อมูล การทำความสะอาด การวิเคราะห์ และการนำเสนอด้วยภาพ Hy3 preview ก็ทำได้ค่อนข้างราบรื่นเช่นกัน และสุดท้ายก็ส่งออกแผนภูมิที่เข้าใจง่ายและข้อความวิเคราะห์
ในการทดสอบความสามารถด้านโค้ด เราขอให้โมเดลสร้างเกมเว็บ “Happy Match” ผลลัพธ์ที่ได้มีภาพสวยงาม ตรรกะสมบูรณ์ สามารถทำงานได้ตามปกติ และคุณภาพโดยรวมเกินความคาดหมาย
พูดคุย เล่าเรื่อง… พื้นฐานของมันแน่นแฟ้นแค่ไหน?
เช่นเดียวกับโมเดลขนาดใหญ่อื่นๆ Tencent Hunyuan ก็แยกโหมดต่างๆ เช่นกัน: การคิดเร็วให้คำตอบได้เร็วกว่า ในขณะที่การคิดเชิงลึกทำให้ Yuanbao คิดได้ละเอียดขึ้นและคำตอบมีคุณภาพดีขึ้น ในการทดสอบนี้ เราเลือกการคิดเชิงลึกทั้งหมด

การอัปเกรดครั้งนี้เน้น “การใช้งานจริง” เรามาลองพูดคุยกับมันก่อน
บ่นกับ Hy3 preview ว่าช่วงนี้ตัวเองโง่ลง มันจะคอยปลอบใจอย่างอดทน วิเคราะห์สาเหตุว่าอาจนอนน้อย เครียดงาน หรือดูคลิปสั้นมากเกินไป และให้คำแนะนำ 3 ข้อ

เมื่อพูดถึงการเขียนบทความไม่มีไอเดีย มันสามารถเชื่อมต่อบริบทของการสนทนาได้อย่างเป็นธรรมชาติ ปรับน้ำเสียงและความลึกของคำตอบตามสภาวะอารมณ์ของผู้ใช้ในขณะนั้น และให้คำแนะนำในการสร้างสรรค์ที่ตรงจุด

นอกจากนี้ มันยังสามารถให้คุณค่าทางอารมณ์สูงสุด ชมคนได้หลากหลายรูปแบบ

ก่อนหน้านี้ Zhihu ได้เริ่มการอภิปราย “AI เชิญรับมือ” ซึ่งรวบรวมคำถามที่ยากและมักทำให้ AI พลาด หนึ่งในนั้นคือ “เพิ่งรู้ปีนี้ว่าตอนพ่อแม่แต่งงานไม่ได้เชิญฉัน ฉันเสียใจมาก怎么办?”
โมเดลขนาดใหญ่หลายตัวถูกหลอกเข้าไป โดยมองข้ามตรรกะพื้นฐานที่ว่าตอนพ่อแม่แต่งงานลูกยังไม่เกิด แต่ Hy3 preview สังเกตเห็นช่องโหว่นี้อย่างเฉียบแหลม ช่วยนำทางผู้ใช้ให้จัดการอารมณ์ แสดงให้เห็นถึงความสามารถในการใช้เหตุผลเชิงสามัญสำนึกและความเห็นอกเห็นใจที่แข็งแกร่ง

มาลองเขียนเชิงสร้างสรรค์กัน
ช่วงที่ผ่านมา ภาพนักบินอวกาศ NASA มองโลกผ่านหน้าต่างห้องโดยสารหลักของยาน Orion กลายเป็นไวรัลบนโซเชียลมีเดีย

เราขอให้ Hy3 preview เขียนแคปชั่น朋友圈 5 รายการสำหรับภาพนี้ มันวิเคราะห์บรรยากาศของภาพก่อน เลือกจุดอารมณ์ เช่น ความโดดเดี่ยวและน่าทึ่ง ความเคารพต่อโลก ความเล็กและยิ่งใหญ่ของมนุษย์ และสร้างแคปชั่นสไตล์ต่างๆ ทั้งแนวศิลปะและปรัชญา แต่ละรายการสามารถนำไปใช้ได้ทันที
[ เลื่อนขึ้นลงเพื่อดูเพิ่มเติม ]
ในด้านการเลียนแบบสไตล์การเขียน เราขอให้มันสร้างเรื่องสั้นในสไตล์ของ O. Henry
[ เลื่อนขึ้นลงเพื่อดูเพิ่มเติม ]
ในด้านความสามารถในการค้นหา เราขอให้ Hy3 preview สืบสวนสาเหตุที่ Meta บังคับรวบรวมข้อมูลการป้อนเมาส์และคีย์บอร์ด มันอ้างอิงแหล่งข้อมูลที่เชื่อถือได้อย่างรวดเร็วและให้คำตอบที่ชัดเจนและตรวจสอบได้
ไม่ว่าจะเป็นการค้นหาข่าว นโยบาย หรือตรวจสอบข้อมูลเฉพาะ โดยรวมแล้วประสิทธิภาพค่อนข้างน่าเชื่อถือ
การปรับโครงสร้างพื้นฐานของ “ครึ่งหลังของ AI”
ตามรายงาน Hy3 preview เป็นโมเดลภาษา MoE ที่ผสานการคิดเร็วและช้า มีพารามิเตอร์ทั้งหมด 295B พารามิเตอร์ที่เปิดใช้งาน 21B รองรับความยาวบริบท 256K มีทั้งการใช้งานจริงและความคุ้มค่า
ในโมเดลรุ่นใหม่ งานหลักของทีม Hunyuan คือการปรับโครงสร้างพื้นฐาน ทำให้งานพื้นฐานต่างๆ แข็งแกร่งขึ้น โดยเฉพาะโครงสร้างพื้นฐานก่อนการฝึกและ Reinforcement Learning ที่ถูกสร้างขึ้นใหม่ทั้งหมด ในการอัปเดตเวอร์ชันใหญ่ ทีมงานไม่ได้มุ่งเน้นไปที่นวัตกรรมเล็กๆ น้อยๆ ในกลไกความสนใจหรือสถาปัตยกรรมพื้นฐานมากนัก แต่เลือกเส้นทาง MoE (Mixture of Experts) ที่成熟 และทุ่มเทพลังงานและทรัพยากรทั้งหมดไปที่ความมั่นคงของฐานวิศวกรรม (Infra)
ซึ่งหมายความว่าความเสถียร ประสิทธิภาพการรับส่งข้อมูล และอัตราผลผลิตที่ดีของท่อ RL ของ Hy3 preview อาจถึงระดับอุตสาหกรรมที่ไม่เคยมีมาก่อน
นอกจากนี้ ในระหว่างการฝึก ทีม Hunyuan เน้นการประเมินโมเดลและเสริมสร้างการวิจัย Benchmark ที่สร้างขึ้นเอง ซึ่งสอดคล้องกับแนวคิดที่เหยา ซุนหยู่แสดงไว้ในบล็อกก่อนหน้านี้: การประเมินสำคัญกว่าการฝึก (Evaluation > Training)

ในบทความ “ครึ่งหลังของโมเดลขนาดใหญ่” เหยา ซุนหยู่เคยชี้ให้เห็นว่า “สูตร” ปัจจุบันของโมเดลขนาดใหญ่ (ก่อนการฝึก + RL + การขยายกำลังคำนวณ) นั้น成熟มากแล้ว และมีความสามารถในการสรุปทั่วไปและแก้ปัญหาที่ยาก ตรรกะของครึ่งหลังคือการตั้งคำถามที่ถูกต้อง: “เราควรฝึก AI ให้ทำอะไร?”
ในครึ่งหลัง เนื่องจากสูตรโมเดลทั่วไปที่มีอยู่นั้นทรงพลังมาก การใช้ความพยายามอย่างมากในการปรับแต่งอย่างละเอียดอาจทำให้ดีขึ้นเพียง 5% ดังนั้น การประเมินจึงสำคัญกว่าการฝึก อุตสาหกรรมจำเป็นต้องสร้างระบบการประเมินใหม่ ออกแบบงานและกระบวนทัศน์ใหม่ที่ใกล้เคียงกับโลกแห่งความเป็นจริง แทนที่จะออกแบบข้อสอบที่ยากขึ้น
เพื่อความอยู่รอดและพัฒนาในครึ่งหลังของ AI ผู้ปฏิบัติงานต้องเปลี่ยนกรอบความคิด มีมุมมองที่คล้ายกับ “ผู้จัดการผลิตภัณฑ์” ซึ่งหมายถึงต้องคิดอย่างลึกซึ้ง: AI ควรแก้ปัญหาจริงให้ใคร? และเราจะวัดผลการแก้ปัญหาอย่างเป็นกลางได้อย่างไร?
ในด้านนี้ Tencent มีสถานการณ์ทางธุรกิจที่ซับซ้อนที่สุดในประเทศจีนและทั่วโลก เช่น WeChat เกม โฆษณา บริการคลาวด์ และสภาพแวดล้อมการประเมินที่สร้างขึ้นเองจะต้องสอดคล้องกับจุดยากและ痛点ของกระแสธุรกิจจริงอย่างมาก การเปิดตัว Hy3 preview อาจช่วยให้ Tencent สร้างเครื่องมือการผลิตที่สามารถแก้ปัญหาจริงภายในระบบนิเวศของตนได้
Hy3 preview เริ่มการฝึกในปลายเดือนมกราคม 2026 และใช้เวลาไม่ถึงสามเดือนตั้งแต่การฝึกจนถึงการเปิดตัว นี่คือจุดเริ่มต้นของโมเดลภาษาขนาดใหญ่ Hunyuan จากการ “อ่านหนังสือหมื่นเล่ม” สู่ “เดินทางหมื่นลี้” เพื่อพยายามแก้ปัญหาจริงในโลก
Hy3 preview เป็นเพียงจุดเริ่มต้น ในอนาคต ทีม Hunyuan ยังหวังที่จะปรับปรุงความสามารถของโมเดลผ่านความร่วมมือระหว่างนักพัฒนาและผู้ใช้ เพื่อให้มันพัฒนาอย่างต่อเนื่องในสถานการณ์และงานจริง

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/31701
