การฝึกฝนเอเจนต์
-
การวิจัยร่วมของมหาวิทยาลัยชิงหวา ปักกิ่ง และเทนเซนต์: กรอบ GTR แก้ปัญหาการ ‘ล่มสลายของความคิด’ ในการฝึกตัวแทน VLM
ผู้เขียนคนแรกของบทความวิจัยคือ Wei Tong นักศึกษาปริญญาเอกที่กำลังศึกษาอยู่ที่มหาวิทยาลัย Tsinghua โดยมีทิศทางการวิจัยเกี่ยวกับเอเจนต์โมเดลขนาดใหญ่และการเรียนรู้แบบเสริมกำลัง (Reinf…
-
อาลีเปิดตัว Qwen3-Coder-Next: พารามิเตอร์ 3B กระตุ้นแกร่งกว่า Sonnet4.5 แบบจำลองฝึกเอเจนต์ปฏิวัติ AI การเขียนโปรแกรม
เมื่อเช้ามืดวันนี้ Alibaba ได้เปิดตัวโมเดลการเขียนโปรแกรมล่าสุด Qwen3-Coder-Next อย่างเป็นทางการ คุณสมบัติที่น่าสนใจที่สุดคือ: โมเดลที่เปิดใช้งานพารามิเตอร์เพียง 3 พันล้าน เท่านั้น…