การเพิ่มประสิทธิภาพการให้เหตุผล
-
DeepSeek เฟรมเวิร์กใหม่ DualPath: ใช้การ์ดเน็ตเวิร์กที่ไม่ได้ใช้งานเพื่อเร่งการอนุมานเอเจนต์ เอาชนะคอขวด I/O และเพิ่มประสิทธิภาพได้เกือบ 2 เท่า
DeepSeek กรอบงานใหม่ DualPath: ใช้การ์ดเน็ตเวิร์คที่ไม่ได้ใช้งานเพื่อเร่งการอนุมานเอเจนต์ ทำลายคอขวด I/O เพิ่มประสิทธิภาพเกือบ 2 เท่า ในขณะที่วงการต่างจับตามองความคืบหน้าของโมเดลรุ…
-
LightRetriever: สร้างความเปลี่ยนแปลงครั้งใหญ่! สถาปัตยกรรมการค้นคืน LLM ที่เร็วขึ้นเป็นพันเท่า ขจัดภาระการคำนวณออกจากฝั่งการสืบค้นโดยสิ้นเชิง
ในปีที่ผ่านมา เทคโนโลยีการค้นคืนข้อความโดยใช้โมเดลภาษาขนาดใหญ่ (LLM-based Text Retrieval) ได้พัฒนาอย่างรวดเร็ว โดยโมเดล LLM Embedding หลักส่วนใหญ่มีพารามิเตอร์มากกว่า 7B พันล้านตัว…
-
Qwen3.5 เปิดตัวอย่างยิ่งใหญ่: พารามิเตอร์ 397 พันล้าน ประสิทธิภาพเหนือโมเดลล้านล้านพารามิเตอร์, การประมวลผลการอนุมานเพิ่มขึ้น 19 เท่า, เกิดมาตรฐานใหม่ของ AI แบบโอเพนซอร์ส
智東西2月16日報導,剛剛,Qwen3.5正式發佈並開源,在多模態理解、複雜推理、編程、Agent智能體等幾大能力上領先同級開源模型,多項基準測試成績媲美甚至超越GPT-5.2、Gemini 3 Pro等閉源第一梯隊模型。 Qwen3.5-Plus總參數為3970億,激活參數僅170億,其性能超越了萬億參數的Qwen3-Max模型。在部署上,其顯存佔用降低了…