คอมพิวเตอร์วิทัศน์
-
1-บิตปฏิวัติความสนใจ: BinaryAttention เร่งความเร็ว FlashAttention2 ขึ้น 2 เท่า ทำลายข้อจำกัดการปรับใช้ Transformer
คำสำคัญ: Transformer, ความสนใจแบบไบนารี, การเร่งความเร็วด้วยฮาร์ดแวร์, การควอนไทซ์บิตต่ำสุด เมื่อกลไกความสนใจถูก “ลดขนาด” ถึงขีดสุด ความสำเร็จของสถาปัตยกรรม Transformer…
-
CVPR2026 งานวิจัยที่ได้คะแนนเต็ม: Proxy-GS เร่งความเร็วการเรนเดอร์ 3D Gaussian Splatting 2.5 เท่า โดยใช้โครงตาข่ายพร็อกซีน้ำหนักเบาเพื่อรวมข้อมูลการบังล่วงหน้า
ในฉากทิวทัศน์เมือง Proxy-GS บรรลุการเรนเดอร์เรียลไทม์ที่เสถียรในขณะที่ยังคงรายละเอียดภาพระดับละเอียดไว้ วิธีการนี้ลดจำนวนจุดยึด (anchor) ที่ต้องถอดรหัสได้อย่างมีนัยสำคัญ ส่งผลให้ปร…
-
สัญญาณ WiFi สามารถ “มองเห็น” ท่าทางของมนุษย์ได้? โครงการโอเพ่นซอร์ส wifi-densepose ได้รับดาวกว่า 2,000 ดาวในหนึ่งวัน แต่ผลลัพธ์จริงกับที่โฆษณามีความแตกต่าง
สัญญาณ WiFi สามารถ “มองเห็น” ท่าทางของมนุษย์ได้ด้วย? โครงการโอเพนซอร์ส wifi-densepose ได้รับดาวกว่า 2000 ดวงภายในวันเดียว เปิดรายการ GitHub Trending พบว่าโครงการโอเพนซอ…
-
4 โครงการ AI แบบโอเพนซอร์สที่น่าทึ่ง: ตั้งแต่การสร้างแผนภูมิใหม่ไปจนถึงผู้ช่วยเดสก์ท็อป ปลดล็อกประสบการณ์อัจฉริยะใหม่
01 แปลงรูปภาพและ PDF เป็นรูปแบบที่แก้ไขได้ Edit Banana เป็นโครงการโอเพนซอร์สที่พัฒนาโดยมหาวิทยาลัยเทคโนโลยีปักกิ่ง มันสามารถแปลงแผนภูมิสถิติ แผนผังลำดับงานในรูปแบบรูปภาพหรือ PDF ที…
-
YOLO26 วิเคราะห์เชิงลึก: วิวัฒนาการทศวรรษ เร่งความเร็วการประมวลผล CPU 43% และตรวจจับแบบเรียลไทม์บนอุปกรณ์ Edge ได้อย่างไร
คำสำคัญ: YOLO26, การวิวัฒนาการของสถาปัตยกรรม YOLO, อัลกอริทึมตรวจจับแบบครั้งเดียว (YOLO), การตรวจจับวัตถุ, การมองเห็นด้วยคอมพิวเตอร์, การเรียนรู้เชิงลึก ตลอดทศวรรษที่ผ่านมา อัลกอริ…
-
TrafficVLM: ระบบ Eagle Eye ของ Amap ใช้โมเดลวิทัศน์ AI อย่างไรในการเตือนภัยระยะไกลเกินสายตา เพื่อปกป้องความปลอดภัยในการเดินทางช่วงเทศกาลตรุษจีน
อี้ฟาน จาก เอาเฟยซื่อ Quantum Bit | บัญชี WeChat QbitAI เตรียมตัวกลับบ้านฉลองปีใหม่แล้วหรือยัง? ปริมาณการเดินทางช่วงเทศกาลปีใหม่ปีนี้สูงขึ้นเป็นประวัติการณ์อีกครั้ง เจ้าหน้าที่คาดก…
-
Tencent Hunyuan เปิดตัว HY3D-Bench: สร้าง “ImageNet” ในวงการสร้างภาพ 3D แก้ปัญหาข้อมูลและการประเมิน
เทคโนโลยีการสร้าง 3D ในปัจจุบันมีความพร้อมใช้งานที่น่าทึ่งมาก อย่างไรก็ตาม ปัญหาสำคัญสามประการที่ยังคงกวนใจนักวิจัยในสาขานี้คือ คุณภาพข้อมูลที่ไม่สม่ำเสมอ ขาดมาตรฐานการประเมิน และก…
-
สามสุดยอดเครื่องมือโอเพ่นซอร์ส: PageLM ปรับโฉมประสบการณ์การเรียนรู้, DeepSeek-OCR ปฏิวัติการรู้จำภาพ, Awesome Web Agents ผสานระบบนิเวศเบราว์เซอร์ AI
PageLM: ทางเลือกโอเพนซอร์สสำหรับ NotebookLM PageLM เป็นผลิตภัณฑ์โอเพนซอร์สที่เทียบเคียงกับ Google NotebookLM ฟังก์ชันหลักของ NotebookLM คือ ผู้ใช้เพียงแค่อัปโหลดเอกสารการเรียนรู้ ม…