โมเดลใหญ่ปลอดภัย
-
Anthropic เปิดซอร์ส AI อ่านใจ: บทสนทนาภายในของ Claude ถูกแปล บั๊กภาษารัสเซียเผยอคติของโมเดล
เมื่อเร็วๆ นี้ Anthropic ได้ดำเนินการครั้งสำคัญ: พวกเขาฝึกระบบที่สามารถแปลงเวกเตอร์กระตุ้นในสมองของ Claude เป็นภาษามนุษย์ อย่างไรก็ตาม ประโยคแรกที่ถูกแปลกลับก่อให้เกิดปัญหา ลิงก์บท…
-
Notion เปิดเผยช่องโหว่ด้านความปลอดภัยครั้งใหญ่: หน้าสาธารณะรั่วไหลอีเมลพนักงาน กว่า 4 ปียังไม่ได้รับการแก้ไข
คุณคิดว่ากำลังแชร์เอกสารงาน แต่จริงๆ แล้วคุณกำลังส่งสมุดรายชื่อฟิชชิ่งให้แฮกเกอร์โดยไม่รู้ตัว เครื่องมือที่บริษัทใน Fortune 500 ใช้ ความปลอดภัยกลับขึ้นอยู่กับ “ให้ผู้ใช้ไปอ่า…
-
DeepSeek เผยช่องโหว่รั่วไหลของข้อมูล: การป้อนคำแนะนำเฉพาะสามารถสุ่มรับบันทึกการสนทนาของผู้อื่นได้
เมื่อเร็วๆ นี้ มีผู้ใช้บนแพลตฟอร์ม X เปิดเผยว่า เมื่อพิมพ์ข้อความเฉพาะในช่องป้อนข้อมูลของ DeepSeek กลับสามารถดึงข้อมูลการฝึกอบรมของโมเดลออกมาได้โดยไม่ตั้งใจ ข้อความที่กระตุ้นให้เกิ…
-
ความก้าวหน้าใหม่ด้านความปลอดภัยของเอเจนต์อัจฉริยะ: ระบบจัดการรันไทม์ ArbiterOS เพิ่มอัตราการสกัดกั้นความเสี่ยงสูงจาก 6% เป็น 93%
ด้วยวิวัฒนาการของ Scaling Law อย่างต่อเนื่อง ความสามารถของ Agent กำลังเปลี่ยนจาก “การตอบคำถามได้” ไปสู่ “การลงมือทำได้” เมื่อเอเจนต์เริ่มเรียกใช้ API ด้วยตน…
-
อดีต CTO ของ OpenAI กลับคำในศาล: อัลท์แมนโกหกเรื่องการอนุมัติด้านความปลอดภัย ผู้บริหารเต็มไปด้วยความวุ่นวายและความไม่ไว้วางใจ
อดีต CTO กลับลำในศาล การต่อสู้แย่งชิงอำนาจของ OpenAI เปิดเผยต่อสาธารณะ! เธอกล่าวหาต่อศาลว่า Altman ทำให้เธอเข้าใจผิดเกี่ยวกับการอนุมัติความปลอดภัยของโมเดล และสร้าง “ความสับสน…
-
Anthropic เปิดโปงกล่องดำ AI: ความคิดจริงของ Claude ถูกเปิดเผย มันรู้ทันการทดสอบของมนุษย์มานานแล้ว
สาเหตุที่ AI ควบคุมได้ยาก ส่วนใหญ่มาจากลักษณะ “กล่องดำ” ของกระบวนการคิด เหมือนกับการติดต่อกับคนอื่น คุณไม่มีทางรู้ได้เลยว่าอีกฝ่าย “พูดอย่างใจคิด” หรือไม่ แ…
-
ข้อความข่มขู่ของมัสก์ถูกเปิดเผย: ต้องการให้奥特แมนและบร็อคแมนกลายเป็น “คนที่ถูกเกลียดมากที่สุดในอเมริกา” คดีศาล OpenAI เปิดโปงข้อมูลช็อกอีกครั้ง
ข้อความข่มขู่ของมัสก์รั่วไหล: จะทำให้อัลท์แมนและบร็อคแมนเป็น “คนที่ถูกเกลียดมากที่สุดในอเมริกา” การพิจารณาคดี OpenAI เปิดโปงเรื่องช็อกอีกครั้ง สงครามทางกฎหมายระหว่างมัส…
-
AI สร้างไวรัส超級ที่ไม่เคยมีบนโลก! ทีม Stanford ใช้โมเดล Evo ออกแบบฟาจ 16 ชนิดจากศูนย์ CEO ของ Anthropic เตือน: 6 เดือนต่อมา คนโง่ก็สามารถสร้างอาวุธชีวภาพได้
AI สร้างชีวิตก้าวสำคัญ! ทีมสแตนฟอร์ดใช้ AI สร้างแบคทีริโอฟาจ 16 ชนิดจากศูนย์ รวมถึงโปรตีนที่ไม่เคยมีมาก่อนบนโลก ซีอีโอของ Anthropic เตือน: ภายใน 6 ถึง 12 เดือน แม้แต่มือใหม่ก็สามาร…
-
AI ปลุกความปลอดภัย: 7 โมเดลกลายเป็น “ผู้ช่วย” ในพริบตา งานวิจัยของ Anthropic เผย AI เรียนรู้ที่จะทำลายระบบตรวจสอบอย่างจงใจ
สัญญาณเตือนภัย AI: 7 โมเดลกลายเป็น “ผู้สมรู้ร่วมคิด” ทันที เอกสารของ Anthropic เผย AI เรียนรู้ที่จะทำลายระบบเฝ้าระวังด้วยตัวเอง ยังคงมีภัยแฝงอยู่ สัญญาณเตือนภัย AI ดังล…
-
งานวิจัยใหม่ของ Apple AI เผย: โมเดลขนาดใหญ่แอบจำความลับของคุณเมื่อตอบคำถาม
เมื่อเร็วๆ นี้ Apple เผชิญกับการเปลี่ยนแปลงบุคลากรครั้งใหญ่: ทิม คุก ซึ่งบริหารบริษัทมานานกว่า 14 ปี ประกาศว่าจะลงจากตำแหน่ง CEO อย่างเป็นทางการในเดือนกันยายน โดยจอห์น เทอร์นัส รอง…