Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน ‘ตาทิพย์’ รับมือได้อย่างไร?

ด้วยความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยี Deepfake ดาราในวงการบันเทิงได้กลายเป็นผู้ได้รับผลกระทบมากที่สุดจากเทคโนโลยีเปลี่ยนใบหน้า เมื่อเร็วๆ นี้ มีกรณีที่นักแสดงถูกเปลี่ยนใบหน้า โคลนนิ่ง หรือแม้กระทั่งถูกนำไปใช้ในการโฆษณาปลอมหลายครั้งถูกเปิดเผยออกมา ส่งผลให้เกิดความสนใจจากสังคมอย่างกว้างขวาง

ตัวอย่างเช่น ผู้ใช้อินเทอร์เน็ตพบว่าในตอนต้นของตอนที่ 14 ของละครสั้น AI ชื่อ “หลังการเกิดใหม่ ฉันกลายเป็นเทพผู้พิทักษ์ของแม่” มีการใช้น่าจะเป็นใบหน้าของนักแสดงหยางจื่อ ในขณะที่แพลตฟอร์มละครสั้นบางแห่งใช้เทคโนโลยีเปลี่ยนใบหน้า AI ปลอมแปลงภาพลักษณ์และเสียงของอี้หยางเฉียนซีโดยไม่ได้รับอนุญาต

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?
ผู้ใช้อินเทอร์เน็ตระบุว่าตอนต้นของตอนที่ 14 ของละครสั้น AI “หลังการเกิดใหม่ ฉันกลายเป็นเทพผู้พิทักษ์ของแม่” มีการใช้น่าจะเป็นใบหน้าของนักแสดงหยางจื่อ

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?
ละครสั้น AI หลายเรื่องบนแพลตฟอร์มละครสั้นแห่งหนึ่งใช้เทคโนโลยีเปลี่ยนใบหน้า AI ปลอมแปลงภาพลักษณ์และเสียงของดาราอี้หยางเฉียนซีโดยไม่ได้รับอนุญาต

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?
นักแสดงหวังจิ่นซงก็เคยออกมาแสดงความคิดเห็นเกี่ยวกับการเป็นพรีเซนเตอร์ปลอมที่ใช้ AI เช่นกัน

ไม่เพียงแต่นักแสดงต่างออกมาแสดงความคิดเห็น หน่วยงานราชการก็เริ่มดำเนินการเช่นกัน คณะกรรมการนักแสดงของสมาคมวิทยุและโทรทัศน์แห่งประเทศจีนได้ออกแถลงการณ์อย่างเป็นทางการในวันที่ 2 เมษายน ประณามอย่างรุนแรงต่อพฤติกรรมต่างๆ เช่น การเปลี่ยนใบหน้า AI การใช้ข้อมูลฝึกฝน AI อย่างไม่เหมาะสม และการฝึกโมเดล AI ผิดกฎหมาย พร้อมทั้งออกคำเตือนต่ออุตสาหกรรม: ยึดมั่นในขอบเขตกฎหมาย ปกป้องความจริงของภาพและเสียง

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร? | Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?

ด้วยการพัฒนาอย่างรวดเร็วของโมเดลสร้างภาพและวิดีโอประเภทต่างๆ ดวงตามนุษย์ได้ยากที่จะแยกแยะขอบเขตระหว่างความจริงและการปลอมแปลง เทคโนโลยีเปลี่ยนใบหน้าเป็นเพียงยอดภูเขาน้ำแข็งของการใช้เทคโนโลยีนี้ในทางที่ผิด

ที่ร้ายแรงยิ่งกว่านั้นคือความเสี่ยงจากการใช้เทคโนโลยี Deepfake ในทางที่ผิดเพิ่มสูงขึ้นอย่างรวดเร็ว ตั้งแต่กรณี AI ปลอมแปลงการสัมภาษณ์ของสตีเฟน เคอร์รี ไปจนถึงภาพผลไม้ปลอมที่สร้างโดย AI ใช้ในการขอคืนเงิน ความวุ่นวายเหล่านี้กำลังท้าทายความเชื่อมั่นของสังคมและระบบนิเวศของแพลตฟอร์มเนื้อหาอย่างรุนแรง

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร? | Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?
—|—

ในยุคที่เทคโนโลยีวุ่นวายเช่นนี้ การทำให้ AI มี “ตาทิพย์” ได้กลายเป็นเรื่องเร่งด่วน

ล่าสุด ผลการแข่งขัน NTIRE Robust AI-Generated Image Detection in the Wild Challenge ในงานประชุมระดับยอดนิยมด้านคอมพิวเตอร์วิชั่น CVPR 2026 ได้ประกาศออกมาแล้ว ทีม MICV จากห้องปฏิบัติการความปลอดภัย AI ของ Ant Group ด้วยคะแนน ROC AUC บนตัวอย่างทดสอบความทนทานสูงถึง 0.9723 ประสบความสำเร็จในการคว้าแชมป์การแข่งขันในหมวดหมู่ “การทดสอบตัวอย่างความทนทานในสถานการณ์จริงที่ซับซ้อน” การแข่งขันครั้งนี้ดึงดูดทีมเข้าร่วมมากกว่า 500 ทีมจากทั่วโลก

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร? Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?

ในเวลาเดียวกัน ทีม Ant ยังได้เผยแพร่คลังทรัพยากรการตรวจจับภาพและวิดีโอ AIGC ที่ครอบคลุมที่สุดในอุตสาหกรรม คลังนี้รวบรวมเหตุการณ์ร้อนแรงล่าสุด งานวิจัยล้ำสมัย ชุดข้อมูลมาตรฐาน และเครื่องมือที่เป็นประโยชน์ เป็นแหล่งข้อมูลอันล้ำค่าสำหรับนักวิจัยทั่วโลก ทีมจะอัปเดตอย่างต่อเนื่อง เพื่อให้แน่ใจว่าทรัพยากรมีความทันสมัยและล้ำหน้า เพื่อรับมือกับความท้าทายที่เนื้อหาที่สร้างโดย AI นำมา

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?
คลังโอเพนซอร์ส : Awesome-AIGC-Image-Video-Detection

ความท้าทายในโลกจริง: ช่องว่างสองประการที่การตรวจสอบความจริงของ AIGC เผชิญ

แม้ว่าเทคโนโลยีการตรวจสอบความจริงของ AI ในปัจจุบันจะแสดงผลได้ดีในการทดสอบมาตรฐานคุณภาพสูง แต่เมื่อเผชิญกับสถานการณ์จริงที่เปิดกว้าง ซับซ้อน และเปลี่ยนแปลงได้ ความแม่นยำของโมเดลตรวจจับมักจะลดลงอย่างรวดเร็ว ปรากฏการณ์นี้ทำให้อุตสาหกรรมจำเป็นต้องแก้ไขปัญหาทางเทคนิคหลักสองประการอย่างเร่งด่วน

ประการแรกคือความสามารถในการปรับตัวข้ามโดเมนไม่เพียงพอ กลไกการสร้างของสถาปัตยกรรมการสร้างที่แตกต่างกันและแพลตฟอร์มเชิงพาณิชย์แบบปิดมีความแตกต่างกันมาก คุณลักษณะของร่องรอยปลอมก็เปลี่ยนแปลงตามไปด้วย โมเดลตรวจจับแบบดั้งเดิมมักจะ Overfit กับข้อมูลการฝึกฝนชุดเดียว เมื่อพบกับระบบการสร้างใหม่ ก็มักจะล้มเหลว และตรวจจับเนื้อหาปลอมรูปแบบใหม่ได้ยาก

อีกประการหนึ่งคือการรบกวนจากการลดคุณภาพในโลกจริง ภาพในกระบวนการเผยแพร่บนอินเทอร์เน็ต ย่อมผ่านการประมวลผลลดคุณภาพ เช่น การบีบอัด ความเบลอ การเพิ่มสัญญาณรบกวน อย่างหลีกเลี่ยงไม่ได้ ปรากฏการณ์การลดคุณภาพเหล่านี้มักจะบดบังร่องรอยการสร้างที่ละเอียดอ่อน เพิ่มความยากในการตรวจสอบความปลอมอย่างมาก

จากจุดที่เจ็บปวดเหล่านี้ การแข่งขัน CVPR ครั้งนี้จึงมุ่งเน้นเป็นพิเศษถึงวิธีการรักษาความแม่นยำสูงและความทนทานสูงของโมเดลภายใต้การทดสอบสองประการ: “สถาปัตยกรรมการสร้างที่ไม่รู้จัก” และ “การรบกวนจากการลดคุณภาพที่ซับซ้อน”

วิธีแก้ปัญหา: กรอบการตรวจจับความทนทานที่อิงตาม DINOv3

เพื่อรับมือกับความท้าทายดังกล่าว ทีมความปลอดภัย Ant ได้เสนอกรอบการตรวจจับแบบรวมกลุ่มที่ทนทานโดยอิงตาม โมเดลพื้นฐานด้านวิสัยทัศน์ DINOv3 กรอบนี้ใช้ประโยชน์จากความสามารถในการแสดงลักษณะที่แข็งแกร่งของ DINOv3 ในรายละเอียดความถี่สูงอย่างเต็มที่ และผสมผสานกับนวัตกรรมในการสร้างข้อมูล สถาปัตยกรรมโมเดล และกลยุทธ์การปรับให้เหมาะสม ประสบความสำเร็จในการย้ายจากมาตรฐานในห้องปฏิบัติการไปสู่สถานการณ์จริงที่ซับซ้อนได้อย่างมีประสิทธิภาพ

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?

การสร้างข้อมูลแบบแบ่งระดับ: คลังข้อมูลฝึกฝนหลายแหล่งระดับล้านตัวอย่าง
ชุดข้อมูลคุณภาพสูงและหลายมิติเป็นรากฐานในการทำลาย Overfit ทีมใช้ประโยชน์จากการสะสมข้อมูลที่ลึกซึ้ง สร้างคลังข้อมูลฝึกฝนที่ซับซ้อนซึ่งประกอบด้วยตัวอย่างหลายล้านตัวอย่าง คลอบคลุมแหล่งข้อมูลสี่ประเภทแบบแบ่งระดับ: มาตรฐานทางวิชาการโอเพนซอร์ส การสังเคราะห์แบบกำหนดเป้าหมายจากโมเดลการสร้างโอเพนซอร์สหลัก ตัวอย่างความเที่ยงตรงสูงจาก API แบบปิดเชิงพาณิชย์ และข้อมูลทางการของการแข่งขัน เพื่อให้แน่ใจว่าครอบคลุมระบบนิเวศการสร้างหลักในปัจจุบันอย่างครบถ้วน

สถาปัตยกรรมแบบรวมกลุ่มด้วยการผสานคุณลักษณะสองสาย: ขุดศักยภาพในการแสดงลักษณะอย่างเต็มที่
เพื่อขุดศักยภาพในการแสดงลักษณะของ DINOv3 ในรายละเอียดความถี่สูงที่ซับซ้อนอย่างเต็มที่ ทีมได้ออกแบบสถาปัตยกรรมแบบขนานสองสาย สถาปัตยกรรมแบ่งโครงข่ายหลัก DINOv3 หลายกลุ่มที่มีการกำหนดค่าต่างกันออกเป็นสองกลุ่มเครือข่ายอิสระ ภายในแต่ละกลุ่มจะรวมคุณลักษณะในระดับหลายสเกลผ่านกลไกการผสานคุณลักษณะ เพื่อรวบรวมคุณลักษณะเชิงพื้นที่เฉพาะที่และข้อมูลความหมายระดับโลก สุดท้ายโมดูล MLP จะส่งออกผลการทำนายของสาขา ในระดับการตัดสินใจ กลุ่มเครือข่ายทั้งสองดำเนินการสกัดคุณลักษณะและการทำนายอย่างอิสระ สุดท้ายทำการผสานขั้นสุดท้ายผ่านค่าเฉลี่ยถ่วงน้ำหนัก การออกแบบนี้หลีกเลี่ยงปัญหาการสูญเสียข้อมูลจากการเชื่อมโยงคุณลักษณะในระยะแรก และผ่านเอฟเฟกต์เสริมของเครือข่ายที่มีการกำหนดค่าต่างกัน สกัดการแสดงลักษณะภาพที่ครอบคลุมและเป็นสามมิติมากขึ้น

การเพิ่มความแข็งแกร่งของข้อมูลที่รับรู้ความยาก: การลดคุณภาพแบบขั้นบันไดที่จำลองเส้นทางการเผยแพร่จริง
ภาพในโลกจริงในกระบวนการเผยแพร่บนอินเทอร์เน็ตจะผ่านการลดคุณภาพหลายระดับ เช่น การบีบอัด ความเบลอ การเพิ่มสัญญาณรบกวน การตัดส่วน ซึ่งบดบังร่องรอยการสร้างเดิมที่ละเอียดอ่อน เพื่อลดความแตกต่างของการกระจายตัวระหว่างข้อมูลในห้องปฏิบัติการและสถานการณ์จริง ทีมได้สร้างสายโซ่การเพิ่มความแข็งแกร่งของข้อมูลที่ทนทานแบบขั้นบันได:
* การจำลองอย่างเป็นระบบของการลดคุณภาพหลายประเภท: คลอบคลุมประเภทการลดคุณภาพต่างๆ เช่น ความเบลอ สัญญาณรบกวน ร่องรอยการบีบอัด การเปลี่ยนสี และความผิดเพี้ยนทางเรขาคณิต ผ่านการกำหนดค่าความเข้มแบบแบ่งชั้น บรรลุการจำลองแบบก้าวหน้าจากการรบกวนเดี่ยวไปสู่การรบกวนประกอบที่ซับซ้อน จำลองลักษณะการลดคุณภาพหลายระดับในเส้นทางการเผยแพร่บนอินเทอร์เน็ตอย่างลึกซึ้ง
* กลไกการเพิ่มความแข็งแกร่งที่รับรู้ความเที่ยงตรงสูง: นำเข้าโมเดลการบีบอัดโครงข่ายประสาทเทียมเพื่อจำลองความบิดเบือนจากการเข้ารหัสขั้นสูง พร้อมทั้งเสริมตัวอย่างการลดคุณภาพแบบไม่สมมาตร เช่น การบีบอัดการเผยแพร่บนแพลตฟอร์มโซเชียล การถ่ายภาพซ้ำ และการจับภาพหน้าจอ เพื่อเติมเต็มช่องว่างการกระจายตัวระหว่างการจำลองด้วยอัลกอริทึมและสถานการณ์ขอบเขตจริง

การปรับให้เหมาะสมโมเดล: การสร้างพื้นที่พารามิเตอร์ที่ราบเรียบและทนทาน
* Focal Loss: เพื่อแก้ไขปัญหาความไม่สม่ำเสมอของความยากง่ายในการตรวจจับตัวอย่างที่ลดคุณภาพ ลดน้ำหนักของตัวอย่างที่จำแนกประเภทได้ง่ายแบบไดนามิก บังคับให้โมเดลมุ่งความสนใจไปที่ตัวอย่างยากที่ถูกบดบังด้วยการลดคุณภาพอย่างรุนแรง
* Random Weight Average (SWA): ในช่วงปลายของการฝึกที่ลู่เข้า ทำการเฉลี่ยอย่างราบเรียบของหลายเส้นทางน้ำหนักภายในพื้นที่พารามิเตอร์ นำโมเดลไปลู่เข้าสู่พื้นที่ค่าต่ำสุดที่แบนราบมากขึ้น ลดความเสี่ยงของการ Overfit
* กลไก TTA: ในขั้นตอนการอนุมาน ร่วมกันใช้ภาพต้นฉบับและเวอร์ชันที่พลิกด้านแนวนอนเพื่อหาค่าเฉลี่ยผลลัพธ์ เพิ่มความเสถียรของการอนุมานได้อย่างมีประสิทธิภาพ

ผ่านนวัตกรรมทางเทคนิคชุดนี้ ทีม Ant ไม่เพียงแต่แก้ไขความท้าทายหลายประการของเทคโนโลยีการตรวจจับ AIGC ในปัจจุบันเมื่อเผชิญกับสถานการณ์ที่เปลี่ยนแปลงได้ แต่ยังวางรากฐานสำหรับการตรวจจับ Deepfake ที่มีประสิทธิภาพและแม่นยำยิ่งขึ้นในอนาคต ส่งเสริมการพัฒนาของเทคโนโลยีการตรวจสอบความจริงของ AI ต่อไป

ก้าวหน้าทั้งการผลิตและการวิจัย: ทำลายข้อจำกัดของกล่องดำ ขยายขอบเขตเทคโนโลยีการตรวจสอบความจริงของ AIGC

ทีมความปลอดภัย Ant มีนวัตกรรมอย่างต่อเนื่องในทฤษฎีและวิธีการของเทคโนโลยีการตรวจสอบความจริงของ AI เมื่อเร็วๆ นี้ ได้เผยแพร่งานวิจัยระดับสูงหลายชิ้นในงานประชุมระดับนานาชาติชั้นนำ เช่น CVPR และ ICLR ความก้าวหน้าเหล่านี้ไม่เพียงแต่นำแนวคิดทางเทคนิคใหม่ๆ มาให้กับสาขาการตรวจสอบความจริงของ AI แต่ยังวางรากฐานสำหรับการแก้ไขข้อจำกัดทางเทคนิคที่มีอยู่

เป้าหมายของทีมคือการทำลายข้อจำกัดของกล่องดำของโมเดลการตรวจสอบความจริงแบบดั้งเดิม เทคโนโลยีการตรวจสอบความจริงของ AI ในอนาคตจะไม่เพียงเป็นงานจำแนกประเภทแบบไบนารีอย่างง่าย แต่จะมีความสามารถในการปรับตัวที่แข็งแกร่ง และสามารถให้เหตุผลได้เหมือนผู้เชี่ยวชาญมนุษย์

เฟรมเวิร์ก Veritas เป็นการแสดงให้เห็นถึงความพยายามนี้อย่างเป็นรูปธรรม โดยการผสมผสานโมเดลภาษาขนาดใหญ่หลายรูปแบบและกลไกการให้เหตุผลที่รับรู้รูปแบบ ทีมได้ก้าวข้ามขีดจำกัดของสายโซ่ความคิดแบบข้อความล้วนของโมเดลขนาดใหญ่แบบดั้งเดิม ทำให้โมเดลสามารถแสดงความสามารถในการปรับตัวและให้เหตุผลที่แข็งแกร่งขึ้นเมื่อเผชิญกับเครื่องมือสร้างที่ไม่รู้จัก

เฟรมเวิร์ก Veritas
ในสถานการณ์การตรวจจับข้ามโดเมนและข้ามประเภทการควบคุม เฟรมเวิร์ก Veritas มีประสิทธิภาพเหนือกว่าวิธี SOTA ที่มีอยู่ในปัจจุบัน และสามารถส่งออกกระบวนการให้เหตุผลที่โปร่งใสและน่าเชื่อถือ แสดงให้เห็นถึงศักยภาพอันยิ่งใหญ่ของปัญญาประดิษฐ์ในการรับมือกับปัญหา Deepfake ผลงานวิจัยนี้ได้รับการยอมรับให้เป็น Oral Presentation ใน ICLR 2026 ซึ่งพิสูจน์ถึงอิทธิพลในแวดวงวิชาการเพิ่มเติม

Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร? | Deepfake ระบาดหนัก: วงการบันเทิงเป็นพื้นที่เสี่ยง แอนต์กรุ๊ปใช้เทคโนโลยี AI ฝึกฝน 'ตาทิพย์' รับมือได้อย่างไร?

กระบวนทัศน์ Locate-Then-Examine
ในเวลาเดียวกัน ทีมยังได้เสนอสิ่งประดิษฐ์อีกชิ้นหนึ่ง นั่นคือ Locate-Then-Examine กระบวนทัศน์การตรวจจับใหม่สองขั้นตอนนี้ ผ่านวิธีการ “ระบุตำแหน่งพื้นที่ที่น่าสงสัยก่อน จากนั้นจึงตรวจสอบรายละเอียด” เพิ่มความแม่นยำในการตรวจจับอย่างมาก และแก้ไขปัญหาหลอนประสาทที่โมเดลในปัจจุบันมีอยู่ทั่วไปได้อย่างมีประสิทธิภาพ การเปิดตัว


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/29509

Like (0)
Previous 9 hours ago
Next 9 hours ago

相关推荐