
Gemini เวอร์ชันเดสก์ท็อปตัวแรกถูกเปิดเผย โมเดล Gemini 3.2/3.5 ใหม่ปรากฏตัวเงียบๆ เขียนโค้ด 2000 บรรทัดแบบไม่เห็นหน้าจอได้ในเวลาเพียงหนึ่งนาที Agent ระดับระบบปฏิบัติการมาถึงแล้วจริงๆ
คราวนี้ Google จะปล่อยของใหญ่จริงๆ!
เวลา 01.00 น. วันที่ 20 พฤษภาคม ตามเวลาสหรัฐฯ หรือคืนนี้ Google I/O 2026 จะเปิดฉากอย่างเป็นทางการที่ Mountain View รัฐแคลิฟอร์เนีย
แต่เรื่องดีๆ ได้เริ่มขึ้นก่อนแล้ว ทีมงาน Google ตั้งแต่บนลงล่าง “อดใจไม่ไหว” กันถ้วนหน้า ตั้งแต่ CEO Sundar Pichai, Hassabis ไปจนถึง Logan หัวหน้าฝ่ายผลิตภัณฑ์ Gemini ต่างทยอยโพสต์ข้อมูลสำคัญบนโซเชียลมีเดีย

|

สิ่งที่ทำให้โลกออนไลน์แตกตื่นคือวิดีโอทีเซอร์ที่พวกเขาโพสต์ล้วนสร้างโดย AI
ด้านหนึ่งเป็นมีมคลาสสิก 10 วินาที อีกด้านเป็นทีเซอร์ Gemini แบบคนจริง 8 วินาที ผู้คนต่างคาดเดาว่าเนื้อหาเหล่านี้สร้างโดย Gemini Omni

|

ในวันเดียวกันนี้ Gemini เวอร์ชันเดสก์ท็อปของ Google ถูกเปิดเผย โดยเวอร์ชัน Mac เปิดตัวก่อน
ฟีเจอร์ต่างๆ เช่น Live, Spark, Omni, “Magic Pointer” เปิดตัวพร้อมกัน ปฏิวัติปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์เริ่มต้นขึ้น

ตั้งแต่โมเดลเรือธงรุ่นถัดไป Gemini 3.5/3.2 ไปจนถึง Gemini Omni แบบมัลติโมดอลดั้งเดิม และแอปพลิเคชัน Gemini เดสก์ท็อปใหม่… การโปรโมตอย่างเข้มข้นก่อนงาน I/O ของ Google ได้ผลักดันความคาดหวังของคนทั้งโลกให้ถึงขีดสุด!
ผลิตภัณฑ์ใหม่重磅กำลังจะออกมา ทุกคนกำลังกลั้นหายใจรอคอย ช่วงเวลา “ราชาองค์ใหม่” ของ Google

Gemini เดสก์ท็อปตัวแรกมาแล้วจริงๆ
สิ่งที่ทำให้คนทั้งโลกตื่นเต้นจริงๆ คือชุดอัปเกรดหลักของ Gemini เดสก์ท็อปที่ถูกเปิดเผยในคืนก่อน I/O
TestingCatalog ผู้เปิดเผยข้อมูลชื่อดังชี้ว่า “แอป Gemini เดสก์ท็อปของ Google กำลังจะมีฟีเจอร์หลัก 4 อย่าง”

ปัจจุบันเวอร์ชันเดสก์ท็อปที่รั่วไหลรองรับเฉพาะ Mac ผู้ใช้ Windows ต้องรอต่อไป
- Gemini Spark: Agent ระดับระบบควบคุมพีซี
จากตัวอย่างจะเห็นว่า Gemini Spark เป็นพื้นที่ทำงาน Agent แยกต่างหาก แตกต่างจากโหมดแชททั่วไป
จุดเด่นของมันคือสามารถเชื่อมต่อโฟลเดอร์ในเครื่อง อ่านไฟล์โค้ด รันสคริปต์ จัดระเบียบไฟล์ และแม้แต่ซิงค์เวิร์กโฟลว์กับ Google Drive โดยตรง

พูดอีกอย่างคือ นี่ไม่ใช่แชทบอท “ถาม-ตอบ” อีกต่อไป แต่เป็นพนักงาน AI ที่ทำงานบนคอมพิวเตอร์ของคุณได้จริงๆ มันสามารถดูไฟล์ จัดการไฟล์ และซิงค์งานไปยังคลาวด์

นี่หมายความว่าอะไร? นี่คือพื้นที่ที่ Codex เดสก์ท็อปและ Claude Code กำลังไล่ตาม: สิทธิ์ควบคุม Agent ระดับระบบไฟล์ในเครื่อง Google ทำ一步到位 ยัดมันเข้าไปในผลิตภัณฑ์เดสก์ท็อปสำหรับผู้บริโภคโดยตรง มีผู้ใช้บางคนเรียกมันว่าทางเลือกของ Codex

- Stream to Cursor: “Magic Pointer” มาถึงเดสก์ท็อป
ใน Android Show สัปดาห์ที่แล้ว “Magic Pointer” ของ Google เปิดตัวสร้างความประทับใจ “ตัวชี้เมาส์” กลายเป็นแกนหลักของการโต้ตอบ AI ในชั่วข้ามคืน โดยไม่ต้องขัดจังหวะเวิร์กโฟลว์ เคอร์เซอร์ชี้ไปที่ไหน AI จะเข้าใจบริบททันทีและแสดงคำแนะนำการดำเนินการ


ตอนนี้ความสามารถนี้ถูกย้ายไปยังเดสก์ท็อป ตั้งชื่อว่า “Stream to Cursor” มันทำให้ Gemini รับรู้บริบทของหน้าต่างที่เมาส์อยู่แบบเรียลไทม์ในรูปแบบหน้าต่างลอย สิ่งที่คุณดู มันจะรู้

ที่สำคัญกว่านั้น หน้าต่างลอยนี้ยังรองรับการแชร์หน้าจอ หน้าต่าง หรือเนื้อหากล้องทันที นอกจากนี้ยังรองรับการสลับระหว่าง Gemini 3 Flash และ Gemini 3.1 Pro ได้อย่างรวดเร็ว ต้องบอกว่านี่คือลักษณะที่โมเดลใหญ่ “เข้าควบคุมระบบปฏิบัติการ” อย่างแท้จริง

- Gemini Omni: ชื่อรหัสภายใน Veo4 Omni
ข้อมูลเปิดเผยว่า Gemini Omni ถูกเรียกภายใน Google ว่า “Veo4 Omni” ซึ่งบ่งชี้ถึงการผสานรวม Veo 4 อย่างลึกซึ้ง การรั่วไหลก่อนหน้านี้แสดงให้เห็นว่าหน้าสร้างวิดีโอของ Gemini มีป้าย “Powered by Omni” ปรากฏขึ้น มันปรากฏเคียงข้างกับ Veo 3.1 รหัส “Toucan” ที่มีอยู่

นั่นหมายความว่า Google กำลังรวมความสามารถในการสร้างข้อความ รูปภาพ และวิดีโอเข้าเป็นโมเดล Gemini เดียวกัน นี่จะเป็น “โมเดลสร้างสรรค์อเนกประสงค์” ที่แท้จริงตัวแรกในอุตสาหกรรม
- Gemini Live: การโต้ตอบด้วยเสียงแบบเรียลไทม์
Gemini Live จะปรากฏเป็นหน้าต่างลอยเสียงประจำบนเดสก์ท็อป แต่ขณะนี้ยังอยู่ในขั้นตอนการพัฒนา ยังไม่พร้อมใช้งานอย่างเป็นทางการ
นอกจากฟีเจอร์หลักสี่อย่างแล้ว ยังมีรายละเอียดที่น่าสนใจอีกหนึ่งอย่าง: “Skills” เปิดตัวเต็มรูปแบบบน Gemini เดสก์ท็อป นักพัฒนาสามารถ mount สคริปต์หรือโฟลเดอร์ฟังก์ชันที่กำหนดเองลงในเวิร์กโฟลว์ Agent ได้โดยตรง
ในชั่วพริบตา โครงสร้าง AI เดสก์ท็อปของ Google กระโดดจาก “แชทบอท” ไปสู่ “Agent ระดับระบบปฏิบัติการอเนกประสงค์” โดยตรง

Gemini 3.2 ใหม่ปรากฏ การเขียนโค้ดเร็ว “เกินจริง”
ไม่กี่วันมานี้ มีการทดสอบการเขียนโค้ดจริงของ Gemini 3.2 หรือแม้แต่ 3.5 ออกมามากมาย นักพัฒนาบางคนเลือก “Fast mode + Canvas” ในหน้าเว็บ Gemini แล้วถูก route ไปยัง Gemini 3.2 Flash เวอร์ชัน วันนี้ Gemini เรือธงรุ่นถัดไปปรากฏตัวบน Antigravity อย่างกะทันหัน

มีผู้เชี่ยวชาญ Chetaslua ทดสอบแล้วประหลาดใจ ความสามารถในการเขียนโค้ดของ Gemini 3.2 Flash นั้นเร็ว “เกินจริง” พรอมต์เดียว โค้ด 2000 บรรทัด สร้าง “Minecraft” จิ๋วได้ในเวลาไม่ถึงนาที

ในอีกเดโมหนึ่ง โค้ด 1700 บรรทัด 48 วินาที Gemini ผ่านการทดสอบ voxel cube อย่างสมบูรณ์แบบ
ในการสร้างฟรอนต์เอนด์ Gemini เวอร์ชัน Flash ที่ทำได้ถึงระดับนี้ ยอดเยี่ยมมาก


ชุด “ครอบครัว” สำนักงานก็เปลี่ยนโฉมด้วย
พูดถึงเรื่องนี้ ก่อน I/O ไม่นาน Google ยังอัปเดตไอคอนแอป Workspace ทั้งชุดอย่างเงียบๆ ในคืนก่อน I/O แอป Workspace กว่าสิบตัว เช่น Gmail, Google Drive, Docs, Sheets เริ่มผลักดันไอคอนใหม่เต็มรูปแบบ

การเปลี่ยนแปลงที่ชัดเจนที่สุดคือ Google ละทิ้งกฎเหล็ก “ทุกไอคอนต้องมีสีบริษัทสี่สี” อย่างสิ้นเชิง หันมาใช้ภาษาการออกแบบ “สีไล่ระดับ + สีอิสระ” แทน ภาษาการออกแบบใหม่นี้เชื่อมต่อกับระบบภาพของ Google Logo, ไอคอน Gemini, Android 17 อย่างสมบูรณ์ แต่ต้องบอกว่า Google กำลังปรับโฉมระบบนิเวศทั้งหมดทั้งด้านภาพและ AI ระดับพื้นฐานอย่างเป็นหนึ่งเดียว

Google ฝึก AI ที่ใหญ่ที่สุด ถึง “ช่วงเวลา Mythos”
ในการอภิปรายทั้งหมดเกี่ยวกับ I/O การคาดการณ์ของ Andrew Curran ผู้เชี่ยวชาญด้านเทคโนโลยี引起了ความสนใจ “ฉันคิดว่าพวกเขาฝึกโมเดลที่ใหญ่ที่สุดเท่าที่เคยมีมา” อาจเป็นโมเดลที่ใหญ่ที่สุดที่ใครก็ตามเคยฝึก ในกระบวนการขยายขนาด มีสิ่งที่ไม่คาดคิดเกิดขึ้น เขาใช้การเปรียบเทียบที่มีความหมายมาก: พวกเขาประสบช่วงเวลา Mythos ของตัวเอง แต่วิธีการแตกต่างจาก Anthropic Gemini เป็นโมเดลที่แตกต่างจาก Claude มากมาโดยตลอด

ภาพที่การรั่วไหลอย่าง密集ในวันนี้ชี้ให้เห็นนั้นยิ่งใหญ่กว่า “การอัปเดตผลิตภัณฑ์อีกครั้ง” มาก Gemini เดสก์ท็อปตัวแรกของ Google กำลังกลายเป็น “Agent อเนกประสงค์” ที่ประจำการอยู่บนระดับระบบปฏิบัติการ สามารถฟัง (Live เสียง), ดู (Stream to Cursor การรับรู้หน้าจอ), ทำ (Spark จัดการไฟล์ในเครื่อง), สร้าง (Omni สร้างวิดีโอ), เรียนรู้ (Skills ระบบทักษะ) นี่คือ “Agent อัจฉริยะทั่วไป” ระดับต้นแบบ
จากเครื่องมือถาม-ตอบเดี่ยว ไปจนถึงการรับรู้สภาพแวดล้อม จัดการเครื่องมือ สร้างเนื้อหา ดำเนินการด้วยตนเอง ห่วงโซ่วิวัฒนาการนี้คือเส้นทางที่หลีกเลี่ยงไม่ได้จาก AI แคบไปสู่ AGI และแม้แต่ ASI คืนนี้ในงาน I/O Google ได้กดปุ่มเริ่มต้นแล้ว
**

**
ครั้งที่แล้ว AI ถูกพูดถึง 92 ครั้ง ปีนี้ล่ะ?
ในการกล่าวสุนทรพจน์หลักของ Google I/O 2025 ปีที่แล้ว สถิติในงานแสดงว่าคำว่า “AI” ถูกพูดถึง 92 ครั้ง
ครั้งนี้ AI จะถูกพูดถึงกี่ครั้ง?

ข้อมูลอ้างอิง:
https://www.theverge.com/tech/932417/google-gmail-docs-cal-sheets-workspace-icon-redesign
https://x.com/testingcatalog/status/2056532499036045317?s=20
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/35555
