Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

โมเดลใหม่ล่าสุด Gemma 4 ที่กูเกิลเพิ่งปล่อยเป็นโอเพนซอร์ส สร้างผลกระทบอย่างมีนัยสำคัญต่ออุตสาหกรรม

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

โมเดลนี้ใช้สถาปัตยกรรมเทคโนโลยีที่สืบทอดมาจาก Gemini 3 รองรับการประมวลผลแบบมัลติโมดัลเต็มรูปแบบตั้งแต่ต้น และติดอันดับ 3 ของโลกใน Arena AI Leaderboard โดยมีหลายรุ่นให้เลือก โดยรุ่นขนาดเล็กอย่าง E2B (พารามิเตอร์ที่มีประสิทธิภาพ 2.3B) และ E4B (พารามิเตอร์ที่มีประสิทธิภาพ 4.5B) สามารถนำไปใช้งานและรันได้บนมือถือโดยตรง พร้อมหน้าต่างบริบทขนาด 128K จนได้ชื่อว่าเป็น “ทางเลือกแทน Gemini ในกระเป๋า”

หลังเปิดตัวโมเดล ได้ดึงดูดความสนใจและการทดลองใช้จากผู้ใช้มือถือจำนวนมากอย่างรวดเร็ว

โพสต์ของผู้ใช้บนแพลตฟอร์ม X ได้รับการดูหลายแสนครั้ง วิดีโอที่โพสต์แสดงขั้นตอนการรัน Gemma 4 แบบโลคัลบน iPhone รวมถึงการประมวลผลภาพ เสียง และการควบคุมการเปิดปิดไฟฉาย ผู้ใช้นี้ระบุว่า Gemma 4 รันได้เร็วมาก ประสบการณ์ใกล้เคียงกับ “เวทมนตร์”

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

มีผู้ใช้ทำการทดสอบควอนไทซ์บน iPhone 17 Pro และชี้ให้เห็นว่าเมื่อใช้ชิปของ Apple ร่วมกับเฟรมเวิร์กแมชชีนเลิร์นนิง MLX ที่ได้รับการปรับให้เหมาะสมสำหรับชิป Apple โดยเฉพาะ ความเร็วในการอนุมานของโมเดลสามารถเกิน 40 โทเคนต่อวินาที

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

ผู้ใช้อีกคนบนโทรศัพท์ Samsung Galaxy ก็สามารถบรรลุความเร็วในการรันที่ใกล้เคียงกันได้ แม้จะเปิดโหมด “คิด” แล้วก็ยังทำงานลื่นไหล ถูกอธิบายว่า “เร็วจนไม่น่าเชื่อ”

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

ประสิทธิภาพเช่นนี้ทำให้การรันโมเดล AI แบบโลคัลบนมือถือเป็นตัวเลือกที่น่าจับตามองในอนาคต โดยเฉพาะในด้านที่อ่อนไหวต่อความเป็นส่วนตัวของข้อมูล เช่น การแพทย์

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

ในขณะเดียวกัน หน้าต่างบริบทขนาดใหญ่ 128K ก็เพิ่มความสามารถในการใช้งานจริงของโมเดลน้ำหนักเบาเหล่านี้อย่างมีนัยสำคัญ

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

สำหรับวิธีการรัน กูเกิลได้เตรียมช่องทางทางการที่สะดวก ผู้ใช้สามารถดาวน์โหลดและรันรุ่นโมเดลที่ต้องการผ่านแอปทางการ Google AI Edge Gallery โดยมีขั้นตอนที่ไม่ซับซ้อน

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

เนื่องจากเป็นโมเดลที่ปล่อยออกมาทางการโดยกูเกิล ความปลอดภัยจึงค่อนข้างได้รับการรับประกันมากกว่า

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

นอกจากโมเดลขนาดเล็กสำหรับมือถือแล้ว ยังมีนักพัฒนาที่ทดสอบรุ่น Gemma 4 ที่ใหญ่กว่าบนฮาร์ดแวร์ที่ทรงพลังกว่า เช่น การรันโมเดล Gemma 4 Mixture-of-Experts 26B บน MacBook Pro ที่ติดตั้งชิป M5 Pro

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

ในงานต่างๆ เช่น การสนทนาโดยตรง การสร้างข้อความ และการอธิบายโค้ด โมเดลนี้ตอบสนองอย่างรวดเร็วและทำงานลื่นไหล

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

อย่างไรก็ตาม เมื่อพยายามใช้มันเป็นเอเจนต์สำหรับการเขียนโปรแกรม (coding agent) ปัญหาก็เริ่มปรากฏขึ้น เนื่องจากงานของเอเจนต์ต้องการบริบทขนาดใหญ่ (รุ่นนี้รองรับ 256K) พรอมต์ที่ซับซ้อน และความสามารถในการเรียกใช้เครื่องมือที่เสถียร Gemma 4 ทำได้ไม่ดีในสถานการณ์เช่นนี้ มักจะเกิดการค้าง รายงานข้อผิดพลาด หรือผลลัพธ์ที่มีโครงสร้างไม่เป็นระเบียบ

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

จุดเปลี่ยนเกิดขึ้นเมื่อนักพัฒนาเปลี่ยนโมเดลเป็น qwen3-coder ในสภาพแวดล้อมเดียวกัน ตัวหลังสามารถดำเนินการสร้างไฟล์ รันคำสั่ง และงานหลายขั้นตอนได้ตามปกติ นี่บ่งชี้ว่าปัญหาอาจไม่ได้อยู่ที่เฟรมเวิร์กของเอเจนต์ แต่เป็นที่ตัวโมเดลเองว่าถูกปรับให้เหมาะสมสำหรับ “การเรียกใช้เครื่องมือและการส่งออกที่มีโครงสร้าง” หรือไม่ Gemma 4 อาจยังมีข้อด้อยในด้านนี้ หรือนักพัฒนาอาจยังไม่พบวิธีการใช้งานที่ดีที่สุด

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

นอกจากนี้ ยังมีความเห็นว่า Gemma 4 ยังมีพื้นที่สำหรับการพัฒนาระดับสติปัญญาหลัก

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

อย่างไรก็ตาม การปรากฏตัวของ “รถสปอร์ตสมรรถนะสูง” อย่าง Gemma 4 ไม่ควรถูกมองข้าม หากในอนาคต งานสอบถามประจำวัน การสนทนา การให้เหตุผลง่ายๆ การสร้างโค้ด และการทำความเข้าใจภาพจำนวนมากสามารถทำได้บนอุปกรณ์ท้องถิ่น โดยไม่ต้องซื้อโทเคนจากคลาวด์ นี่จะเป็นความท้าทายต่อโมเดลธุรกิจที่พึ่งพาการสมัครสมาชิก API

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที
Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที
Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

แน่นอนว่าสถานการณ์ปัจจุบันยังไม่รุนแรงถึงขนาดนั้น ตอนนี้ยังมีช่องว่างระหว่างโมเดลโอเพนซอร์สกับโมเดลปิดลิขสิทธิ์ระดับแฟลกชิปชั้นนำ และโมเดลโอเพนซอร์สที่มีประสิทธิภาพสูงส่วนใหญ่ยังถูกจำกัดด้วยพลังการคำนวณของฮาร์ดแวร์ ทำให้ยากที่จะบรรลุระดับที่ใช้งานได้จริงในระดับที่ต้องการบนอุปกรณ์ปลายทาง

Google Gemma 4 ปลดปล่อยการปฏิวัติ AI บนมือถือ: ทางเลือกแทน Gemini ในกระเป๋า พร้อมความเร็วเวทมนตร์ 40 โทเค็น/วินาที

แต่แนวโน้มนั้นชัดเจน ในระยะสั้น โมเดลปิดลิขสิทธิ์บนคลาวด์ยังคงเป็นผู้นำในด้านล้ำสมัย เช่น การให้เหตุผลที่ซับซ้อนและการทำงานร่วมกันของเอเจนต์หลายตัวขนาดใหญ่ ในระยะยาว เมื่อฮาร์ดแวร์ก้าวหน้าและเทคนิคควอนไทเซชันได้รับการปรับให้เหมาะสม โมเดลบนอุปกรณ์ปลายทางจะค่อยๆ เข้ามารับหน้าที่งานง่ายๆ ที่ทำบ่อยๆ จากคลาวด์

ผู้ขายที่พึ่งพาเพียงการขายโทเคนหรือการสมัครสมาชิก API จะถูกบังคับให้มุ่งเน้นมากขึ้นในการแก้ไขปัญหาด้านที่ “ยากจริงๆ” เช่น เอเจนต์ที่ทรงพลังมาก บริบทที่ยาวและเชื่อถือได้มาก และความสามารถเฉพาะทางที่พึ่งพาข้อมูลเรียลไทม์จำนวนมหาศาล

Gemma 4 เป็นเพียงจุดเริ่มต้น ความประหลาดใจครั้งต่อไป อาจเป็นโมเดลบนอุปกรณ์ปลายทางบางรุ่นที่ทำให้ผู้ใช้ไม่รู้สึกถึงความแตกต่างระหว่าง “ท้องถิ่น” กับ “คลาวด์” ในการใช้งานประจำวันเลย เมื่อวันนั้นมาถึง โมเดลธุรกิจของอุตสาหกรรม AI ทั้งหมดจะเผชิญกับการเปลี่ยนแปลงครั้งลึกซึ้ง


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/28748

Like (0)
Previous 9 hours ago
Next 9 hours ago

相关推荐