คำสำคัญ: เอเจนต์, Jeff Dean, การทำงานร่วมกันแบบเต็มสแต็ก, มัลติโมดัล, การนิยามปัญหา
“ในอนาคต วิศวกรแต่ละคนอาจจะต้องบริหารจัดการ ‘เด็กฝึกงาน’ เอเจนต์ 50 ตัว เพื่อทำงานจำนวนมากที่ดำเนินไปพร้อมกันได้ และประสิทธิภาพในการสื่อสารจะสูงกว่าการทำงานร่วมกันระหว่างมนุษย์ด้วยซ้ำ ทักษะที่สำคัญที่สุดในอนาคตจะคือ ‘การเขียนความต้องการให้ชัดเจน’ เพราะคุณภาพผลลัพธ์จากเอเจนต์ขึ้นอยู่กับว่าคุณนิยามปัญหาอย่างไร”
ในเดือนมีนาคม 2026 Jeff Dean หัวหน้านักวิทยาศาสตร์ AI ของ Google และวิศวกรในตำนาน ได้ให้สัมภาษณ์เชิงลึกและเสนอการประเมินสองข้อที่สั่นสะเทือนวงการเทคโนโลยีได้ ขณะที่อุตสาหกรรม AI ทั่วโลกยังคงถกเถียงถึงขีดจำกัดความสามารถของโมเดลขนาดใหญ่ สถานการณ์การใช้งานจริงของเอเจนต์ และเส้นทางสู่ปัญญาประดิษฐ์ทั่วไป ผู้นำผู้กำหนดทิศทางเทคโนโลยี AI ของ Google มานานหลายทศวรรษ และเป็นพยานในกระบวนการทั้งหมดตั้งแต่เริ่มต้นจนถึงการระเบิดตัวของ Deep Learning นี้ ได้ใช้ตรรกะที่สมบูรณ์ สอดคล้องในตัวเอง และผ่านการพิสูจน์ด้วยการปฏิบัติจำนวนมหาศาล เพื่อร่างภาพรวมที่สมบูรณ์ของวิวัฒนาการทางเทคโนโลยี การเปลี่ยนแปลงองค์กร และการปรับโครงสร้างความสามารถของปัจเจกบุคคลในยุค AI

การสัมภาษณ์ที่ยาวนานหลายชั่วโมงนี้ ไม่เพียงแต่เปิดเผยรหัสลับหลักจากกำเนิดสู่การเป็นผู้นำวงการของโมเดลซีรีส์ Gemini ของ Google อย่างสมบูรณ์เป็นครั้งแรกเท่านั้น แต่ยังทำลายความเข้าใจแบบเดิมๆ เกี่ยวกับการพัฒนา AI มากมาย – โมเดลใหญ่และโมเดลเล็กไม่ใช่ความสัมพันธ์ที่ตรงข้ามกัน, มัลติโมดัลไม่จำกัดอยู่แค่ข้อความและภาพที่มนุษย์รับรู้ได้, การแข่งขัน AI ในท้ายที่สุดไม่เคยเป็นการแข่งขันพารามิเตอร์แบบจุดเดียว แต่เป็นการแข่งขันความสามารถของระบบที่ทำงานร่วมกันแบบเต็มสแต็ก
สำหรับผู้ปฏิบัติงานทุกคนที่อยู่ในคลื่นเทคโนโลยีนี้ การสัมภาษณ์ครั้งนี้เปรียบเสมือนคู่มือแห่งยุคสมัย ที่ชี้ให้เห็นกฎเกณฑ์การอยู่รอดและวิวัฒนาการของปัจเจกบุคคลและองค์กรในยุค AI ในอีก 5 ถึง 10 ปีข้างหน้าอย่างชัดเจน
สารบัญ
-
1. การปรับโครงสร้างความสามารถหลัก: จากเขียนโค้ดสู่การนิยามปัญหา การแข่งขันในยุค AI ถูกสับเปลี่ยนใหม่หมด
- 1.1 วิวัฒนาการของเครื่องมือเขียนโปรแกรม: จากผู้ช่วยนักบินสู่ผู้บังคับการ
- 1.2 ทำไม “การเขียนความต้องการให้ชัดเจน” ถึงกลายเป็นทักษะหลัก
- 1.3 วิศวกรในอนาคต: บริหารจัดการ ‘เด็กฝึกงาน’ เอเจนต์ 50 ตัว
- 1.4 การเปลี่ยนแปลงพื้นฐานของบทบาทวิศวกร
-
2. กลยุทธ์สองรางบนแนวหน้า Pareto: วิถีแห่งความสมดุลของ AI ของ Google การมุ่งสู่กันของแนวหน้าค้นคว้าและการใช้งานจริงในระดับกว้าง
- 2.1 แนวหน้า Pareto: ศิลปะแห่งความสมดุลระหว่างประสิทธิภาพและต้นทุน
- 2.2 สองรางคู่ขนาน: แนวหน้าสูงระดับและซีรีส์ Flash ที่คุ้มค่า
- 2.3 เทคนิคการกลั่น: ทำให้ความสามารถแนวหน้าเข้าสู่การใช้งานจริงในระดับกว้างได้อย่างรวดเร็ว
- 2.4 ความหน่วงเวลาต่ำ: กุญแจสำคัญที่กำหนดประสบการณ์ผู้ใช้
- 2.5 การใช้พลังงาน: หลักการแรกของการออกแบบระบบ AI
- 2.6 การทำงานร่วมกันแบบเต็มสแต็ก: สาระสำคัญของการแข่งขัน AI
-
3. จินตนาการสูงสุดของมัลติโมดัล: ไม่จำกัดอยู่แค่การรับรู้ของมนุษย์ AI ต้องเข้าใจโมดัลหลายร้อยชนิดของโลก
- 3.1 มัลติโมดัลในความหมายกว้าง: จากการรับรู้ของมนุษย์สู่ข้อมูลโลก
- 3.2 ภาพและวิดีโอ: ประตูสู่การเข้าใจโลก
- 3.3 ความจำเป็นของยุคโมเดลรวมหนึ่งเดียว
-
4. ชัยชนะของหลักการมองยาว: กฎแห่งการขยายขนาดและการทำงานร่วมกันแบบเต็มสแต็ก คือจุดสิ้นสุดของการแข่งขัน AI
- 4.1 ความเชื่อมั่นสามสิบปี: การขยายขนาดคือพลัง
- 4.2 การกำเนิดของ Gemini: รวมทรัพยากรสร้างพลังร่วม
- 4.3 การทำงานร่วมกันแบบเต็มสแต็ก: การประสานงานลึกจากชิปสู่โมเดล
-
5. ภาพอนาคตของ AI: ความเป็นไปได้ใหม่ของความเป็นส่วนตัว ความหน่วงเวลาต่ำ และการทำงานร่วมกันระหว่างมนุษย์กับเครื่อง
- 5.1 โมเดลเฉพาะบุคคล: ผู้ช่วยส่วนตัวที่เข้าใจคุณจริงๆ
- 5.2 ฮาร์ดแวร์เฉพาะทาง: เปิดยุคหมื่นโทเค็นต่อวินาที
- 5.3 การทำงานร่วมกันระหว่างมนุษย์กับเครื่อง: การร่วมมือที่ลึกซึ้งยิ่งขึ้น ไม่ใช่การแยกตัว
- 5.4 ความท้าทายในอนาคต: ความน่าเชื่อถือ, Reinforcement Learning และคอนเท็กซ์ยาวพิเศษ
- 5.5 มุมมองในแง่ดี: การก้าวกระโดดจากคณิตศาสตร์ระดับประถมสู่ IMO
1. การปรับโครงสร้างความ能力หลัก: จากเขียนโค้ดสู่การนิยามปัญหา การแข่งขันในยุค AI ถูกสับเปลี่ยนใหม่หมด
ในการสัมภาษณ์ทั้งหมด การประเมินของ Jeff Dean เกี่ยวกับ “การเขียนความต้องการให้ชัดเจนจะกลายเป็นทักษะหลักในอนาคต” ก่อให้เกิดการสะท้อนความคิดและการอภิปรายอย่างกว้างขวางที่สุด การประเมินนี้ไม่ได้มาจากความว่างเปล่า แต่มาจากการสังเกตและการปฏิบัติระยะยาวของเขาต่อวิวัฒนาการของเครื่องมือเขียนโปรแกรมและการเปลี่ยนแปลงรูปแบบการทำงานร่วมกันระหว่างมนุษย์กับเครื่อง
1.1 วิวัฒนาการของเครื่องมือเขียนโปรแกรม: จากผู้ช่วยนักบินสู่ผู้บังคับการ
หลายทศวรรษที่ผ่านมา ความสามารถหลักของวิศวกรรมซอฟต์แวร์หมุนรอบ “การเขียนโค้ดให้ทำงานได้” เสมอ ตั้งแต่ภาษาแอสเซมบลีสู่ภาษาโปรแกรมระดับสูง จากสถาปัตยกรรมโมโนลิธิกสู่ระบบกระจายศูนย์ ความสามารถในการแข่งขันหลักของวิศวกร คือการเชี่ยวชาญภาษาโปรแกรม โครงสร้างข้อมูล ตรรกะอัลกอริทึม เพื่อเปลี่ยนความต้องการที่คลุมเครือให้เป็นโค้ดที่ทำงานได้
แม้ในช่วงเริ่มต้นที่เครื่องมือเขียนโปรแกรมช่วยด้วย AI เกิดขึ้น ความเข้าใจหลักของวงการยังคงเป็น “AI คือผู้ช่วยนักบินที่ช่วยวิศวกรเขียนโค้ด” การออกแบบและการทำให้ทำงานจริงยังคงนำโดยมนุษย์ แต่ Jeff Dean ชี้ชัดในการสัมภาษณ์ว่า รูปแบบนี้กำลังเกิดการพลิกผันพื้นฐาน
เขากล่าวตรงๆ ว่า เครื่องมือเขียนโปรแกรมในปัจจุบันเมื่อเทียบกับหนึ่งสองปีก่อนมีความก้าวหน้าอย่างมาก นักพัฒนาสามารถมอบหมายงานที่ซับซ้อนมากขึ้นให้ AI ทำได้ และวิธีการที่มนุษย์มีปฏิสัมพันธ์กับ AI กำหนดคุณภาพผลลัพธ์ของ AI โดยตรง – คุณสามารถให้มันเขียนเทสต์เคส ทำการระดมสมองเพื่อเพิ่มประสิทธิภาพ หรือให้มันทำงานโมดูลที่สมบูรณ์อย่างอิสระ งานที่ต่างกันเหมาะกับรูปแบบการโต้ตอบที่ต่างกัน แต่รูปแบบทั้งหมดมีข้อกำหนดเบื้องต้นร่วมกัน: คุณต้องนิยามความต้องการให้ชัดเจนพอ
1.2 ทำไม “การเขียนความต้องการให้ชัดเจน” ถึงกลายเป็นทักษะหลัก
ในมุมมองของ Jeff Dean ในอดีตทุกคนในวงการถูกสอนให้เขียนข้อกำหนดคุณลักษณะให้ชัดเจน แต่ความจริงแล้วมีน้อยคนที่ให้ความสำคัญกับผลผลิต “ข้อกำหนดภาษาอังกฤษ” นี้อย่างแท้จริง เพราะสุดท้ายโค้ดเขียนด้วยตัวเอง เงื่อนไขขอบเขต ข้อกำหนดประสิทธิภาพ สถานการณ์จัดการข้อผิดพลาดมากมาย ซ่อนอยู่ในสมองของนักพัฒนา แม้ข้อกำหนดคุณลักษณะจะมีจุดคลุมเครือ ก็สามารถเติมเต็มในกระบวนการเขียนโค้ดได้ แต่เมื่อคุณมอบหมายงานเขียนโค้ดให้เอเจนต์ รูปแบบนี้ใช้การไม่ได้อีกต่อไป “ถ้าคุณไม่ได้เขียนสถานการณ์ขอบเขตบางอย่างให้ชัดเจน ไม่ได้เน้นข้อกำหนดประสิทธิภาพ โมเดลมีแนวโน้มสูงที่จะมองข้ามสิ่งเหล่านี้ คุณภาพผลลัพธ์ขึ้นอยู่กับว่าคุณนิยามปัญหาอย่างไร”
นี่คือเหตุผลหลักที่เขาเน้นย้ำซ้ำๆ ว่า “การแสดงออกความต้องการอย่างชัดเจน” จะกลายเป็นทักษะหลัก ในยุค AI คุณค่าหลักของวิศวกรไม่ใช่ “ทำอย่างไรให้ทำงานได้” อีกต่อไป แต่คือ “ทำให้อะไรทำงานได้” – คุณต้องใช้ภาษาที่แม่นยำ ไม่กำกวม นิยามเป้าหมาย ขอบเขต ข้อจำกัด กฎการจัดการข้อผิดพลาดของระบบให้ชัดเจน เปลี่ยนประสบการณ์โดยนัยในสมองให้เป็นกฎชัดเจนที่เอเจนต์เข้าใจได้ บ่อยครั้งผลลัพธ์จากโมเดลไม่ตรงตามความคาดหวัง โดยพื้นฐานไม่ใช่เพราะความสามารถของโมเดลไม่ดี แต่เพราะความต้องการของผู้ใช้ “ขาดข้อกำหนด” โมเดลสามารถคาดเดาเจตนาจริงของผู้ใช้ได้เฉพาะในนิยามที่คลุมเครือ
1.3 วิศวกรในอนาคต: บริหารจัดการ ‘เด็กฝึกงาน’ เอเจนต์ 50 ตัว
จากความเข้าใจนี้ Jeff Dean โยนคำทำนายที่สั่นสะเทือนว่า “ในอนาคตวิศวกรแต่ละคนจะบริหารจัดการ ‘เด็กฝึกงาน’ เอเจนต์ 50 ตัว” ในแนวคิดของเขา รูปแบบการวิจัยและพัฒนาซอฟต์แวร์ในอนาคต จะพลิกโฉมรูปแบบองค์กรที่มีอยู่ในปัจจุบันอย่างสิ้นเชิง ถ้าวิศวกรคนหนึ่งสามารถนิยามความต้องการและแยกย่อยงานได้ชัดเจน เขาสามารถบริหารจัดการเอเจนต์ 50 ตัวพร้อมกันได้อย่างเต็มที่ ให้พวกมันทำงานพัฒนา ทดสอบ เพิ่มประสิทธิภาพโมดูลต่างๆ ไปพร้อมกัน โดยไม่ต้องจ่ายต้นทุนการสื่อสารและต้นทุนการจัดการสูงเหมือนการบริหารจัดการทีมมนุษย์จริง
เขาอธิบายเพิ่มเติมว่า องค์กรซอฟต์แวร์แบบดั้งเดิมมีการแบ่งงานสูงอยู่แล้ว ทีม 50 คน แต่ละคนรับผิดชอบโมดูลที่ต่างกัน ระหว่างกันเองไม่มีการโต้ตอบความถี่สูง เวลาจำนวนมากใช้ไปกับการปรับความต้องการให้ตรงกัน การสื่อสารข้ามโมดูล การประสานงานความคืบหน้า
1.4 การเปลี่ยนแปลงพื้นฐานของบทบาทวิศวกร
ในรูปแบบนี้ บทบาทของวิศวกรก็เปลี่ยนแปลงไปอย่างพื้นฐาน: จากผู้ปฏิบัติการเขียนโค้ดระดับแนวหน้า กลายเป็นผู้จัดการทีมเอเจนต์ ผู้ออกแบบระบบ และผู้นิยามความต้องการ ควบคู่ไปกับนั้น แนวทางวิศวกรรมซอฟต์แวร์คุณภาพสูงและแนวปฏิบัติที่ดีทางเทคนิคทั่วไป จะมีความสำคัญอย่างที่ไม่เคยมีมาก่อน
Jeff Dean ยกตัวอย่างในการสัมภาษณ์ว่า ในการพัฒนาระบบกระจายศูนย์ ถ้าคุณสามารถเขียนแนวทางสั้นๆ ที่รวมประเภทความล้มเหลวทั่วไป 20 ชนิดพร้อมวิธีการจัดการที่สอดคล้องกัน และใส่ไว้ในคอนเท็กซ์ของเอเจนต์เขียนโค้ดได้ จะสามารถเพิ่มความน่าเชื่อถือและความแข็งแกร่งของระบบกระจายศูนย์ที่มันสร้างขึ้นได้อย่างมาก ประสบการณ์ทั่วไปที่ตกตะกอนเหล่านี้ ไม่เพียงช่วยให้นักพัฒนาคนอื่นเขียนคำแนะนำความต้องการที่ชัดเจนขึ้นได้เท่านั้น แต่ยังทำให้คุณภาพผลลัพธ์ของเอเจนต์ก้าวกระโดดได้อย่างมีคุณภาพ
2. กลยุทธ์สองรางบนแนวหน้า Pareto: ศิลปะแห่งความสมดุลระหว่างประสิทธิภาพและต้นทุน
ในการสัมภาษณ์ทั้งหมด Jeff Dean กล่าวถึงแนวคิดหลัก “แนวหน้า Pareto” หลายครั้ง นี่คือกลยุทธ์หลักของ AI ของ Google ที่รักษาความเป็นผู้นำในการแข่งขันอันดุเดือดของวงการ
2.1 แนวหน้า Pareto: การประนีประนอมระหว่างประสิทธิภาพและต้นทุน
ที่เรียกว่าแนวหน้า Pareto อธิบายถึงเซตของคำตอบที่ดีที่สุดเมื่อต้องประนีประนอมระหว่างเป้าหมายหลายอย่าง ในสาขา AI คือการหาจุดสมดุลที่ดีที่สุดระหว่างประสิทธิภาพโมเดลกับต้นทุนและความหน่วงเวลา – ทั้งต้องแสวงหาการก้าวข้ามขีดจำกัดประสิทธิภาพขั้นสูงสุด และต้องควบคุมต้นทุนและประสิทธิภาพที่สามารถใช้งานจริงในระดับกว้างได้
กลยุทธ์ AI ของหลายบริษัทในวงการมักตกอยู่ในความเข้าใจผิดแบบไม่ใช่ทางนี้ก็ทางโน้น:
* ทางหนึ่งพุ่งชนโมเดลใหญ่แนวหน้าอย่างเต็มที่ แสวงหาความสามารถในการให้เหตุผลขั้นสูงสุด แต่กลับมองข้ามต้นทุนและความหน่วงเวลา ส่งผลให้โมเดลใช้งานจริงในระดับกว้างได้ยาก
* อีกทางหนึ่งมุ่งเน้นเฉพาะโมเดลเล็กต้นทุนต่ำ แสวงหาประสิทธิภาพการใช้งานจริง แต่เสียสละขีดจำกัดบนของการแก้ปัญหาที่ซับซ้อนและมีมูลค่าสูง
ส่วนกลยุทธ์ AI ของ Google ที่ Jeff Dean นำทาง เลือกเส้นทางสองรางคู่ขนาน โดยมีเป้าหมายเพื่อครอบครองตำแหน่งที่ดีที่สุดบนแนวหน้า Pareto
2.2 สองรางคู่ขนาน: การสำรวจแนวหน้าและการใช้งานจริงในระดับกว้าง
เขาระบุชัดเจนในการสัมภาษณ์ว่า การวิจัยและพัฒนาโมเดลของ Google ดำเนินไปสองเส้นทางพร้อมกันเสมอ:
* โมเดลแนวหน้าสูงระดับ: มุ่งเน้นงานยากระดับสูง เช่น การให้เหตุผลเชิงลึก ปัญหาคณิตศาสตร์ซับซ้อน เพื่อผลักดันขอบเขตความสามารถของทั้งวงการให้ก้าวไปข้างหน้า
* โมเดลซีรีส์ Flash ที่คุ้มค่า: ออกแบบสำหรับสถานการณ์ใช้งานจริงในระดับกว้างที่มีความหน่วงเวลาต่ำและพร้อมกันสูง เช่น การเขียนโปรแกรมเอเจนต์, Gmail, YouTube, การค้นหา และผลิตภัณฑ์ที่ผู้ใช้หลายพันล้านคนใช้งาน
ในมุมมองของ Jeff Dean สองเส้นทางนี้ไม่ใช่สิ่งที่ตรงข้ามกัน แต่เป็นองค์รวมที่เสริมซึ่งกันและกัน เทคโนโลยีหลักที่เชื่อมโยงทั้งสองสิ่ง คือเทคนิคการกลั่นโมเดลที่เขาและ Geoffrey Hinton, Oriol Vinyals เสนอตั้งแต่ปี 2014 นี่คือความลับหลักที่ทำให้ Gemini Flash ซีรีส์สามารถทำได้ “ทั้งเร็วและฉลาด”
2.3 เทคนิคการกลั่น: ทำให้ความสามารถแนวหน้าเข้าสู่การใช้งานจริงในระดับกว้างได้อย่างรวดเร็ว
Jeff Dean ย้อนกลับไปที่จุดเริ่มต้นและวิวัฒนาการของเทคนิคการกลั่น ในตอนแรก พวกเขาต้องการ “บีบอัด” ความสามารถของโมเดลผู้เชี่ยวชาญหลายตัว เข้าไปในโมเดลเดียวที่เล็กกว่าและสามารถใช้งานจริงได้ ปัจจุบัน ตรรกะนี้วิวัฒนาการเป็น: การถ่ายโอนความสามารถของโมเดลแนวหน้าขนาดใหญ่มหึมา ไปยังโมเดล Flash ที่เล็กกว่าและเบากว่า
เขาอธิบายว่า ข้อได้เปรียบหลักของการกลั่นคือ
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/25683
