
ท่ามกลางความตื่นเต้นและความกังวลของอุตสาหกรรม Richard Sutton ผู้ได้รับรางวัลทัวริงและบิดาแห่งการเรียนรู้แบบเสริมแรง ได้แสดงวิเคราะห์ที่เยือกเย็นและขัดกับสัญชาตญาณเกี่ยวกับ AI ในการถ่ายทอดสดระดับโลกครั้งแรกหลังจากก่อตั้ง SAIR
Sutton เริ่มต้นด้วยการชี้ให้เห็นข้อสรุปที่เยือกเย็น: AI ในปัจจุบันเป็นเพียงความฉลาดเฉพาะส่วน และไม่ได้ก้าวหน้าในระดับความฉลาดอย่างรวดเร็ว เขาคิดว่าความก้าวหน้าสำคัญของ AI ส่วนใหญ่มาจากการคำนวณขนาดใหญ่และการจดจำรูปแบบ แต่นี่คือความสามารถเฉพาะเจาะจงและเฉพาะส่วน ไม่เท่ากับ “ความฉลาดทั้งหมด” เขาชี้แจงคำจำกัดความของ “ความฉลาด” ก่อน:
เมื่อฉันใช้คำว่า “ความฉลาด” ฉันหมายถึง: ความสามารถในการปรับพฤติกรรมเพื่อบรรลุเป้าหมาย
คุณไม่ได้แค่ “ฉลาด” หรือ “ไม่ฉลาด” แต่มีความสามารถในระดับหนึ่งที่จะบรรลุเป้าหมาย
ประการที่สอง Sutton คิดว่าการสร้างภาพและวิดีโอเป็นความก้าวหน้าทางวิศวกรรมที่สำคัญ แต่ไม่ได้เป็นแกนกลางของ “ความฉลาด”:
จิตใจ (Mind) จำเป็นต้องสร้างภาพเมื่อแสดงพฤติกรรมที่ฉลาดจริงๆ หรือ?
คำตอบคือไม่ เราแน่นอนต้องประมวลผลภาพและวิดีโอ แต่เราไม่จำเป็นต้องสร้างมัน
Sutton ต่อมาได้ลดความร้อนแรงของ “ทฤษฎี AGI ใกล้เข้ามา” เขาชี้ให้เห็นว่า AI ในปัจจุบันโดยพื้นฐานแล้วคือ “จิตใจที่อ่อนแอ” เหตุผลที่โมเดลดูทรงพลัง เพราะพวกมันดูดซับความรู้ของมนุษย์เกือบทั้งหมด นอกเหนือจากนี้แล้ว AI แบบสร้างสรรค์ (Generative AI) จริงๆ แล้วเปราะบางมาก — ไม่น่าเชื่อถือ หลงทางง่าย ขาดโครงสร้างเป้าหมายที่มั่นคง ประเด็นสำคัญคือ AI ในปัจจุบันมุ่งเน้นที่เครื่องจักรมากเกินไป และละเลยการเรียนรู้จากประสบการณ์
โมเดลขนาดใหญ่ถูกแช่แข็งหลังการใช้งาน ไม่มีประสบการณ์ต่อเนื่อง ไม่มีสัญญาณรางวัลจริง ไม่มีรางวัล ก็ไม่มีเป้าหมาย ไม่มีการเปรียบเทียบระหว่างการคาดการณ์กับความเป็นจริง ก็ไม่มี “ความจริง”
กล่าวอีกนัยหนึ่ง โมเดลในปัจจุบันเหมือนคนที่อ่านสารานุกรมหมดแต่ไม่มีประสบการณ์ชีวิต
Sutton กล่าวว่า การเรียนรู้ของเครื่องสมัยใหม่ได้ถึงขีดจำกัดของยุคสมัยแล้ว: โดยพื้นฐานแล้วคือการถ่ายโอนความรู้ที่มีอยู่ของมนุษย์เข้าไปในเครื่องจักร และหยุดเรียนรู้หลังการฝึกอบรม ปัจจุบัน ข้อมูลคุณภาพสูงของมนุษย์เกือบหมดแล้ว
อย่างไรก็ตาม ทิศทางของ AI กำลังเปลี่ยนแปลงใหม่ Sutton คิดว่า ขั้นตอนต่อไปที่แท้จริงคือ “ยุคแห่งประสบการณ์” ความฉลาดจะเติบโตได้ก็ต่อเมื่อเรียนรู้จากประสบการณ์เท่านั้น เขาแบ่งการพัฒนา AI ในช่วง 10 ปีที่ผ่านมาออกเป็นสามช่วง: ยุคจำลอง (เช่น AlphaGo) ยุคข้อมูลมนุษย์ (โมเดลภาษาขนาดใหญ่) และยุคประสบการณ์ (เอเจนต์เรียนรู้อย่างต่อเนื่องในโลกจริง)
Sutton เสนอว่า “การวิจัยความฉลาด” ต้องการ “วิทยาศาสตร์บูรณาการของจิตใจ” ใหม่ (ซึ่งไม่ใช่แค่วิทยาศาสตร์ธรรมชาติ หรือเพียงวิศวกรรมหรือการประยุกต์ใช้เทคโนโลยี) และการเรียนรู้แบบเสริมแรงจะเป็นจุดเริ่มต้นของการศึกษาวิทยาศาสตร์นี้
ในขณะเดียวกัน ผู้ได้รับรางวัลทัวริงท่านนี้คัดค้านแนวทาง “ควบคุม AI แบบรวมศูนย์” เขาคิดว่าบางคนพยายามควบคุม AI โดยอ้าง “ความปลอดภัย” ซึ่งโดยพื้นฐานแล้วคือความวิตกกังวลเรื่อง “อำนาจที่ควบคุมไม่ได้” “AI ควรเป็นการทำงานร่วมกันแบบกระจายอำนาจ” Sutton เรียกร้องให้มีการร่วมมือในสาขา AI คัดค้านการปิดกั้นและจำกัดทางภูมิรัฐศาสตร์:
การร่วมมือไม่ใช่สิ่งที่เป็นไปได้เสมอ แต่ตั้งแต่การแลกเปลี่ยนทางเศรษฐกิจไปจนถึงสถาบันทางสังคม ตั้งแต่รัฐบาลไปจนถึงตลาด สิ่งดีงามเกือบทั้งหมดในโลกล้วนมาจากการร่วมมือ
สุดท้าย Sutton ให้ข้อสรุปจากมุมมองนิยายวิทยาศาสตร์: มนุษย์อาจถูก AI สืบทอดในที่สุด มนุษย์จะเข้าใจและสร้างความฉลาดในที่สุด และความฉลาดนี้จะก้าวข้ามมนุษย์อย่างรวดเร็ว ในระดับจักรวาล นี่คือวิวัฒนาการที่หลีกเลี่ยงไม่ได้ เขาแบ่งยุคใหญ่ของจักรวาลออกเป็นสี่ยุค: ยุคอนุภาค ยุคดาวฤกษ์ ยุคการจำลองแบบ และยุคการออกแบบ
โดยสรุป เส้นหลักสองประการของสุนทรพจน์ของ Sutton คือ:
ประการแรก แก่นแท้ของความฉลาดไม่ได้อยู่ที่การเลียนแบบให้ “เหมือนมนุษย์” แต่อยู่ที่การปรับตัวเพื่อเป้าหมาย เราได้ก้าวเข้าสู่ “ยุคแห่งประสบการณ์” แล้ว
ประการที่สอง AI เป็นสิ่งที่หลีกเลี่ยงไม่ได้ในวิวัฒนาการของจักรวาล และมนุษย์อย่างน้อยที่สุดคือตัวเร่งปฏิกิริยาในยุคนี้
AI ในปัจจุบัน ไม่ได้ก้าวหน้าอย่างรวดเร็วในระดับความฉลาด ดีใจที่ได้แลกเปลี่ยนกับทุกท่าน ฉันฟังรายงานบางส่วนในตอนเช้า แล้วก็ตระหนักขึ้นมา: ฉันอยากพูดถึงบางสิ่งที่ไม่ได้เตรียมไว้ ดังนั้น วันนี้ฉันจึงจัดทำสไลด์ขึ้นมาสองสามหน้า ก่อนเข้าสู่การพูดอย่างเป็นทางการ ฉันอยากพูดสักสองสามคำ
เริ่มจากสถานการณ์ปัจจุบัน: AI ในวันนี้เป็นอย่างไร? ผู้คนมองมันอย่างไร? เกือบทุกคนคิดว่า AI กำลังก้าวหน้าอย่างรวดเร็วมาก ซึ่งแน่นอนว่าน่าตื่นเต้น แต่เมื่อทุกคนคิดเหมือนกัน เราจำเป็นต้องหยุดถาม: จริงๆ แล้วเป็นอย่างนั้นหรือ? AI ก้าวหน้าอย่างรวดเร็วจริงๆ หรือ?
แน่นอน ในการทำให้คอมพิวเตอร์ใช้ภาษาได้คล่องแคล่ว เราก้าวหน้าไปมาก ฉันคิดว่านี่คือความก้าวหน้าที่สำคัญและแท้จริง อันที่จริง เราคิดมานานแล้วว่าจะใช้โครงข่ายประสาทเทียมทำสิ่งนี้ และวันนี้มันได้รับการพิสูจน์แล้วว่าทำได้ ในขณะเดียวกัน ด้วยทรัพยากรการคำนวณมหาศาล เรายังสร้างภาพและวิดีโอที่สมจริงมากๆ ออกมา
แต่ปัญหาคือ: จิตใจจำเป็นต้องสร้างภาพเมื่อแสดงพฤติกรรมที่ฉลาดจริงๆ หรือ?
คำตอบคือไม่ เราแน่นอนต้องประมวลผลภาพและวิดีโอ แต่เราไม่จำเป็นต้องสร้างมัน นี่ไม่ใช่สิ่งที่จิตใจทำเอง งานประเภทนี้ต้องการการคำนวณมหาศาล และยากมากจริงๆ แต่พวกมันไม่ได้เป็นส่วนประกอบหลักของสิ่งที่เราเรียกว่า “ความฉลาด”
เรายังเห็นการประยุกต์ใช้จริงใหม่ๆ เกิดขึ้น พวกมันกระตุ้นรูปแบบอุตสาหกรรมใหม่ สร้างคุณค่าทางเศรษฐกิจมหาศาล ความก้าวหน้าที่สำคัญเหล่านี้ส่วนใหญ่มาจากการคำนวณขนาดใหญ่และการจดจำรูปแบบ แต่โดยพื้นฐานแล้วพวกมันคือความสามารถเฉพาะเจาะจงและเฉพาะส่วน ไม่เท่ากับ “ความฉลาดทั้งหมด” ส่วนหนึ่งของพวกมันจริงๆ แล้วเป็นการคำนวณ และเราเรียกพวกมันว่า “ความฉลาด” ส่วนใหญ่เพราะฟังดูสำคัญกว่า
โมเดล AI เองอ่อนแอมาก
ดังนั้น ฉันอยากถาม: ในฐานะวิทยาศาสตร์ AI ก้าวหน้าอย่างรวดเร็วจริงๆ หรือ?
(เสียงหัวเราะในที่ประชุม)
ขอบคุณสำหรับเสียงหัวเราะ ในความคิดเห็นที่ไม่ถ่อมตัวของฉัน ความเข้าใจที่แท้จริงของเราต่อ AI นั้นจำกัดมาก เรากำลังปรับพารามิเตอร์และซ่อมแซมมากกว่า เราไม่รู้หลักการของจิตใจ และไม่รู้กลไกพื้นฐานของความฉลาด
จากมุมมองทางวิทยาศาสตร์ นี่ไม่น่าพอใจในหลายด้าน ฉันชอบความเข้าใจอีกแบบหนึ่งมากกว่า: เหตุผลที่โมเดล AI ในปัจจุบันดูทรงพลัง เพราะพวกมันดูดซับความรู้ของมนุษย์เกือบทั้งหมด แต่ถ้าไม่นับสิ่งนี้ พวกมัน “อ่อนแอ” พวกมันมีโครงสร้างจิตใจที่เปราะบาง ไม่น่าเชื่อถือ หลงทางง่าย กระจัดกระจายง่าย นอกเหนือจากความรู้ปริมาณมากแล้ว พวกมันไม่ได้ทรงพลังจริงๆ นี่อาจเป็นวิธีที่เข้าใจ AI ในปัจจุบันได้แม่นยำกว่า
AI ในปัจจุบัน ยังไม่ใช่ความฉลาดที่แท้จริง
แล้ว AI ที่เราพูดถึงคืออะไร?
มันคือ “ปัญญาประดิษฐ์” ซึ่งต้องการให้เราตอบคำถามพื้นฐานกว่านี้ก่อน: อะไรคือ “ความฉลาด”? ผู้คนให้คำจำกัดความมากมายตลอดหลายปี ฉันขอยกตัวอย่างความคิดเห็นที่มีอำนาจและได้รับการยอมรับกว้างขวางมากขึ้น
ย้อนกลับไปได้ถึง William James ผู้ก่อตั้งจิตวิทยา จิตวิทยาเกือบจะเป็นเรื่องการศึกษาจิตใจ ในปี 1890 James ไม่ได้พูดถึง “ความฉลาด” โดยตรง แต่พูดถึง “จิตใจ” เขาคิดว่า เครื่องหมายของจิตใจคือ: การใช้วิธีการที่เปลี่ยนแปลงได้เพื่อบรรลุเป้าหมายที่สอดคล้องกัน นั่นคือเพื่อให้ได้ผลลัพธ์ที่ค่อนข้างคงที่ คุณสามารถเปลี่ยนวิธีการกระทำได้อย่างยืดหยุ่น และผลลัพธ์นั้นคือเป้าหมายที่คุณแสวงหา

ต่อไป มาดูว่า Alan Turing เข้าใจความฉลาดอย่างไร Turing ไม่ได้ทิ้งคำจำกัดความที่กระชับสูง แต่ผู้คนมักเข้าใจความคิดของเขาว่า: ความฉลาดส่วนใหญ่แสดงออกผ่านพฤติกรรมเหมือนมนุษย์ “การทดสอบทัวริง” ที่พูดถึงในวันนี้เป็นความต่อเนื่องของความคิดนี้ นั่นคือการตัดสินว่ามีความฉลาดหรือไม่โดยการเลียนแบบ แสร้งทำเป็นเป็นคน แน่นอน Turing เองไม่เคยเรียกมันว่า “การทดสอบทัวริง” เขาเรียกมันว่า “เกมเลียนแบบ” ฉันไม่คิดว่าเขามองว่ามันเป็นการทดสอบจริงๆ ด้วยซ้ำ
อย่างไรก็ตาม ในบริบทปัจจุบัน ผู้คนมักมองว่า “พฤติกรรมเหมือนมนุษย์” เป็นมาตรฐานสำคัญของความฉลาด แต่ฉันไม่คิดว่านี่เป็นเหตุผลพื้นฐานที่มนุษย์ทรงพลัง มนุษย์ทรงพลังเพราะเราเป็นสิ่งมีชีวิตที่ฉลาด ไม่ใช่เพราะเราเหมือนใคร เรายังใช้ “เหมือนมนุษย์หรือไม่” เป็นเกณฑ์ แต่ปัญหาที่สำคัญจริงๆ คือ: มนุษย์คืออะไร?
หากคุณค้นหาคำในพจนานุกรม คุณอาจเห็นคำจำกัดความนี้: ความฉลาดคือความสามารถในการได้รับและประยุกต์ใช้ความรู้และทักษะ ฉันคิดว่านี่เป็นคำจำกัดความที่ดีมาก มันเน้นความรู้ เน้นการได้รับความรู้ การมีความรู้ และการประยุกต์ใช้ทักษะ
จากมุมมองของ AI John McCarthy หนึ่งในผู้ก่อตั้งปัญญาประดิษฐ์ให้คำจำกัดความว่า: ความฉลาดคือส่วนที่คำนวณได้ของความสามารถในการบรรลุเป้าหมาย คำจำกัดความนี้เน้น “ความสามารถ” และความสามารถทั้งหมดมีระดับแตกต่างกัน ไม่ใช่การตัดสินแบบสองขั้ว สิ่งสำคัญกว่านั้นคือ มันมุ่งเน้นไปที่ส่วน “ที่คำนวณได้” ของความสามารถ นั่นคือต้องบรรลุเป้าหมายผ่านการคำนวณและการประมวลผลระดับจิตใจ นี่ยังสอดคล้องกับสิ่งที่ William James กล่าวว่า “การใช้วิธีการที่เปลี่ยนแปลงได้เพื่อบรรลุเป้าหมายที่สอดคล้องกัน”
บนพื้นฐานนี้ ฉันเสนอเวอร์ชันของตัวเอง: ความฉลาดคือความสามารถในการปรับเปลี่ยนพฤติกรรมอย่างเหมาะสมเพื่อบรรลุเป้าหมาย คำจำกัดความเองไม่ใช่สิ่งเดียว วัตถุประสงค์คือเพื่อส่งเสริมความเข้าใจและการสื่อสาร เมื่อฉันใช้คำว่า “ความฉลาด” ฉันหมายถึงความสามารถในการปรับพฤติกรรมเพื่อบรรลุเป้าหมายนี้ ประเด็นสำคัญคือ “การปรับตัว” ฉันคิดว่าการเรียนรู้ — โดยเฉพาะกระบวนการได้รับความรู้และทักษะ — สำคัญมาก และไม่ใช่แค่การมีพวกมัน
แน่นอน ข้อเสนอนี้ไม่ได้ปราศจากความเห็นต่าง สังเกตเส้นทางหลักของ AI ในปัจจุบัน จะพบว่ามันเกือบทั้งหมดเกี่ยวกับการคำนวณและการจดจำรูปแบบ และส่วนใหญ่เน้นที่ “พฤติกรรมเหมือนมนุษย์”

เราต้องการวิทยาศาสตร์ใหม่ — “วิทยาศาสตร์บูรณาการของจิตใจ” สิ่งที่ฉันพยายามทำอยู่คือวิทยาศาสตร์จิตใจแบบบูรณาการนี้ ซึ่งใช้ได้กับมนุษย์ สัตว์อื่นๆ และเครื่องจักร เพราะจิตใจเหล่านี้มีพื้นฐานร่วมกัน: จิตใจของมนุษย์และสัตว์คล้ายกันมาก และจิตใจของเครื่องจักรก็เริ่มแสดงโครงสร้างร่วมบางอย่าง ในอนาคต จะมีจิตใจเครื่องจักรจำนวนมากในโลก
อย่างไรก็ตาม ไม่มีสาขาวิชาใดที่รับบทบาทนี้ตามธรรมชาติ จิตวิทยากำลังจำกัดตัวเองมากขึ้นในการศึกษาจิตใจตามธรรมชาติ (มนุษย์และสัตว์) แทนที่จะสำรวจแนวคิดทั่วไปว่า “จิตใจอาจเป็นอย่างไร” ปัญญาประดิษฐ์มุ่งเน้นที่เครื่องจักร แต่กำลังกลายเป็นวิศวกรรมมากขึ้น เน้น “การสร้างสิ่งของ” มากกว่าการเข้าใจจิตใจ และแทบไม่รวมการศึกษาจิตใจตามธรรมชาติ วิทยาศาสตร์การรู้คิดแยกออกเป็นหลายทิศทาง โดยรวมยังเน้นที่จิตใจตามธรรมชาติเป็นหลัก

น่าเสียดายที่สาขาเหล่านี้ดูเหมือนจะไม่สามารถรับบทบาทวิทยาศาสตร์จิตใจแบบบูรณาการที่ศึกษาจิตใจประเภทต่างๆ ข้ามตัวพาหะได้อย่างแท้จริง และการเรียนรู้แบบเสริมแรงที่ฉันทำ อาจเป็นจุดเริ่มต้นของวิทยาศาสตร์จิตใจแบบบูรณาการนี้ เพราะมันครอบคลุมหลายสาขาจริงๆ
แล้ว อะไรคือการเรียนรู้แบบเสริมแรง?
การเรียนรู้แบบเสริมแรงคือวิธีการเรียนรู้ที่เน้น “เอเจนต์” เป็นศูนย์กลาง มันเรียนรู้จากประสบการณ์ผ่านการโต้ตอบกับสิ่งแวดล้อม เพื่อบรรลุเป้าหมาย ในแง่นี้ มันสมจริง มีความทะเยอทะยาน และเป็นอิสระมากกว่าประเภทอื่นๆ ของการเรียนรู้ของเครื่อง เอเจนต์ดำเนินการในโลก ไม่ได้สมมติว่าต้องมีผู้ช่วยเหลือ มันแค่โต้ตอบกับโลก สังเกตว่าบรรลุเป้าหมายหรือไม่ จากนั้นปรับพฤติกรรมเพื่อบรรลุเป้าหมายได้ดีขึ้น

วิธีการเรียนรู้นี้ยังใกล้เคียงกับความเป็นจริงมากขึ้น สัตว์ไม่ได้ได้รับความช่วยเหลือมากนักจากสิ่งแวดล้อม แก่นแท้ของการเรียนรู้แบบเสริมแรงคือการลองผิดลองถูก คือการเรียนรู้ผ่านผลตอบรับที่ล่าช้า สิ่งที่คุณมีคือสัญญาณรางวัล: ในที่สุดคุณได้ผลลัพธ์ที่ต้องการหรือไม่? นี่คือวิธีการเรียนรู้ของเครื่องที่ใกล้เคียงกับวิธีการเรียนรู้ตามธรรมชาติมากที่สุด สามารถตัดสินถูกผิดได้ด้วยตัวเอง
ตัวอย่างเช่น โมเดลภาษาขนาดใหญ่ไม่รู้ว่าสิ่งที่พูดถูกต้องหรือไม่ ในขณะที่เมื่อคุณเรียนรู้จากประสบการณ์ ทำนายสิ่งที่กำลังจะเกิดขึ้น คุณสามารถเห็นว่าการคาดการณ์ถูกต้องหรือไม่ เมื่อคุณดำเนินการและได้รับรางวัล คุณสามารถตัดสินว่าวิธีการนี้ดีหรือไม่ดี
บางที นี่อาจเป็นจุดเริ่มต้นของวิทยาศาสตร์จิตใจ: ซึ่งไม่ใช่แค่วิทยาศาสตร์ธรรมชาติ หรือเพียงวิศวกรรมหรือการประยุกต์ใช้เทคโนโลยี
ฉันอยากอ้างอิงคำพูดของ Alan Turing ในการบรรยายปี 1947 ซึ่งอาจเป็นการพูดคุยสาธารณะครั้งแรกของโลกเกี่ยวกับปัญญาประดิษฐ์ Turing เองไม่รู้ว่าเขาคือ “กลุ่มการเรียนรู้แบบเสริมแรง”

เราอยู่ในยุค “การฝึกอบรมจากข้อมูลมนุษย์” ระบบ AI เกือบทั้งหมดทำนายคำถัดไปของมนุษย์บน
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/22845
