ตามรายงานของ Business Insider สื่อต่างประเทศ มูลค่าของ Anthropic ในตลาดรองเอกชนทะลุ 1 ล้านล้านดอลลาร์สหรัฐแล้ว เมื่อเทียบกับ OpenAI ที่มีมูลค่าในการระดมทุนรอบล่าสุดเมื่อปลายเดือนมีนาคมปีนี้อยู่ที่ 852 พันล้านดอลลาร์สหรัฐ นอกเหนือจาก “ทฤษฎีฟองสบู่ AI” ที่ถูกพูดถึงกันในวงการ ข้อมูลเปรียบเทียบนี้ยังแสดงให้เห็นว่า OpenAI ซึ่งครั้งหนึ่งเคยเป็นผู้นำที่มั่นคง กำลังเผชิญกับแรงกดดันจากการถูกไล่ตามและแซงหน้า แต่เราไม่ต้องรอนาน การตอบโต้ของ OpenAI ก็มาถึงทันที
เมื่อสักครู่ที่ผ่านมา GPT-5.5 ได้เปิดตัวอย่างเป็นทางการ พร้อมกับเวอร์ชัน GPT-5.5 Pro ที่ออกแบบมาสำหรับงานระดับสูงกว่า หากจะสรุปแนวคิดการออกแบบหลักของ GPT-5.5 ด้วยประโยคเดียว ก็คือการให้ผู้ใช้โยนงานที่ซับซ้อน ยุ่งเหยิง และมีหลายขั้นตอนให้กับโมเดลโดยตรง ให้มันวางแผนเส้นทาง เรียกใช้เครื่องมือ ตรวจสอบผลลัพธ์ ขจัดความคลุมเครือ และดำเนินการต่อไปได้ด้วยตัวเอง แม้จะดูเหมือนเป็นการอัปเดตเวอร์ชันเพียง 0.1 แต่ประสิทธิภาพในการอนุมานกลับเทียบเท่ากับการอัปเดตเวอร์ชันใหญ่ งาน Codex เดียวกัน GPT-5.5 ใช้ token น้อยกว่าอย่างเห็นได้ชัด ทั้งฉลาดขึ้นและประหยัดมากขึ้น
บ่นกันมานานกว่าหนึ่งเดือน แต่พอถึงเวลาเปิดตัว GPT-5.5 Anthropic ถึงนึกขึ้นได้ว่าจะแก้ปัญหาการลดประสิทธิภาพทางปัญญา GPT-5.5 เปิดตัว ครองอันดับอย่างไม่เกรงใจใคร ผลงานบนกระดาษของ GPT-5.5 นั้นน่าประทับใจมาก ในดัชนีความฉลาด綜合ของ Artificial Analysis สถาบันประเมินบุคคลที่สามที่มีชื่อเสียง OpenAI คว้าอันดับหนึ่งและสองด้วยซีรีส์ GPT-5.5 และครองสี่ในหกอันดับแรก คู่แข่งแทบไม่มีทางสู้
ผลการทดสอบมาตรฐานแสดงให้เห็นว่า ใน Terminal-Bench 2.0 (ทดสอบเวิร์กโฟลว์บรรทัดคำสั่งที่ซับซ้อน) GPT-5.5 ได้ 82.7% GPT-5.4 ได้ 75.1% และ Claude Opus 4.7 ได้ 69.4% ใน SWE-Bench Pro (ประเมินความสามารถในการแก้ปัญหา GitHub จริง) GPT-5.5 ได้ 58.6% สามารถทำงานแบบ end-to-end ได้มากขึ้นในการรันครั้งเดียว เกิน GPT-5.4 ที่ 57.7%
ในการประเมิน Expert-SWE ภายในของ OpenAI เวลาที่มนุษย์คาดว่าจะใช้ทำงานโดยเฉลี่ยคือ 20 ชั่วโมง GPT-5.5 ได้ 73.1% GPT-5.4 ได้ 68.5% และในการประเมินทั้งสามรายการ GPT-5.5 ทำงานเสร็จโดยใช้ token น้อยกว่า
เพียงแต่ว่า ครั้งนี้ OpenAI ก็เล่นเล่ห์เหลี่ยมเล็กๆ ในเชิงอรรถด้วย โดยใช้ข้อความเล็กๆ ตั้งคำถามถึงความน่าเชื่อถือของผลงานบางส่วนของ Claude Opus 4.7 อย่างแยบยล แต่ผู้ใช้ Deedy ไม่เห็นด้วยกับเรื่องนี้ ในความเห็นของเขา หมายเหตุนี้ดูเหมือนเป็นการเบี่ยงเบนความสนใจ เพราะ OpenAI เองก็ไม่สามารถนำเสนอเกณฑ์มาตรฐานสาธารณะที่โปร่งใสกว่านี้เพื่อยืนยันความสามารถของ GPT-5.5 ได้โดยตรง
ในด้านการเขียนโค้ดแบบ Agent การใช้คอมพิวเตอร์ (computer use) งานความรู้ และการวิจัยทางวิทยาศาสตร์早期 GPT-5.5 มีการปรับปรุงที่โดดเด่นเป็นพิเศษ
ผู้ทดสอบ早期反馈ว่า GPT-5.5 มีความสามารถในการทำความเข้าใจโครงสร้างโดยรวมของฐานโค้ดขนาดใหญ่ได้ดีขึ้นอย่างเห็นได้ชัด สามารถคาดการณ์ปัญหาที่อาจเกิดขึ้นล่วงหน้า พิจารณาความต้องการในการทดสอบและตรวจสอบล่วงหน้า โดยไม่ต้องมีคำแนะนำเพิ่มเติม Dan Shipper ผู้วิจารณ์知名และผู้ก่อตั้ง Every แชร์กรณีศึกษาเฉพาะ: แอปของเขามีปัญหาหลังจากเปิดตัว เขาแก้ไขด้วยตัวเองหลายวันไม่สำเร็จ ในที่สุดก็จ้างวิศวกรมาเขียนระบบบางส่วนใหม่ เขาใช้ GPT-5.5 สร้างสถานการณ์นี้ขึ้นมาใหม่ ผลปรากฏว่าโมเดลให้แนวทางการแก้ปัญหาแบบเดียวกับวิศวกร ในขณะที่ GPT-5.4 ไม่สามารถทำได้ Michael Truell ผู้ร่วมก่อตั้ง Cursor กล่าวว่า GPT-5.5 ฉลาดกว่าและยืดหยุ่นกว่า GPT-5.4 การเรียกใช้เครื่องมือเชื่อถือได้มากกว่า และสามารถทำงานที่ซับซ้อนระยะยาวได้นานขึ้นโดยไม่หยุดกลางคัน ที่น่าทึ่งยิ่งกว่านั้น วิศวกรของ NVIDIA คนหนึ่งกล่าวหลังการทดลองใช้早期ว่า “การสูญเสียการเข้าถึง GPT-5.5 รู้สึกเหมือนถูกตัดแขนขา”
หากไม่มีอะไรผิดพลาด ก็จะมีมeme ใหม่เกิดขึ้นอีก (ห๊ะ??) อย่างไรก็ตาม เมื่อพิจารณาว่าหลังจาก Altman ดูการสาธิต GPT-5 แล้ว “เวียนหัว หมดแรง ล้มลงกับพื้น” และเรื่องนี้ก็ยังไม่มีคำอธิบายที่จริงจังจนถึงทุกวันนี้ คำพูดของวิศวกร NVIDIA ก็ดูไม่เกินจริงไปนัก
ในส่วนของงานความรู้ GPT-5.5 ก็มีประสิทธิภาพที่ยอดเยี่ยมเช่นกัน
ในการประเมิน GDPval ที่วัดความสามารถในการทำงานความรู้ของโมเดลใน 44 อาชีพ GPT-5.5 ชนะหรือเสมอในสัดส่วน 84.9% GPT-5.4 ได้ 83.0% Claude Opus 4.7 ได้ 80.3% และ Gemini 3.1 Pro ได้เพียง 67.3%
ใน OSWorld-Verified (ทดสอบว่าโมเดลสามารถทำงานในสภาพแวดล้อมคอมพิวเตอร์จริงได้ด้วยตนเองหรือไม่) GPT-5.5 ได้ 78.7% GPT-5.4 ได้ 75.0% Claude Opus 4.7 ได้ 78.0%
ใน Tau2-bench Telecom (ทดสอบเวิร์กโฟลว์บริการลูกค้าที่ซับซ้อน) GPT-5.5 ได้ 98.0% โดยไม่ต้องปรับแต่ง prompt GPT-5.4 ได้ 92.8% ความแตกต่างค่อนข้างชัดเจน
ในการประเมินเฉพาะด้านอื่นๆ GPT-5.5 ได้ 60.0% ใน FinanceAgent v1.1 88.5% ในงานสร้างแบบจำลอง investment banking ภายใน และ 54.1% ใน OfficeQA Pro (Claude Opus 4.7 ได้ 43.6% Gemini 3.1 Pro ได้เพียง 18.1%)
ใน BixBench (ออกแบบรอบ Bioinformatics และการวิเคราะห์ข้อมูลจริง) GPT-5.5 ได้ 80.5% GPT-5.4 ได้ 74.0% อยู่อันดับหนึ่งในโมเดลที่เผยแพร่คะแนน ใน GeneBench (ทดสอบการวิเคราะห์ข้อมูลหลายขั้นตอนด้านพันธุศาสตร์และชีววิทยาเชิงปริมาณ) GPT-5.5 ได้ 25.0% GPT-5.4 ได้ 19.0% และเวอร์ชัน Pro ได้ 33.2% งานเหล่านี้โดยทั่วไปเทียบเท่ากับ工作量หลายวันของผู้เชี่ยวชาญด้านวิทยาศาสตร์ พนักงาน OpenAI กว่า 85% ใช้ Codex ทุกสัปดาห์ ครอบคลุมแผนกวิศวกรรมซอฟต์แวร์ การเงิน การสื่อสาร การตลาด วิทยาศาสตร์ข้อมูล และการจัดการผลิตภัณฑ์
ทีมการเงินใช้ GPT-5.5 ตรวจสอบเอกสารภาษี K-1 จำนวน 24,771 ฉบับ รวม 71,637 หน้า และเสร็จเร็วกว่าปีก่อนถึงสองสัปดาห์ ทีมสื่อสารสร้าง Slack bot อัตโนมัติเพื่อจัดการคำขอความเสี่ยงต่ำโดยอัตโนมัติ พนักงานทีมการตลาดคนหนึ่งใช้มันสร้างรายงานธุรกิจประจำสัปดาห์โดยอัตโนมัติ ประหยัดเวลา 5 ถึง 10 ชั่วโมงต่อสัปดาห์ นอกจากนี้ จุดเด่นอีกประการของ GPT-5.5 คือการอัปเกรดโครงสร้างพื้นฐานการอนุมานร่วมกัน GPT-5.5 ได้รับการออกแบบและฝึกฝนร่วมกับระบบ NVIDIA GB200 และ GB300 NVL72 การปรับปรุงที่สำคัญอย่างหนึ่งคือกลยุทธ์การปรับสมดุลโหลดและการแบ่งพาร์ติชัน Codex วิเคราะห์ข้อมูลปริมาณการผลิตเป็นเวลาหลายสัปดาห์ เขียนฮิวริสติกแบบกำหนดเองเพื่อปรับการแบ่งพาร์ติชันและการปรับสมดุลโหลดให้เหมาะสมแบบไดนามิก ส่งผลให้ความเร็วในการสร้าง token เพิ่มขึ้นกว่า 20% OpenAI ยังชี้ให้เห็นว่า GPT-5.5 เองก็มีส่วนร่วมในการปรับปรุงโครงสร้างพื้นฐานการอนุมานของตัวเองด้วย GPT-5.5 เปิดให้ผู้ใช้ ChatGPT Plus, Pro, Business, Enterprise ใช้งานได้ตั้งแต่วันนี้ Codex รองรับหน้าต่างบริบทสูงสุด 400K และมีโหมด Fast ความเร็ว 1.5 เท่า (ค่าใช้จ่าย 2.5 เท่าของราคามาตรฐาน) GPT-5.5 Pro เปิดตัวสำหรับผู้ใช้ ChatGPT Pro, Business และ Enterprise
เวอร์ชัน API จะเปิดตัวเร็วๆ นี้ ราคามาตรฐานอยู่ที่ 5 ดอลลาร์สหรัฐต่อ token อินพุต 1 ล้าน และ 30 ดอลลาร์สหรัฐต่อ token เอาต์พุต 1 ล้าน หน้าต่างบริบท 1M token การประมวลผลแบบแบตช์และยืดหยุ่นมีราคาเป็นครึ่งหนึ่งของราคามาตรฐาน โหมดประมวลผลลำดับความสำคัญมีราคา 2.5 เท่าของราคามาตรฐาน ราคา API ของ GPT-5.5 Pro อยู่ที่ 30 ดอลลาร์สหรัฐต่อ token อินพุต 1 ล้าน และ 180 ดอลลาร์สหรัฐต่อ token เอาต์พุต 1 ล้าน OpenAI กล่าวว่า เนื่องจากประสิทธิภาพของ token ที่ดีขึ้น ต้นทุนการใช้งานจริงของผู้ใช้ส่วนใหญ่จะไม่เพิ่มขึ้นอย่างมีนัยสำคัญ ไม่พูดถึง Claude Opus 4.7 แต่ทุกประโยคล้วนมีนัยแฝง OpenAI ต้องการเป็น超级入口แห่งยุค AI ไม่มีโมเดลใดที่จะได้รับคำชมเป็นเอกฉันท์ GPT-5.5 ก็เช่นกัน ผู้ใช้ @chetaslua ใช้ prompt หนึ่งสร้างเว็บไซต์完整ที่มีฟิสิกส์เอ็นจิ้นลมใน Codex ปฏิสัมพันธ์ทางกายภาพและการออกแบบอินเทอร์เฟซเสร็จสมบูรณ์ เขาแสดงความเห็นว่า “นี่เป็นครั้งแรกที่ฉันรู้สึกว่า ChatGPT สามารถเป็นเครื่องมือ AI อันดับแรกในการแก้ปัญหาทุกอย่าง”
ผู้ใช้ @petergostev ให้โมเดลสร้างฉากรถไฟของเล่นที่มีสถานที่สำคัญในลอนดอนและการเปลี่ยนแปลงตามฤดูกาล เมื่อเปรียบเทียบกับผลลัพธ์ของ GPT-5.4 เขาสรุปว่า “GPT-5.5 มีความทะเยอทะยานมากกว่า สอดคล้องกันมากกว่า และมีข้อผิดพลาดน้อยกว่า” และในงาน迁移แอปพลิเคชันที่ซับซ้อน ให้โมเดลทำงานต่อเนื่องเป็นเวลาหลายชั่วโมงโดยไม่ติดขัด
แน่นอนว่าเสียงวิจารณ์ก็มีเช่นกัน ผู้ใช้ @arrakis_ai พบว่า GPT-5.5 เมื่อเจอเลย์เอาต์ที่ซับซ้อน บางครั้งก็สร้างรูปภาพขึ้นมาแทน จัดการกับความต้องการไอคอนโดยเขียน SVG เองตั้งแต่ต้นโดยไม่เรียกใช้ไลบรารีที่มีอยู่ พร้อมกับหยุดถามผู้ใช้บ่อยครั้ง ความสามารถในการดำเนินการกลับไม่เด็ดขาดเหมือนเดิม
ในด้านการใช้ภาษา ประสบการณ์ส่วนตัวของฉันก็คล้ายกัน GPT-5.5 จัดการภาษาได้ดีกว่ารุ่นก่อนจริง อย่างน้อยก็พูดภาษาเข้าใจง่ายขึ้น แต่ก็ยังมีกลิ่นแปลกๆ: “ฉันอยู่ที่นี่ ไม่หลบ ไม่ซ่อน ไม่อ้อม ไม่หนี รับเธอไว้อย่างมั่นคง” และผู้ใช้หลายคนสังเกตเห็นว่า OpenAI ใช้กลยุทธ์การตลาดในตารางการทดสอบมาตรฐานด้วย
ผู้ใช้ Haider คิดว่าช่องว่างระหว่าง GPT-5.5 และ Mythos ไม่ได้มากอย่างที่คาดไว้ ในขณะที่ Mythos มีราคาเป็นสองเท่าของ GPT-5.5 และไม่ได้ขายต่อสาธารณะ เขาประเมินว่า GPT รุ่นต่อไปน่าจะตามทัน Mythos ได้ไม่ยาก
ตามรายงานของ Techcrunch สื่อต่างประเทศ เมื่อถูกนักข่าวสอบถามว่า “GPT-5.5 มีความสามารถคล้าย Mythos หรือไม่” Mia Glaese วิศวกรของ OpenAI ให้คำตอบที่รัดกุมแต่แฝงไว้ด้วยคม: “เรามีกลยุทธ์ระยะยาวและแข็งแกร่งในด้านความปลอดภัยทางไซเบอร์ และได้完善วิธีการที่ยั่งยืนและปลอดภัยในการเปิดตัวโมเดล” นัยยะชัดเจนมาก: โมเดลที่ทรงพลังเดี่ยวๆ ในที่สุดก็เป็นเพียงผู้ผ่านทาง เมื่อถึงเวลาต้องแข่งขันในด้านการป้องกันดิจิทัลและการใช้งานระดับองค์กรที่ลึกซึ้ง กำแพงระบบนิเวศของ OpenAI คือการ์ดความปลอดภัยเดียวที่ลูกค้า B2B จะไว้วางใจ และเมื่อ GPT-5.5 เปิดตัว ความทะเยอทะยานของ OpenAI ก็ชัดเจนเพียงพอแล้ว: พวกเขาไม่พอใจกับการเป็นแชทบอทอัจฉริยะอีกต่อไป แต่ต้องการสร้าง “แอปพลิเคชัน超级 AI (Super app)” ที่กลืนกินทุกเวิร์กโฟลว์ด้วยตัวเอง ในการให้สัมภาษณ์กับสื่อต่างประเทศ Greg Brockman ประธาน OpenAI ใช้คำว่า “自主性 (Agentic)” เพื่ออธิบายการก้าวกระโดดของโมเดลในครั้งนี้ เมื่อเทียบกับ GPT-5.4 รุ่นก่อน GPT-5.5 ใช้ Token น้อยกว่า แต่คิดเร็วขึ้น มีตรรกะชัดเจนขึ้น และเริ่มแสดงความสามารถในการแก้ปัญหาที่ซับซ้อนอย่าง主动 นี่คือรากฐานที่มั่นคงสู่超级แอปพลิเคชัน
คืนนี้ Altman ตื่นเต้นผิดปกติ ถึงกับเปลี่ยนรูปโปรไฟล์ 所谓超级แอปพลิเคชัน คือการผสาน ChatGPT, Codex และ AI เบราว์เซอร์เข้าด้วยกันเป็นบริการเดียว ลองนึกภาพเวิร์กโฟลว์ในอนาคต: ผู้คนไม่ต้องสลับไปมาระหว่างเบราว์เซอร์ โปรแกรมแก้ไขโค้ด และเครื่องมือวิเคราะห์ข้อมูลอีกต่อไป เพียงแค่สั่งการ宏观ไปยัง超级แอปพลิเคชันนี้ GPT-5.5 ก็สามารถเปิดหน้าเว็บในเบื้องหลังเพื่อรวบรวมข้อมูล เขียนโค้ด爬虫 ทำความสะอาดข้อมูล และส่งมอบรายงานวิเคราะห์ที่สมบูรณ์ได้โดยตรง แน่นอน เช่นเดียวกับการผูกมัดที่แข็งแกร่งระหว่าง Claude และ Claude Code OpenAI ก็ตั้งใจจะเพิ่มแรงผลักดันให้กับการเติบโตของ Codex เช่นกัน เมื่อเร็วๆ นี้ Altman กล่าวว่าผู้ใช้ที่ใช้งาน Codex 突破 3 ล้านคนในเวลาไม่ถึงสองสัปดาห์ก็ใกล้ถึง 4 ล้านคนแล้ว OpenAI จึงรีเซ็ตข้อจำกัดอัตรา เพื่อดึงดูดนักพัฒนาด้วยท่าที “ปริมาณมาก อิ่มหนำ” ในด้านหนึ่ง ด้วยประสิทธิภาพที่แข็งแกร่งของ GPT-5.5 และ GPT-Image-2 ตอบโต้แรงกดดันด้านการประเมินมูลค่าจาก Anthropic ได้โดยตรง อีกด้านหนึ่ง ใช้ความ粘性ของระบบนิเวศ Codex เพื่อยึดมั่นนักพัฒนา สร้างระบบบริการที่ครอบคลุมทั้งผู้บริโภค C2C และบริการระดับองค์กร B2B อย่างมั่นคง สถานการณ์การรุกและการป้องกันเปลี่ยนไปแล้ว OpenAI ที่ถูกวิจารณ์ว่าตามหลังมาตลอดปีนี้ ในที่สุดก็กลับมาพบจังหวะการรุกเมื่อสองปีก่อน และมุ่งเน้นไปที่การปรับปรุงผลิตภัณฑ์อย่างจริงจัง
แนบที่อยู่บล็อกทางการของ OpenAI:
https://openai.com/index/introducing-gpt-5-5/*ปกสร้างโดย AI

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/31793
