วันจันทร์, พฤษภาคม 25, 2569

วิกฤตต้นทุน AI ได้เริ่มต้นขึ้นแล้ว มีรายงานว่า Microsoft ได้สั่งให้วิศวกรหยุดใช้งาน Claude เนื่องจากค่าใช้จ่ายด้าน AI พุ่งสูงขึ้นอย่างมหาศาล ในขณะที่ Uber เปิดเผยว่างบประมาณด้าน AI ประจำปีทั้งหมดของบริษัทได้ถูกใช้จนหมดเกลี้ยงตั้งแต่เดือนเมษายนแล้ว





https://x.com/cryptorover/status/2058608305489232082
.....

วิกฤตต้นทุน AI ได้เริ่มต้นขึ้นแล้ว

มีรายงานว่า Microsoft ได้สั่งให้วิศวกรหยุดใช้งาน Claude เนื่องจากค่าใช้จ่ายด้าน AI พุ่งสูงขึ้นอย่างมหาศาล ในขณะที่ Uber เปิดเผยว่างบประมาณด้าน AI ประจำปีทั้งหมดของบริษัทได้ถูกใช้จนหมดเกลี้ยงตั้งแต่เดือนเมษายนแล้ว

นี่ไม่ใช่เพียงแค่กรณีงบประมาณบานปลายแบบแยกส่วนเพียงไม่กี่กรณีเท่านั้น แต่เป็นการเผชิญหน้ากับความเป็นจริงทางเศรษฐกิจในระดับรากฐาน ระหว่าง AI แบบ Agentic (AI ที่มีความสามารถในการตัดสินใจและดำเนินการด้วยตนเอง) กับเครื่องมือซอฟต์แวร์แบบดั้งเดิม


เรื่องราวที่เกิดขึ้นกับ Microsoft และ Uber ชี้ให้เห็นถึงความผิดพลาดในการคำนวณครั้งใหญ่ ทั้งในด้านการกำหนดราคา การบริโภค และการจัดทำงบประมาณสำหรับระบบ AI ระดับองค์กร

สิ่งที่เกิดขึ้นจริง: บทวิเคราะห์เจาะลึก

ทั้งสองบริษัทต้องเผชิญกับปัญหาเดียวกันเป๊ะ และต้นตอของปัญหาไม่ใช่ความล้มเหลวของระบบ AI แต่กลับเป็นเพราะ AI ทำงานได้ดีเกินไป จนวิศวกรหันมาใช้งานมันอย่างต่อเนื่องตลอดเวลา

1. Microsoft สั่งยุติการใช้งาน

มาตรการที่ใช้: Microsoft ประกาศยกเลิกสิทธิ์การใช้งาน Claude Code ส่วนใหญ่ภายในองค์กร (โดยเฉพาะอย่างยิ่งในแผนก Experiences + Devices ซึ่งดูแลผลิตภัณฑ์อย่าง Windows, Office และ Teams) โดยจะมีผลตั้งแต่วันที่ 30 มิถุนายน เป็นต้นไป

เหตุผล: เดิมที Microsoft ได้เปิดตัว Claude Code ควบคู่ไปกับเครื่องมือภายในของตนเองเพื่อใช้เป็นเกณฑ์ในการเปรียบเทียบประสิทธิภาพ ปรากฏว่าวิศวกรส่วนใหญ่กลับชื่นชอบการใช้งาน Claude มากกว่าอย่างเห็นได้ชัด แต่ผลลัพธ์ที่ตามมาคือค่าใช้จ่าย API แบบคิดตามจำนวน Token (หน่วยประมวลผลของ AI) กลับพุ่งทะลุเพดานเกินกว่าที่คาดการณ์ไว้มาก

การปรับกลยุทธ์: Microsoft สั่งให้เหล่านักพัฒนาหันกลับไปใช้งาน GitHub Copilot CLI แทน เนื่องจาก Microsoft เป็นเจ้าของ GitHub อยู่แล้ว การใช้งาน Copilot จึงช่วยให้ต้นทุนด้านการประมวลผลภายในยังคงหมุนเวียนอยู่ภายใน "ครอบครัว" เดียวกัน แทนที่จะต้องจ่ายเงินก้อนโตมหาศาลในแต่ละเดือนให้กับบริษัท Anthropic

2. Uber ผลาญงบประมาณจนหมดเกลี้ยง

มาตรการที่ใช้: Praveen Neppalli Naga ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยี (CTO) ของ Uber ยอมรับว่า บริษัทได้ใช้งบประมาณสำหรับการเขียนโค้ดด้วย AI ประจำปี 2026 ทั้งหมดจนหมดเกลี้ยงตั้งแต่เดือนเมษายน ทั้งที่เพิ่งผ่านพ้นปีมาได้เพียง 4 เดือนเท่านั้น

ตัวเลขสถิติ: หลังจากที่เปิดให้วิศวกรราว 5,000 คนได้ทดลองใช้ Claude Code อัตราการใช้งานกลับพุ่งสูงขึ้นอย่างรวดเร็วจนทะลุระดับ 85% แทนที่จะต้องจ่ายค่าสิทธิ์การใช้งานแบบเหมาจ่ายต่อที่นั่ง (Seat-license) ในอัตราคงที่ที่คาดการณ์ได้ Uber กลับต้องแบกรับค่าใช้จ่าย API แบบคิดตามปริมาณการใช้งาน ซึ่งมีมูลค่าสูงถึง 500 ถึง 2,000 ดอลลาร์ต่องานวิศวกรหนึ่งคนต่อเดือน

เหตุใดการคำนวณจึงผิดพลาด: ปรากฏการณ์ย้อนแย้งเรื่อง Token

ทีมจัดซื้อจัดจ้างระดับองค์กรต่างคุ้นชินกับการจัดซื้อซอฟต์แวร์ในรูปแบบราคาแบบ SaaS (Software as a Service) กล่าวคือ คุณจ่ายเงินเพียง 20 หรือ 30 ดอลลาร์ต่อเดือนต่อพนักงานหนึ่งคน แล้วพนักงานคนนั้นก็สามารถใช้งานซอฟต์แวร์ได้มากเท่าที่ต้องการโดยไม่จำกัดปริมาณ

ทว่า เครื่องมือช่วยเขียนโค้ดด้วย AI ระดับแนวหน้าอย่าง Claude Code และ Cursor นั้น ไม่ได้ทำงานในรูปแบบเดียวกับระบบช่วยเติมคำอัตโนมัติ (Autocompletes) แบบดั้งเดิม แต่เครื่องมือเหล่านี้ทำงานในรูปแบบที่เรียกว่า "Agentic" (มีความสามารถในการตัดสินใจและดำเนินการด้วยตนเอง) [AI แบบดั้งเดิม] -> "เติมโค้ดบรรทัดเดียวนี้โดยอัตโนมัติ"
= ใช้โทเค็นน้อยที่สุด

[AI แบบเอเจนต์] -> "ปรับโครงสร้างโค้ดทั้งคลังเก็บข้อมูลนี้ใหม่ รันการทดสอบ และแก้ไขบั๊ก"
= ใช้โทเค็นหลายล้านโทเค็นต่อภารกิจ

เมื่อวิศวกรขอให้เครื่องมือเอเจนต์วินิจฉัยบั๊กที่ซับซ้อนในคลังเก็บข้อมูลทั้งหมด เครื่องมือจะอ่านบริบทหลายพันบรรทัด วิเคราะห์หลายขั้นตอน และส่งออกบล็อกโค้ดขนาดใหญ่ ทุกขั้นตอนใช้โทเค็นจำนวนมาก แม้ว่าต้นทุนต่อหน่วยของโทเค็นล้านโทเค็นจะลดลงอย่างมากในช่วงปีที่ผ่านมา แต่ปริมาณโทเค็นที่ถูกใช้ไปนั้นมากกว่าการลดราคาเหล่านั้นอย่างมาก

ผลกระทบในวงกว้าง

วิกฤตงบประมาณนี้กำลังกระตุ้นให้เกิดการเปลี่ยนแปลงเชิงป้องกันอย่างรวดเร็วทั่วทั้งระบบนิเวศเทคโนโลยี:

จุดจบของ AI แบบใช้ได้ไม่อั้น: ยุคอัตราคงที่กำลังจะสิ้นสุดลง ที่จริงแล้ว GitHub เองก็เพิ่งประกาศว่าจะเปลี่ยน Copilot จากการสมัครสมาชิกแบบเหมาจ่ายไปเป็นโมเดล "GitHub AI Credits" ที่คิดค่าบริการตามการใช้งาน องค์กรต่างๆ จะต้องวัดปริมาณการใช้งาน AI เหมือนกับการใช้ไฟฟ้าหรือน้ำ

การเติบโตของ "AI FinOps": บริษัทต่างๆ กำลังเร่งสร้างหรือซื้อซอฟต์แวร์ที่กำหนดงบประมาณสูงสุดสำหรับคีย์ API ของนักพัฒนา เพื่อป้องกันไม่ให้วิศวกรคนเดียวใช้เงินไปถึง 1,000 ดอลลาร์ในเวลาเพียงบ่ายเดียว

แรงกดดันต่อสตาร์ทอัพ AI: นี่เป็นการเปิดเผยจุดอ่อนสำคัญสำหรับห้องปฏิบัติการ AI เช่น Anthropic (ซึ่งกำลังระดมทุนด้วยมูลค่ามหาศาล) หากลูกค้าองค์กรระดับสูงพบว่าโมเดลการส่งมอบโทเค็นไม่ยั่งยืนทางการเงินในระดับใหญ่ มันจะบังคับให้พวกเขาต้องคิดใหม่เกี่ยวกับกลยุทธ์การขายให้กับองค์กร

ท้ายที่สุดแล้ว CTO ของ Uber กล่าวไว้ได้ดีที่สุดว่า "ผมต้องกลับไปเริ่มต้นใหม่" อุตสาหกรรมได้พิสูจน์แล้วว่า AI สามารถเพิ่มความเร็วในการพัฒนาได้อย่างมาก—ตอนนี้พวกเขาต้องหาวิธีที่จะจ่ายค่าใช้จ่ายนั้นได้จริง