การนำเครื่องมือ AI เช่น ChatGPT มาใช้อย่างรวดเร็วได้จุดประเด็นถกเถียงเกี่ยวกับศักยภาพในการเปลี่ยนแปลงในที่ทำงาน ในขณะที่ผู้เชี่ยวชาญด้านเทคโนโลยีประกาศยุคใหม่แห่งประสิทธิภาพ งานวิจัยล่าสุดเผยให้เห็นความเป็นจริงที่ซับซ้อนมากขึ้น โดยผลกระทบของ AI แตกต่างกันอย่างมีนัยสำคัญในบริบทและวิธีการนำไปใช้ที่แตกต่างกัน
การเติบโตของ Vibe Coding ในสตาร์ทอัพ
ปรากฏการณ์ใหม่ที่เรียกว่า vibe coding กำลังได้รับความนิยมในระบบนิเวศของสตาร์ทอัพ โดยเฉพาะในบริษัทที่ได้รับการสนับสนุนจาก Y Combinator แนวทางนี้เกี่ยวข้องกับการใช้โมเดลภาษาขนาดใหญ่เช่น ChatGPT เพื่อสร้างโค้ดจากคำสั่งภาษาธรรมชาติ ซึ่งแปลความตั้งใจเป็นซอฟต์แวร์ที่ใช้งานได้โดยใช้ความรู้ด้านการเขียนโปรแกรมแบบดั้งเดิมน้อยที่สุด ตามคำกล่าวของ Garry Tan ซีอีโอของ Y Combinator ประมาณ 25% ของบริษัทในรุ่นล่าสุดของพวกเขากำลังใช้ AI เพื่อสร้างโค้ด 95% หรือมากกว่า โดยสตาร์ทอัพบางแห่งมีอัตราการเติบโต 10% ต่อสัปดาห์ กลุ่มล่าสุดของบริษัทเร่งการเติบโตนี้มุ่งเน้นไปที่ธุรกิจที่ใช้ AI เป็นหลัก โดยประมาณ 80% ของพวกเขาเดิมพันว่า LLMs สามารถจัดการงานพัฒนาส่วนใหญ่ของพวกเขาได้
การนำ AI มาใช้ใน Y Combinator
- 25% ของบริษัทในรุ่นล่าสุดใช้ AI ในการสร้างโค้ดมากกว่า 95% ของโค้ดทั้งหมด
- 80% ของกลุ่มบริษัทมุ่งเน้นไปที่ธุรกิจที่ใช้ AI เป็นฐาน
- บางสตาร์ทอัพเติบโตในอัตรา 10% ต่อสัปดาห์
การตรวจสอบความเป็นจริง: เกณฑ์มาตรฐานแสดงข้อจำกัด
แม้จะมีความกระตือรือร้น แต่เกณฑ์มาตรฐานบอกเล่าเรื่องราวที่ละเอียดมากขึ้นเกี่ยวกับความสามารถในการเขียนโค้ดของ AI เครื่องมือเช่น SWE-Bench และ SWE-PolyBench ทดสอบโมเดล AI ในงานโปรแกรมมิ่งและสถานการณ์การแก้ไขบัคหลายร้อยรายการ แม้ว่าประสิทธิภาพจะดีขึ้นอย่างมาก—จากการผ่านความท้าทายของ SWE-Bench ประมาณ 5% ในปี 2023 เป็นมากกว่า 60% ในปัจจุบัน—ผลลัพธ์แตกต่างกันอย่างมีนัยสำคัญในกรอบการทดสอบที่แตกต่างกัน ใน SWE-PolyBench ของ Amazon โมเดลชั้นนำแก้ปัญหาได้เพียง 22.6% ของปัญหา และใน Coding Index ของ Artificial Analysis โมเดลที่ดีที่สุดได้คะแนน 63 เทียบกับ 96 ใน Math Index ซึ่งบ่งชี้ว่า AI ยังคงเก่งกว่าในการสร้างสูตรทางคณิตศาสตร์มากกว่าการพัฒนาโค้ดที่ใช้งานได้จริง
ประสิทธิภาพของเกณฑ์มาตรฐานการเขียนโค้ดของ AI
- SWE-Bench: โมเดลชั้นนำสามารถผ่านความท้าทายได้มากกว่า 60% (เพิ่มขึ้นจาก 5% ในปี 2023)
- SWE-PolyBench ของ Amazon: โมเดลชั้นนำแก้ปัญหาได้เพียง 22.6% ของปัญหาทั้งหมด
- Artificial Analysis Coding Index: โมเดลที่ดีที่สุดได้คะแนน 63 (เทียบกับคะแนน 96 ใน Math Index)
ผลกระทบน้อยต่อประสิทธิภาพในที่ทำงาน
การศึกษาที่สำคัญจาก National Bureau of Economic Research ที่ตรวจสอบการใช้แชทบอท AI ในสถานที่ทำงาน 7,000 แห่งในเดนมาร์กพบว่าการเพิ่มประสิทธิภาพมีเพียงเล็กน้อย นักเศรษฐศาสตร์ Anders Humlum และ Emilie Vestergaard วิเคราะห์คนงาน 25,000 คนในอาชีพที่เชื่อว่าอ่อนไหวต่อการหยุดชะงักของ AI รวมถึงนักบัญชี นักพัฒนาซอฟต์แวร์ และผู้เชี่ยวชาญด้านการตลาด ผลการวิจัยของพวกเขาเปิดเผยว่าผู้ใช้ AI ประหยัดเวลาได้เพียงประมาณ 3% โดยเฉลี่ย โดยมีเพียง 3%-7% ของการเพิ่มประสิทธิภาพเหล่านี้ที่แปลเป็นค่าจ้างที่สูงขึ้น การศึกษาสรุปว่าแชทบอท AI ไม่มีผลกระทบที่สำคัญต่อรายได้หรือชั่วโมงที่บันทึกไว้ในอาชีพใดๆ
ผลกระทบของ AI ต่อประสิทธิภาพการทำงาน (การศึกษาของ NBER)
- การประหยัดเวลาโดยเฉลี่ย: 3%
- ผลประโยชน์จากประสิทธิภาพที่เพิ่มขึ้นที่ส่งต่อให้พนักงานในรูปแบบค่าตอบแทนที่สูงขึ้น: 3-7%
- การจัดสรรเวลาที่ประหยัดได้ของพนักงาน: มากกว่า 80% ใช้กับงานอื่นๆ, น้อยกว่า 10% ใช้กับการพักผ่อน/การพักผ่อนหย่อนใจ
การทำให้การเขียนโค้ดเป็นประชาธิปไตย
แม้จะมีข้อจำกัดเหล่านี้ เครื่องมือการเขียนโค้ด AI กำลังทำให้การพัฒนาซอฟต์แวร์เป็นประชาธิปไตยโดยช่วยให้ผู้ที่ไม่ใช่โปรแกรมเมอร์สามารถสร้างแอปพลิเคชันที่ใช้งานได้ นักเขียนโค้ดมือสมัครเล่นสามารถใช้ ChatGPT เพื่อสร้างเกมหรือการจำลองพื้นฐาน โดย AI สร้างโค้ดที่ใช้งานได้ในครั้งแรกและดำเนินการอัพเกรดตามที่ร้องขอ การเข้าถึงนี้อาจปลดล็อกความต้องการแฝงมหาศาลสำหรับการสร้างซอฟต์แวร์ในหมู่ศิลปิน ผู้ประกอบการ และผู้อื่นที่ไม่มีการฝึกอบรมด้านการเขียนโปรแกรมอย่างเป็นทางการมาก่อน
การดีบักยังคงเป็นคอขวดที่สำคัญ
ความท้าทายที่สำคัญประการหนึ่งกับโค้ดที่สร้างโดย AI คือการดีบัก เมื่อโค้ดที่ AI ผลิตมีปัญหา คำตอบไม่ได้ชัดเจนเสมอไป—แม้แต่สำหรับ AI เอง Microsoft กำลังแก้ไขปัญหานี้ผ่าน Debug-Gym ซึ่งเป็นระบบการฝึกอบรมที่ออกแบบมาเพื่อช่วยให้ LLMs เรียนรู้วิธีการดีบักที่คล้ายกับนักพัฒนามนุษย์ โดยใช้การให้เหตุผลหลายขั้นตอนแทนการจับคู่รูปแบบ แม้ว่าการทดสอบเบื้องต้นจะแสดงให้เห็นถึงการปรับปรุง แต่ผู้เชี่ยวชาญยืนยันว่าการดีบักที่แข็งแกร่งยังคงต้องการการกำกับดูแลของมนุษย์ การสร้างโค้ดที่ง่ายขึ้นยังสร้างปัญหาด้านปริมาณ โดยมีการผลิตโค้ดมากขึ้นโดยไม่มีการจัดทำเอกสารหรือการตรวจสอบอย่างรอบคอบ
การนำไปใช้สำคัญกว่าเทคโนโลยี
การศึกษาของ NBER เน้นย้ำว่าปัจจัยด้านองค์กรมีอิทธิพลอย่างมีนัยสำคัญต่อผลกระทบของ AI ในสถานที่ทำงานที่นายจ้างสนับสนุนการใช้ AI อย่างแข็งขันและฝึกอบรมคนงาน การเพิ่มประสิทธิภาพมีมากขึ้น พนักงานจำนวนมากใช้เครื่องมือ AI โดยไม่ได้รับการรับรองอย่างชัดเจนจากฝ่ายบริหาร ซึ่งจำกัดโอกาสในการใช้ประโยชน์จากประสิทธิภาพที่เพิ่มขึ้นสำหรับความก้าวหน้าในอาชีพหรือการเจรจาค่าตอบแทน นอกจากนี้ คนงานอาจลังเลที่จะโฆษณาประสิทธิภาพที่เพิ่มขึ้นด้วย AI เนื่องจากกลัวว่าจะได้รับมอบหมายงานมากขึ้นโดยไม่ได้รับค่าตอบแทนเพิ่มเติม
การนำไปใช้ในองค์กรขับเคลื่อนโดย FOMO
การสำรวจของ IBM กับซีอีโอ 2,000 คนเปิดเผยว่ามีเพียง 25% ของโครงการ AI ที่ให้ผลตอบแทนจากการลงทุนตามที่สัญญาไว้ แม้จะเป็นเช่นนี้ แต่ซีอีโอเกือบสองในสามยอมรับว่าความเสี่ยงของการล้าหลังผลักดันให้พวกเขาลงทุนในเทคโนโลยีบางอย่างก่อนที่จะเข้าใจอย่างชัดเจนถึงคุณค่าที่เทคโนโลยีเหล่านั้นนำมาสู่องค์กร สิ่งนี้บ่งชี้ว่าการนำ AI มาใช้ในบริษัทมักถูกขับเคลื่อนโดยความกลัวที่จะพลาดโอกาสมากกว่าคุณค่าที่ได้รับการพิสูจน์แล้ว
เส้นทางอันยาวไกลสู่การเปลี่ยนแปลง
Daron Acemoglu ผู้ได้รับรางวัลโนเบลประมาณการเพิ่มประสิทธิภาพของ AI ที่ประมาณ 1.1% ถึง 1.6% ของ GDP ในทศวรรษหน้า—มีนัยสำคัญสำหรับเศรษฐกิจขั้นสูงเช่นสหรัฐอเมริกา แต่ห่างไกลจากการเปลี่ยนแปลง GDP เป็นสองเท่าที่นักเทคโนโลยีบางคนทำนายไว้ เช่นเดียวกับการปฏิวัติทางเทคโนโลยีครั้งก่อนๆ การตระหนักถึงศักยภาพเต็มที่ของ AI จะต้องมีการปรับเปลี่ยนองค์กร การลงทุนเสริม และการปรับปรุงทักษะของคนงานผ่านการฝึกอบรมและการเรียนรู้ในงาน การปฏิวัติอุตสาหกรรมเปลี่ยนแปลงสังคมในช่วงหลายทศวรรษ ไม่ใช่ชั่วข้ามคืน และผลกระทบของ AI อาจเป็นไปในแนวทางเดียวกัน