ข่าว

Apple เปิดตัวชุดข้อมูล CA-1M และ Cubify Transformer สำหรับการตรวจจับวัตถุ 3 มิติ พร้อมเสียงตอบรับที่หลากหลายจากชุมชน
Apple ได้เปิดตัว CA-1M ชุดข้อมูลที่ครอบคลุมสำหรับการตรวจจับวัตถุ 3 มิติภายในอาคาร พร้อมกับ Cubify Transformer (CuTR) โมเดลที่ออกแบบมาเพื่อตรวจจับและวางกรอบสี่เหลี่ยม 3 มิติรอบวัตถุในพื้นที่ภายในอาคาร แม้ว่าเทคโนโลยีนี้จะแสดงให้เห็นถึงศักยภาพสำหรับแอปพลิเคชัน AR/VR แต่การตอบรับจากชุมชนเผยให้เห็นทั้งความตื่นเต้นเกี่ยวกับความสามารถและความกังวลเกี่ยวกับข้อจำกัดด้านการอนุญาตใช้งานภาพรวมของชุดข้อมูล CA-1M และ Cubify Transformerชุดข้อมูล: CA-1M - มีการทำเครื่องหมายกำกับกล่อง 3D แบบไม่ระบุประเภทอย่างครบถ้วนโมเดล: Cubify Transformer (CuTR) - มีให้เลือกทั้งแบบ RGB-D และแบบ RGB เท่านั้นโครงสร้างใบอนุญาต:โค้ดตัวอย่าง: ใบอนุญาตโค้ดตัวอย่างของ Appleชุดข้อมูล: CC-by-NC-NDโมเดล: ข้อกำหนดการใช้งานโมเดลวิจัย ML ของ Appleคุณสมบัติหลัก:ข้อมูลจริงของกล่อง 3D แบบต่อเฟรมท่าทาง GT ที่ลงทะเบียนกับเครื่องสแกนเลเซอร์ความลึก GT ที่ความละเอียด 512 x 384เฟรมแนวตั้งรองรับการทำงานบนภาพที่จับจากอุปกรณ์ของผู้ใช้ผ่านแอป NeRF Captureพื้นที่ภายในอาคารที่สามารถได้รับประโยชน์จากเทคโนโลยีการตรวจจับวัตถุ 3 มิติขั้นสูงสำหรับการออกแบบบ้านและแอปพลิเคชัน ARโครงสร้างการอนุญาตใช้งานที่ซับซ้อนสร้างความสับสนแนวทางการอนุญาตใช้งานของโครงการได้จุดประกายให้เกิดการอภิปรายอย่างมากในหมู่นักพัฒนา Apple ได้นำโครงสร้างการอนุญาตใช้งานแบบหลายระดับมาใช้: โค้ดตัวอย่างภายใต้ Apple Sample Code License ชุดข้อมูลภายใต้ CC-by-NC-ND และโมเดลภายใต้ Apple ML Research Model Terms of Use แนวทางที่แยกส่วนนี้ได้รับการวิพากษ์วิจารณ์จากชุมชนนักพัฒนาพวกเขาทำให้มันซับซ้อนเกินไปด้วยการใช้ใบอนุญาต (ย่อย) 3-4 แบบในโครงการเดียว... ทำไมต้องทำให้มันสับสนและซับซ้อนขนาดนี้? มันไร้ประโยชน์มากสำหรับนักพัฒนาบุคคลที่สามที่จะนำไปใช้สร้างแอปและเปิดตัวบนแพลตฟอร์มของพวกเขาการอนุญาตใช้งานแบบ Attribution-NonCommercial-NoDerivatives สำหรับชุดข้อมูลมีข้อจำกัดมากเป็นพิเศษ ซึ่งจำกัดการใช้งานเชิงพาณิชย์ที่อาจเกิดขึ้น ผู้แสดงความคิดเห็นบางคนระบุว่าความซับซ้อนของการอนุญาตใช้งานนี้อาจขัดขวางการนำไปใช้และการทดลองกับเทคโนโลยีในวงกว้างประสิทธิภาพทางเทคนิคสร้างคำถามข้อเสนอแนะจากชุมชนเกี่ยวกับประสิทธิภาพทางเทคนิคของ Cubify Transformer มีทั้งดีและไม่ดี ผู้ใช้บางคนได้ชี้ให้เห็นถึงปัญหาความแม่นยำในการตรวจจับกรอบสี่เหลี่ยม โดยเฉพาะกับวัตถุเช่นรูปภาพบนผนังและคานเพดาน ผู้แสดงความคิดเห็นรายหนึ่งสังเกตว่าโมเดลมักไม่ใช้ [ลูกบาศก์ที่หมุน] เมื่อควรจะใช้ ทำให้ขอบเขตเกินจริง ซึ่งบ่งชี้ว่าระบบบางครั้งมีปัญหาในการจัดตำแหน่งวัตถุอย่างเหมาะสมที่น่าสนใจคือ นักพัฒนาบางคนอ้างว่าได้เห็นประสิทธิภาพที่ดีกว่าจากเครือข่ายประสาทเทียมส่วนตัวที่ทำงานบน iPad โดยใช้เพียงข้อมูล RGB โดยไม่มีข้อมูลความลึก สิ่งนี้ทำให้เกิดคำถามว่าแนวทางที่ใช้ transformer เหมาะสมที่สุดสำหรับงานคอมพิวเตอร์วิชั่นนี้หรือไม่การประยุกต์ใช้งานจริงสำหรับการออกแบบบ้านแม้จะมีข้อกังวลด้านเทคนิคและการอนุญาตใช้งาน แต่ผู้ใช้หลายคนเห็นศักยภาพการใช้งานที่มีคุณค่าสำหรับเทคโนโลยีนี้ หนึ่งในกรณีการใช้งานที่น่าสนใจที่สุดที่มีการอภิปรายคือการออกแบบบ้านและการจัดวางเฟอร์นิเจอร์ ผู้ใช้แสดงความสนใจในการสแกนบ้านของพวกเขาด้วยกล้องโทรศัพท์และ LiDAR เพื่อสร้างโมเดล 3 มิติที่สามารถจัดวางเฟอร์นิเจอร์เสมือนจริงได้โซลูชันปัจจุบันเช่น Scaniverse สร้างตาข่าย (meshes) ที่สมบูรณ์แต่ไม่แยกวัตถุแต่ละชิ้น ทำให้การจัดวางใหม่เสมือนจริงทำได้ยาก แนวทางการตรวจจับวัตถุของ Cubify อาจแก้ปัญหานี้ได้โดยการระบุวัตถุแยกกันภายในพื้นที่การบูรณาการกับเทคโนโลยีเว็บชุมชนกำลังสำรวจวิธีการขยายและบูรณาการเทคโนโลยีนี้กับแพลตฟอร์มเว็บ ผู้แสดงความคิดเห็นหลายคนได้แบ่งปันทรัพยากรสำหรับการแสดงผลสแกน USDZ ใน Three.js ซึ่งเป็นไลบรารี 3D JavaScript ที่ได้รับความนิยม แสดงให้เห็นถึงระบบนิเวศที่กว้างขึ้นที่กำลังพัฒนาขึ้นรอบเทคโนโลยีการสแกน 3 มิติการมีเครื่องมือสำหรับการดูและการแสดงผลบ่งชี้ว่านักพัฒนากำลังทำงานอย่างแข็งขันเพื่อทำให้การตรวจจับวัตถุ 3 มิติและการแสดงผลสามารถเข้าถึงได้มากขึ้นในแพลตฟอร์มต่างๆการบูรณาการกับแพลตฟอร์ม Apple ในอนาคตผู้แสดงความคิดเห็นบางคนคาดการณ์เกี่ยวกับการบูรณาการที่อาจเกิดขึ้นกับแพลตฟอร์มของ Apple โดยเฉพาะอย่างยิ่งกับ Vision Pro ผู้ใช้คนหนึ่งแสดงความประหลาดใจที่เทคโนโลยีนี้ยังไม่เป็นส่วนหนึ่งของ CoreML ซึ่งเป็นเฟรมเวิร์กการเรียนรู้ของเครื่องของ Apple ในขณะที่อีกคนหนึ่งแนะนำว่าอาจมีการประกาศในงาน WWDC ที่กำลังจะมาถึงเมื่อพิจารณาจากการที่ Apple ให้ความสำคัญกับประสบการณ์ความเป็นจริงเสริม (AR) มากขึ้น Cubify Transformer อาจเป็นองค์ประกอบสำคัญสำหรับแอปพลิเคชัน AR ในอนาคตบนอุปกรณ์ Apple ซึ่งอาจช่วยให้เข้าใจสภาพแวดล้อมและการโต้ตอบกับวัตถุได้ซับซ้อนยิ่งขึ้นสรุปได้ว่า แม้ว่าชุดข้อมูล CA-1M และเทคโนโลยี Cubify Transformer ของ Apple จะแสดงให้เห็นถึงศักยภาพในการพัฒนาการตรวจจับวัตถุ 3 มิติ แต่การอนุญาตใช้งานที่มีข้อจำกัดและการวิจารณ์ประสิทธิภาพที่หลากหลายชี้ให้เห็นถึงความท้าทายที่อาจจำกัดการนำไปใช้ อย่างไรก็ตาม เทคโนโลยีนี้ถือเป็นก้าวสำคัญสู่ความเข้าใจสภาพแวดล้อมที่ซับซ้อนยิ่งขึ้นสำหรับแอปพลิเคชัน AR/VR โดยมีนัยสำคัญต่อการออกแบบบ้าน เกม และประสบการณ์ความเป็นจริงผสมอ้างอิง: CA-1M and Cubify Anything
ปัญญาประดิษฐ์
29 นาทีที่แล้ว
หุ้น Tesla ดิ่งเหวหลังยอดส่งมอบไตรมาส 1 ต่ำสุดในรอบสามปีท่ามกลางวิกฤตแบรนด์
56 นาทีที่แล้ว

ความเข้ากันได้ของ iOS 19: iPhone รุ่นใดจะได้รับการอัปเดตและการแก้ไขด้านความปลอดภัย
iOS
1 ชั่วโมงที่ผ่านมา

Amazon เปิดตัวฟีเจอร์ "Buy for Me" ใช้ AI ช่วยซื้อสินค้าจากเว็บไซต์อื่นแทนคุณ
ปัญญาประดิษฐ์
2 ชั่วโมงที่ผ่านมา

ภาษีของ Trump คาดว่าจะส่งผลกระทบต่อราคา Nintendo Switch 2 ขณะที่ ESA เตือนถึง "ผลกระทบเชิงลบ"
เกมคอนโซล
2 ชั่วโมงที่ผ่านมา

การต่อสู้ที่เพิ่มขึ้นระหว่างเทคนิค Web Fingerprinting และเครื่องมือปลอมตัวเบราว์เซอร์
ความปลอดภัย
6 ชั่วโมงที่ผ่านมา

สิทธิบัตรของ Samsung เผยแผนการอันทะเยอทะยานสำหรับสมาร์ทโฟนพับสี่ทบ
โทรศัพท์
6 ชั่วโมงที่ผ่านมา

ผู้ก่อตั้ง OnlyFans จับมือกับบริษัทคริปโตในการเสนอซื้อ TikTok อย่างน่าประหลาดใจ
สตาร์ทอัพ
8 ชั่วโมงที่ผ่านมา

สคริปต์ลดโปรแกรมไม่จำเป็นใน Windows ถูกวิจารณ์เรื่องการลบข้อมูลการติดตามที่จำกัด
Microsoft
12 ชั่วโมงที่ผ่านมา

ภาษาโปรแกรมมิ่ง C3 ได้รับความนิยมเพิ่มขึ้นในฐานะทางเลือกทดแทน C ยุคใหม่
12 ชั่วโมงที่ผ่านมา

CMF Phone 2 เผยทีเซอร์พร้อมอัปเกรดกล้อง เตรียมเปิดตัวเร็วๆ นี้
โทรศัพท์
13 ชั่วโมงที่ผ่านมา

Path of Exile 2 แพทช์ 0.2.0 นำการเนิร์ฟครั้งใหญ่มาสู่บิลด์ยอดนิยม
เกมคอมพิวเตอร์
13 ชั่วโมงที่ผ่านมา

มีรายงานว่า AMD กำลังเตรียมการ์ดจอ Radeon RX 9070 GRE ราคาประหยัดพร้อม VRAM 12GB
การ์ดจอ
13 ชั่วโมงที่ผ่านมา

Nix-Ninja นำการคอมไพล์แบบเพิ่มเติมมาสู่ Nix โดยใช้ Dynamic Derivations
18 ชั่วโมงที่ผ่านมา

InitWare ปรากฏตัวเป็นทางเลือกที่พกพาได้และเป็นโมดูลมากกว่า systemd
สตาร์ทอัพ
18 ชั่วโมงที่ผ่านมา

Bill Gates ฉลองครบรอบ 50 ปีของ Microsoft ด้วยการเปิดเผยซอร์สโค้ดดั้งเดิมของ BASIC
Microsoft
19 ชั่วโมงที่ผ่านมา

รายได้ ChatGPT พุ่งสูงถึง 415 ล้านดอลลาร์ต่อเดือน เมื่อผู้สมัครสมาชิกหลั่งไหลเข้าใช้ฟีเจอร์พรีเมียม
20 ชั่วโมงที่ผ่านมา

Apple ครบรอบ 49 ปี: นวัตกรรมที่ขยายไปถึงการจัดการแบตเตอรี่ iPhone
Apple
20 ชั่วโมงที่ผ่านมา

Anthropic เปิดตัว Claude for Education เพื่อเปลี่ยนแปลงบทบาทของ AI ในการศึกษาระดับอุดมศึกษา
ปัญญาประดิษฐ์
20 ชั่วโมงที่ผ่านมา

ข่าวลือ Google Pixel 10 Pro Fold: ดีไซน์เดิม ราคาถูกลง แต่ยังมีข้อกังวลเรื่องกล้อง
โทรศัพท์
21 ชั่วโมงที่ผ่านมา
