fbpx
Tuesday, December 1Modern Manufacturing

งานวิจัยเผย หุ่นยนต์รับรู้ได้ดียิ่งขึ้นเมื่อใช้การประมวลผลแสง

นักวิจัยจากกองทัพสหรัฐฯ พัฒนาการเรียนรู้สภาพแวดล้อมของหุ่นยนต์ด้วยแสง ซึ่งเกิดขึ้นมาจากการตั้งคำถามถึงการทำงานของสมองมนุษย์ในด้านความสว่างและความแตกต่างของแสงซึ่งกลายมาเป็นกุญแจสำคัญในการเพิ่มความสามารถสำหรับการรับรู้ข้องหุ่นยนต์ สนับสนุนให้เกิดหุ่นยนต์อัตโนมัติที่สามารถทำงานร่วมทีมกับมนุษย์ได้อย่างมีประสิทธิภาพ

การพัฒนาระบบอัตโนมัติถือเป็นหนึ่งในความสำคัญลำดับต้น ๆ ของกองทัพสหรัฐ และ Machine Sensing หรือการรับรู้ของเครื่องจักรจะต้องสามารถใช้งานได้ภายใต้สภาพแวดล้อมที่เกิดการเปลี่ยนแปลงอยู่ตลอด

ในตอนแรกของการพัฒนานั้นมีการใช้ Machine Vision Algorithm แต่ภาพที่ได้มาจากโลกจริงนั้นถูกบีบอัดให้มีความแคบแบบเดียวกับที่กล้องจากสมาร์ทโฟนทำซึ่งมันเป็นกระบวนการที่เรียกว่า Tone Mapping ที่สร้างความเปราะบางให้กับการทำงนาของ Algorithm เพราะการใช้ข้อมูลจากภาพเสมือนที่ไม่ได้ถูกต้องตรงเป๊ะกับภาพที่มองเห็นตามความเป็นจริงนั่นเอง

ทีมวิจัยจึงได้พัฒนาระบบใหม่ขึ้นมาที่มีการแสดงผลละเอียดถึง 100,000 – 1 โดยลอกเลียนการประมวลผลจากสมองภายใต้สถานการณ์ที่ยึดโยงกับความเป็นจริงมากขึ้นจึงทำให้เซนเซอร์สามารถตอบสนองได้ใกล้เคียงกับปฏิกริยาทางชีววิทยามากยิ่งขึ้น

Algorithm สำหรับการมองเห็นในปัจจุบันนั้นมีพื้นฐานมาจากการศึกษามนุษย์และสัตว์ด้วยหน้าจอมอนิเตอร์ของคอมพิวเตอร์ซึ่งมีข้อจำกัดความสว่างอยู่ที่ 100 – 1 ซึ่งเป็นอัตราความแตกต่างระหว่างจุดที่สว่างที่สุดและมืดที่สุด แต่ในโลกแห่งความเป็นจริงแล้วสัดส่วนอาจสูงถึง 100,000 – 1 เป็นเงื่อนไขที่เรียกว่า High Dynamic Range หรือ HDR

สำหรับความเปลี่ยนแปลงของแสงที่เกิดขึ้นแม้เพียงเล็กน้อยแต่กลับกลายเป็นความท้าทายในระบบของโดรนสำหรับกองทัพที่ต้องบินผ่านพื้นที่ป่าเขา อาจทำให้เกิดการสับสนกับภาพสะท้อนต่าง ๆ เช่น ใบไม้ที่สั่นไหวเพราะลม หรือยานยนต์อัตโนมัติที่ต้องขับเคลื่อนบนพื้นที่ที่มีความยากลำบากสูงอาจไม่สามารถจดจำตำแหน่งหรือตรวจเจอปัญหาได้เนื่องจากเงื่อนไขของแสงนั้นแตกต่างจากที่ถูกฝึกฝนมา

จากปัญหาดังกล่าวทีมวิจัยจึงได้ค้นหาวิธีที่สมองนั้นทำความเข้าใจความต่าง 100,000 – 1 ของสมองที่มีต่อโลกจริงและทำการบีบอัดให้เป็นภาพที่แคบลงเพื่อให้มนุษย์สามารถตีความเข้าใจรูปทรงได้ โดยทีมได้ศึกษาการประมวลภาพด้วย HDR ในยุคแรก ๆ ทดสอบความเรียบง่ายของฟังก์ชัน เช่น HDR Luminance และ Edge Interact

จากการทดสอบพบว่าสมองนั้นมีพื้นที่สำหรับภาพมากกว่า 30 พื้นที่และการศึกษานี้อยู่เพียงขอบเขตการรับรู้ของลูกตาในการทำความเข้าใจรูปทรง 3 มิติ ทำให้พบช่องว่างขนาดมหญ่ระหว่างการใช้งานในห้องทดลองกับสภาพแวดล้อมจริง โดยทีมวิจัยพบความเชื่อมโยงระหว่างแสงและมุมที่ปฏิสัมพันธ์กันสำหรับการนำเสนอภายในสมองซึ่งจะช่วยให้ Algorithm สามารถสร้างภาพการรับรู้แบบ 3 มิติในโลกจริงด้วยการด้วยการปรับความคลุมเครือเมื่อทำการประมาณการรูปทรง 3 มิติจากภาพเคลื่อนไหว 2 มิติ

นอกจากการใช้งานในระบบอัตโนมัติแล้วการต้นพบนี้ยังช่วยเปิดทางสำหรับอุปกรณ์ AI อื่น ๆ อีกด้วย เช่น เรดาห์ หรือการควบคุมด้วยคำพูดที่ต้องตรวจจับความหลากหลายจำนวนมาก

ที่มา:
army.mil

Thos
"I can't understand why people are frightened of new ideas. I'm frightened of the old ones"
John Milton Cage Jr.