Google และ Boston Dynamics ผสานโมเดล AI ของ Gemini เข้ากับหุ่นยนต์ Spot เพื่อควบคุมด้วยภาษาธรรมชาติและดำเนินงาน

ข่าว Gate, 16 เมษายน — Google และ Boston Dynamics ประกาศการผสานรวมโมเดลการให้เหตุผลแบบ Gemini Robotics ที่ถูกทำให้อยู่ในรูปของร่างกายเข้ากับหุ่นยนต์สี่ขา Spot โดยทำให้ระบบสามารถตีความคำสั่งด้วยภาษาธรรมชาติ จดจำวัตถุ และดำเนินงานที่ซับซ้อนได้อย่างอิสระ

ความร่วมมือนี้ต่อยอดจากงานทดลองที่ทำในแฮกกาธอนภายในปี 2025 ช่วยให้ Spot ประมวลผลอินพุตด้านภาพและแปลงคำสั่งระดับสูงให้เป็นการกระทำทางกายที่ประสานกัน ไม่เหมือนการเขียนโปรแกรมหุ่นยนต์แบบเดิมที่อาศัยตรรกะแบบกำหนดตายตัวทีละขั้น ระบบใช้พรอมป์ต์เชิงสนทนาและเลเยอร์ซอฟต์แวร์ตัวกลางที่เชื่อมโมเดล Gemini เข้ากับ API ของ Spot โดย AI สามารถเลือกความสามารถที่กำหนดไว้ล่วงหน้าได้ เช่น การนำทาง การตรวจจับวัตถุ การจับภาพ การหยิบจับ และการวาง พร้อมข้อเสนอแนะแบบเรียลไทม์ที่ช่วยให้เกิดพฤติกรรมที่ปรับตัวได้โดยไม่ต้องมีการแทรกแซงด้วยตนเอง

ในการสาธิต ระบบตีความคำสั่งทั่วไปเพื่อจัดระเบียบสิ่งของได้สำเร็จ โดยวิเคราะห์ข้อมูลภาพและกำหนดเส้นทางให้หุ่นยนต์ผ่านลำดับการกระทำ แนวทางนี้ยังคงความปลอดภัยในการปฏิบัติงานด้วยการจำกัดความสามารถของ AI ไว้ภายในขอบเขตที่กำหนดล่วงหน้าใน API ของหุ่นยนต์ โดยสร้างสมดุลระหว่างความสามารถในการปรับตัวกับประสิทธิภาพที่ถูกควบคุม ความร่วมมือนี้ชี้ให้เห็นถึงโอกาสในการเพิ่มประสิทธิภาพสำหรับนักพัฒนา ด้วยการลดการเขียนโค้ดแบบแมนนวล และทำให้วิศวกรสามารถมุ่งเน้นการกำหนดเป้าหมายแทนการเขียนโปรแกรมทุกลำดับการกระทำ

news.article.disclaimer

btc.bar.articles

แอนโทรปิกถึงมูลค่า $1 ล้านล้านดอลลาร์ แซง OpenAI ในตลาดรอง

ข่าวประจำเกต 28 เมษายน — แอนโทรปิก (Anthropic) แซงหน้าโอเพนเอไอ (OpenAI) ในมูลค่าการประเมินในตลาดเอกชน โดยมูลค่าที่คาดไว้แตะระดับ $1 ล้านล้านดอลลาร์ จากธุรกรรมรองที่เกิดขึ้นล่าสุด มูลค่าการประเมินของ OpenAI ได้ปรับตัวลงมาที่ราว $880 พันล้านดอลลาร์ ในตลาดที่คล้ายกัน การเปลี่ยนแปลงนี้สะท้อนแรงส่งที่เปลี่ยนไปอย่างชัดเจนในอุตสาหกรรม AI,

GateNews1 ชั่วโมง ที่แล้ว

NVIDIA เปิดตัว Nemotron 3 Nano Omni แบบโอเพนซอร์สสำหรับมัลติโหมด

NVIDIA เผยแพร่ Nemotron 3 Nano Omni ซึ่งเป็นโมเดลมัลติโหมดแบบโอเพนซอร์ส โดยผสานการมองเห็น เสียง และภาษาเข้าเป็นโมเดลเดียว ทำหน้าที่เป็นชั้นการรับรู้สำหรับเอเจนต์ AI แกนหลักคือ 30B-A3B MoE, context 256K, อัตราการทำงาน 9x รองรับอินพุตประเภทข้อความ ภาพ เสียง และวิดีโอ ฯลฯ ผลลัพธ์เป็นข้อความ ร่วมกับ Nemotron 3 Super/Ultra เพื่อรองรับสถานการณ์ต่างๆ เช่น การควบคุมคอมพิวเตอร์ ความฉลาดของเอกสาร และการเข้าใจข้อมูลทั้งภาพและเสียง พร้อมทั้งเปิดเผยน้ำหนัก (weights) และข้อมูลการฝึก นำไปใช้งานได้ครอบคลุมทั้งในเครื่อง (local), NIM และแพลตฟอร์มของบุคคลที่สาม

ChainNewsAbmedia1 ชั่วโมง ที่แล้ว

Claude Code เพิ่มการแจ้งเตือนบนมือถือ: แจ้งเตือนอัตโนมัติเมื่อมีงานที่ใช้เวลานานเสร็จสิ้นหรือเมื่อจำเป็นต้องมีการตรวจสอบ

ตอนนี้ Claude Code สามารถส่งการแจ้งเตือนผ่านการพุชบนมือถือได้ เพื่อเตือนเมื่อมีการทำงานระยะยาวเสร็จสิ้นหรือเมื่อจำเป็นต้องมีการแทรกแซงจากผู้ใช้ เงื่อนไขในการเปิดใช้งานคือเมื่อเปิดใช้งาน Remote Control และใน config มีการตั้งค่า “Push when Claude decides” เครื่องมือสำหรับการพุชระดับพื้นฐานถูกเพิ่มเข้ามาตั้งแต่วันที่ 15 เมษายน v2.1.110 ประกาศฉบับนี้เป็นระดับการตลาดสำหรับภายนอก

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

Claude ผสานตัวเชื่อมต่อครีเอทีฟ 8 รายการกับ Adobe, Blender ฯลฯ

ตามประกาศของบล็อกทางการของ Anthropic เมื่อวันที่ 28 เมษายน Claude เปิดตัวโครงการ Claude for Creative Work โดยร่วมมือกับพาร์ทเนอร์ด้านซอฟต์แวร์สร้างสรรค์ 8 รายในการเปิดตัวคอนเนกเตอร์ (connectors) โดยมีเป้าหมายเพื่อให้ Claude สามารถทำงานร่วมกับผู้เชี่ยวชาญด้านความคิดสร้างสรรค์ได้โดยตรงภายในเครื่องมือที่พวกเขามีอยู่แล้ว ในขณะเดียวกัน Anthropic Labs ได้เปิดตัวผลิตภัณฑ์ใหม่ Claude Design และทาง Anthropic ก็เข้าร่วมในฐานะ patron ใน Blender Development Fund คอนเนกเตอร์ 8 รายสำหรับซอฟต์แวร์ด้านความคิดสร้างสรรค์: จากการสร้างแบบจำลอง 3D ไปจนถึงการควบคุมแบบเรียลไทม์สำหรับ VJ รายชื่อซอฟต์แวร์ที่ร่วมมือกับ Anthropic เพื่อเปิดตัว connector ในครั้งนี้ (อ้างอิงจากประกาศทางการของ Anthropic ที่จัดไว้)

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

NVIDIA เปิดตัวโมเดลมัลติโหมด Nemotron 3 Nano Omni พร้อมเพิ่มประสิทธิภาพทรูพุต 9 เท่า

ข้อความ Gate News วันที่ 28 เมษายน — NVIDIA ได้เปิดตัว Nemotron 3 Nano Omni ซึ่งเป็นโมเดลมัลติโหมดแบบโอเพนซอร์สที่มีสถาปัตยกรรม (MoE) แบบ mixture-of-experts (30B-A3B) พร้อมรองรับขอบเขตคอนเท็กซ์ 256K โมเดลนี้รวมการประมวลผลอินพุตวิดีโอ เสียง ภาพ และข้อความไว้ในเฟรมเวิร์กเดียวกัน เมื่อเทียบ

GateNews3 ชั่วโมง ที่แล้ว

เยอรมนีตัดพาลันติร์ออกจากโครงการเมฆทหาร เนื่องจากกังวลเรื่องอธิปไตยของข้อมูล

ข่าวจาก Gate 28 เมษายน — พลเรือโทโธมัส ดาอุม รองผู้อำนวยการระดับสูงสุดของเยอรมนีด้านไซเบอร์และพื้นที่ข้อมูล ได้ตัดสินใจไม่ใช้ซอฟต์แวร์ของพาลันติร์ในโครงการเมฆทหารของกองทัพเยอรมนีที่เป็นโครงการเรือธง โดยให้เหตุผลถึงความกังวลเรื่องอธิปไตยของข้อมูลและรูปแบบการดำเนินงานของบริษัทสหรัฐฯ กองทัพของเยอรมนี

GateNews3 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น