- TRI : Toyota Research Institute
- 2024/11/12 Large Behavior Models: The Next Evolution in AI That's Taking Over ๐
- 2024/11/11 Large Behavior Models: The Key to Predicting and Optimizing Human Actions
- 2024/11/11 Large Behavior Models and the future of AI in robotics
- 2024/11/10 Large Behavior Models: A New Frontier In AI
- 2024/11/06 NVIDIA Advances Robot Learning and Humanoid Development With New AI and Simulation Tools
- 2024/10/31 Nvidia๋ ์ ๋ฌธ๊ฐ๋ค๋ณด๋ค ์ธ๊ฐํ ๋ก๋ด์ ๋ ์ ์ ์ดํ๋ ์์ AI ๋ชจ๋ธ์ ํ๋ จ์์ผฐ๋ค.
- 2024/10/30 NVIDIA Introduces HOVER, a 1.5 M Parameter Neural Network for Humanoid Robotics
- 2024/10/16 Boston Dynamics and Toyota team up: Teaching Atlas how to learn
- 2024/06/10 ๋ก๋ด์ด ์ ํ๋ธ ๋ณด๊ณ ๋ฐฐ์ฐ๋ LBM ์๋๊ฐ ์๋ค
- 2024/05/06 How Large Behavior Models (LBM's) can transform Humanoids
- 2024/04/23 Cracking Robotic Investment with GenAI
- 2024/03/18 NVIDIA Announces Project GR00T Foundation Model for Humanoid Robots and Major Isaac Robotics Platform Update
- 2024/01/07 Large Behaviorial Models for AI Robots
- 2023/09/21 ๋ก๋ด, ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์์ โ๋๊ท๋ชจ ํ๋ ๋ชจ๋ธโ๋ก
- 2023/09/19 Toyota Research Institute Unveils Breakthrough in Teaching Robots New Behaviors
- 2023/09/15 TRIโs Robots Learn New Manipulation Skills in an Afternoon. Hereโs How.
- OpenVLA (Open Vision-Language-Action Model)
- VIMA (General Robot Manipulation with Multimodal Prompts
- RT-1-X
- LM-Nav
- Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
- Drake - Model-Based Design and Verification for Robotics
- Self-Adaptive Robots - Workshop on Embodiment-Aware Robot Learning RSSโ24
Toyota Research Institute (TRI)์์ ์ฐ๊ตฌ ์ค์ธ Diffusion Policy๋ ๋ก๋ด์ด ์๋ก์ด ํ๋์ ํ์ตํ๋ ํ์ ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก, ๊ธฐ์กด ๋ฐฉ์๋ณด๋ค ํจ์จ์ ์ด๊ณ ์ผ๊ด๋๊ฒ ๋ณต์กํ ๊ธฐ์ ์ ์ต๋ํ ์ ์๋๋ก ํฉ๋๋ค. ์ด ๊ธฐ๋ฒ์ ํนํ ์ธ๊ฐ์ ์์ฐ(demonstration)์ ํตํด ๋ก๋ด์ด ๋์์ ๋ฐฐ์ฐ๋ ๋ฐ ์ค์ ์ ๋๊ณ ์์ผ๋ฉฐ, ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์ ๊ณตํ๋ ๊ฒ๋ง์ผ๋ก๋ ๋ค์ํ ๊ธฐ์ ์ ์ต๋ํ๋๋ก ๋์ต๋๋ค.
Diffusion Policy๋?
Diffusion Policy๋ **์กฐ๊ฑด๋ถ ํ์ฐ ๋ชจ๋ธ(Conditional Diffusion Model)**์ ํ์ฉํ ์์ฑ AI ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์์ ๋๋ค. ์ด๋ฅผ ํตํด ๋ก๋ด์ ํ๋ ์ ์ฑ ์ ํ์ตํ ์ ์์ผ๋ฉฐ, ํนํ ๋ก๋ด์ **๋น์ฃผ์ผ ๋ฐ ๋ชจํฐ ์ ์ฑ (visuomotor policy)**๋ฅผ ํฅ์์ํค๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค. ์ด ์ ๊ทผ๋ฒ์ ๊ธฐ์กด์ ๋ก๋ด ํ์ต ๋ฐฉ์๋ณด๋ค ๋น ๋ฅด๊ณ ์์ ์ ์ด๋ฉฐ, ํนํ ๋ณํ ๊ฐ๋ฅํ ๋ฌผ์ฒด(์: ์ฒ์ด๋ ์ก์ฒด)๋ฅผ ๋ค๋ฃจ๋ ์์ ์์๋ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค.
์๋ ์๋ฆฌ
Diffusion Policy๋ ์ฃผ์ด์ง ๋ชฉํ๋ฅผ ๋ฌ์ฑํ๊ธฐ ์ํด ๋๋คํ ์ด๊ธฐ ๋์ ๊ฒฝ๋ก๋ฅผ ์์์ ์ผ๋ก ์ค์ ํ ํ, ์ด๋ฅผ ์ ์ง์ ์ผ๋ก ์กฐ์ ํ์ฌ ์ต์ ์ ๋์ ๊ฒฝ๋ก๋ฅผ ์์ฑํฉ๋๋ค. ์ด ๊ณผ์ ์ **ํ๋ฅ ์ ์ํ๋ง(Stochastic Sampling)**์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฉฐ, ์ฌ๋ฌ ๋ฒ์ ๋ฐ๋ณต์ ํตํด ์ ์ ๋ ์ ๋ฐํ ํ๋์ ๋ง๋ค์ด๋ ๋๋ค. ์ด๋ฅผ ํตํด ๋จ ๋ช ๋ฒ์ ์์ฐ๋ง์ผ๋ก๋ ์๋ก์ด ํ๋์ ๋น ๋ฅด๊ฒ ํ์ตํ ์ ์์ต๋๋ค.
์ฃผ์ ํน์ง
์ค์ฉ ์ฌ๋ก ๋ฐ ๋ชฉํ
TRI๋ ์ด๋ฏธ ์ด ๊ธฐ๋ฒ์ ํตํด 60๊ฐ ์ด์์ ๋ณต์กํ ๊ธฐ์ (์: ์ก์ฒด ๋ฐ๋ฅด๊ธฐ, ๋๊ตฌ ์ฌ์ฉ, ๋ณํ ๊ฐ๋ฅํ ๋ฌผ์ฒด ์กฐ์ ๋ฑ)์ ๋ก๋ด์ ๊ฐ๋ฅด์ณค์ผ๋ฉฐ, 2024๋ ๊น์ง 1,000๊ฐ์ ๊ธฐ์ ์ ์ถ๊ฐ๋ก ํ์ต์ํค๋ ๊ฒ์ ๋ชฉํ๋ก ํ๊ณ ์์ต๋๋ค. ์ด๋ฌํ ๊ธฐ์ ์ ์ฃผ๋ก ๋ก๋ด์ด ์ธ๊ฐ์ ์์ ์ ์ง์ํ๊ณ , ์ผ์์ ์ธ ๊ฐ์ ํ๊ฒฝ์์ ํ์ฉ๋ ์ ์๋๋ก ์ค๊ณ๋์์ต๋๋ค.
์ฐ๊ตฌ ์ฑ๊ณผ
TRI๋ Columbia University์ ์ฐ๊ตฌ์ง๊ณผ ํ๋ ฅํ์ฌ Diffusion Policy๋ฅผ ๊ฐ๋ฐํ์ผ๋ฉฐ, 12๊ฐ์ ๋ก๋ด ์์ ๋ฒค์น๋งํฌ์์ 46.9% ํฅ์๋ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ์ด ์ฐ๊ตฌ๋ ๋ก๋ด์ด ๋ ๋ณต์กํ๊ณ ๋ค์ํ ์ํฉ์์ ์ธ๊ฐ์ฒ๋ผ ํ๋ํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ์ด์ด์ฃผ์์ผ๋ฉฐ, ํฅํ ๋ก๋ด ์ฐ์ ์ ํจ๋ฌ๋ค์์ ๋ณํ์ํฌ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์์ต๋๋ค.
์ด๋ฒ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ 2023๋ Robotics: Science and Systems (RSS) ์ปจํผ๋ฐ์ค์์๋ ๋ฐํ๋์์ผ๋ฉฐ, ์ถ๊ฐ์ ์ธ ๊ธฐ์ ์ ์ธ๋ถ ์ฌํญ์ TRI์ ๊ณต์ ์น์ฌ์ดํธ์ ํ์ ์ง์์ ํ์ธํ ์ ์์ต๋๋ค. ์ด๋ก์จ TRI๋ ๋ก๋ด์ด ๋ ๋น ๋ฅด๊ณ ํจ์จ์ ์ผ๋ก ์ธ๊ฐ๊ณผ ์ํธ์์ฉํ๋ฉฐ ์๋ก์ด ๊ธฐ์ ์ ์ต๋ํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ์ด์ด๊ฐ๊ณ ์์ต๋๋ค.
์ด ๊ธฐ์ ์ ํฅํ ๋ก๋ด์ ํ๋ ๋ชจ๋ธ(Large Behavior Model, LBM) ๊ตฌ์ถ์ ์ค๋ํ ์ญํ ์ ํ ๊ฒ์ผ๋ก ๊ธฐ๋๋ฉ๋๋ค. ์ด๋ ๋ง์น ์์ฐ์ด ์ฒ๋ฆฌ์์ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ์ํํ๋ ์ญํ ๊ณผ ์ ์ฌํ๊ฒ, ๋ก๋ด์ ํ๋ ๋ฒ์๋ฅผ ํฌ๊ฒ ํ์ฅํ ์ ์์ต๋๋ค ๏ฟผ ๏ฟผ ๏ฟผ ๏ฟผ.