
中的各个模块。以往感知、决策、规划是人为分开的,现在全部放入潜空间后,需要用语言等工具进行桥接。邓志东认为,文本语言是较优方案,因为它能导入语义和知识增强,增加决策规划的可解释性。通过VLA加上RAG(检索增强生成)技术,可以充分利用先验驾驶知识,并在输出端实现对动作语义的可解释对齐。 第四,发展“经验主义的物理AI”。他提到,开车是一项技能型任务,更依赖驾驶经验与技巧,而非智商或知识丰富程度。
当前文章:http://bdd.mubensai.cn/0pb/0aeoj4n.htm
发布时间:13:04:00