新闻动态
院士邀请|邓志东:生成式人工智能正从数字领域迈向真实物理世界
来源:他山石智库
2024年11月12日,人工智能产业CEO大会暨人工智能赋能新型工业化供需对接活动在成都盛大举行。会上,清华大学教授、人工智能研究院视觉智能研究中心主任邓志东发表了题为“AI源动力:探索产业发展新趋势”的精彩演讲。他深入探讨了聚焦大模型应用、具身智能面临的挑战以及L4自动驾驶与通用人形机器人的协同演进等关键议题,为人工智能产业的未来发展提供了深刻洞察。
一、大模型应用:驱动人工智能发展新优势
邓志东指出,人工智能的发展已从单模态文本大型语言模型演进至多模态大型语言模型,并进一步向具身智能和交互式通用人工智能迈进。在这一进程中,大模型的实际应用成为推动产业发展的核心动力。大模型的价值在于其能够赋能多样化的应用场景,推动智能经济与智能社会的发展,从而找到真正的产业价值,并促进大模型自身性能的迭代演进。
他进一步阐述了三条实现大模型应用的现实路径:一是提升基座大型语言模型的能力上限,聚焦行业原生多模态大模型的发展;二是利用高性能多模态通用大型语言模型进行微调,构建针对特定任务的专用模型;三是聚焦智能体新技术新范式新导向的发展,探索智能体一体化端到端的新范式,如自动驾驶和通用人形机器人。
邓志东强调,我国在应用场景多样性、应用落地速度、数据丰富程度以及商业模式构建上的优势,将在大模型的应用落地过程中充分体现出来,形成可持续发展的大模型新应用、新业态、新模式,重建我们在AI大模型时代下的新优势。
二、具身智能:赋能智能制造的挑战与机遇
邓志东还分享了关于具身智能发展的看法,特别是如何通过具身智能赋能智能制造。他提到,具身智能的实现路径已从感知空间或观察空间延伸至动作空间,涉及感知与动作之间的相互关系和相互作用。这要求具身智能体具备从感知空间到动作空间的决策推理能力,即单段式一体化具身智能体研发范式。
他进一步指出,具身智能体在完成任务时可能会遇到事实性幻觉和上下文不一致幻觉等技术难题,这可能导致时空错乱,特别是在自动驾驶和人形机器人等实际应用场景中带来安全风险。为了缓解这些问题,可以采取提高训练数据质量、引入纠错机制和优化模型结构等措施。
同时,邓志东也看到了具身智能体在新范式和新导向方面的重要机遇。从视觉-(文本)语言模型(VLM)发展到视觉-语言-动作模型(VLA),以及从多段式方法向单段式方法的转变,都为具身智能体的发展提供了新的可能。
三、产业发展新趋势:自动驾驶与人形机器人的协同演进
邓志东认为,人工智能产业的发展新趋势在于通用与泛化。通用意味着能够应对各种环境与任务的变化,泛化则指跨场景、跨领域的广泛应用。通用人形机器人与L4自动驾驶作为典型的具身智能代表,可以相互协同演进。
他提到,高级别的自动驾驶技术正在实现规模化落地应用,如基于视觉大模型VLA的端到端解决方案。同时,高级别自动驾驶的降维应用也在加速通用人形机器人的发展。更多的人形机器人将走向制造业的生产线,实现无人化的自动化车间与工厂。而自动驾驶的大规模商业化落地,也将推动人形机器人的加速发展,催生人类-机器人共融社会的形成与演进。
展望未来
人工智能产业将迎来更加广阔的发展前景。随着大模型应用的不断深入和具身智能技术的不断突破,人工智能将更好地赋能智能制造、自动驾驶、人形机器人等领域的发展。同时,L4自动驾驶与通用人形机器人的协同演进也将推动人工智能产业向更高层次迈进。
在这个过程中,我们需要不断加强技术创新和人才培养,提升人工智能技术的核心竞争力。同时,也需要关注伦理、隐私和安全等问题,确保人工智能技术的健康、可持续发展。
此外,随着人工智能技术的广泛应用和深入发展,我们也需要思考如何更好地利用人工智能技术推动社会进步和发展。例如,可以利用人工智能技术优化资源配置、提高生产效率、改善公共服务等,为人民群众创造更加美好的生活。
总之,人工智能产业正处于快速发展阶段,未来前景广阔。我们需要抓住机遇、迎接挑战,不断推动人工智能技术的创新和应用,为人类社会的发展贡献更多智慧和力量。
智能体人形邓志东模型人工智能发布于:北京市声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。上一篇:没有了