基于 MCP 的智能语音控制机械臂夹取系统

本项目开发了一个针对于机械臂夹取任务的机器人的基于 MCP 的大预言模型智能体，MCP 服务中绑定了机器人运动所需要的各种 API，包括视觉识别，图像处理，物体夹取，物体放置等的 API。智能体基于 Langchain 和 Langgraph 构建，首先构建链式图像识别智能体，并通过结构化输出将结构化物体坐标数据传入给任务规划智能体，任务规划智能体通过对用户输入进行分析，将任务拆解成各个小步骤，分布去调用绑定的 MCP 工具，最终完成整个夹取工作首先需要启动 MCP 服务器，启动完成之后启动通过 Langgraph 构建的树状机械臂操作智能体，首先智能体会识别当前场景，识别完成之后要求用户输入目标问题，比如，将绿色零食夹取放到蓝色盘子里，智能体会将任务分解为夹取和放置两个部分，并自助调用相应的基于 streamable-http 的 MCP 服务，并最终完成任务，完成后主动权交给用户，进行下一轮的循环任务。

*此项目展示图片来自项目作者

资源

查看项目代码库

观看项目相关视频

基于 MCP 的智能语音控制机械臂夹取系统

项目开发者

相关技术...

资源