GLM-PC是智谱科技基于CogAgent视觉多模态模型开发的通用Agent,能模拟人类操作计算机,实现“无人驾驶”PC的技术探索。GLM-PC能执行预定会议、文档处理、网页搜索总结等任务,支持远程和定时操作。GLM-PC能模拟人眼看、脑规划、手执行的方式使用电脑,具备跨平台能力,不依赖HTML或API,有更高的能力上限。目前处于内测阶段,旨在提升使用工具能力,探索自我学习能力。
GLM-PC的主要功能会议替身:帮助用户预定和参与会议,并发送会议总结。文档处理:支持文档的下载、发送及理解和总结文档内容。网页搜索与总结:在指定平台(如微信公众号、知乎、小红书等)搜索指定关键词,并完成阅读、总结。远程和定时操作:用手机远程发送指令,GLM-PC能自主完成电脑操作,或设定在未来的某个时间点,在开机状态下定时执行任务。隐形屏幕:在用户工作时,在不占用用户屏幕的情况下自主完成工作,解放屏幕使用权。GLM-PC内测申请地址GLM-PC「邀请体验」已开启,需填写问卷申请内测。
如何使用GLM-PC安装和设置:确保电脑是搭载M系列芯片的Mac电脑,推荐M1和M3系列设备。访问GLM-PC的官方网站获取GLM-PC的安装包。按照网站的指示完成下载和安装过程。用户授权:首次使用时,需要授权GLM-PC访问某些电脑功能和数据,以便够执行任务。输入指令:打开GLM-PC应用后,在对话框中输入想要进行的操作指令。例如,输入“查询B站热门内容”或“预定腾讯会议并发送会议邀请”。执行任务:GLM-PC评估指令并决定操作计划,然后自动执行任务。例如,它可能会打开浏览器搜索信息,或者打开日历应用预定会议。敏感操作确认:当遇到敏感操作时,GLM-PC自动暂停并等待用户的确认。用户需要点击控制条上的继续按钮继续任务。远程操作:如果需要通过手机远程操作电脑,在GLM-PC设置中打开“挂起模式”,远程发送指令。GLM-PC的应用场景信息处理:适配微信、飞书、钉钉,向联系人或群聊发送信息。会议安排:适配腾讯会议、飞书会议等,预定会议日程、发送会议邀请;定时加入指定会议。文档处理:支持文档下载、发送、理解和总结文档。网页内容处理:打开浏览器,在百度、公众号、知乎、小红书等平台搜索关键词,进行阅读总结或翻译。电子商务:在淘宝上购买特定尺码的羽绒服并完成购买流程。