全新基准GTA助力大模型工具调用能力评测 真实世界复杂任务 本篇论文已被NeurIPS2024>,利用语言模型调用工具,是实现通用目标智能体,general,purposeagents,的重要途径,对语言模型的工具调用能力提出了挑战,然而,现有的工具评测和...