返回资讯列表

tau2-bench - Python项目推荐

τ²-Bench: Evaluating Conversational Agents in a Dual-Control Environment

GitHub Trending
GitHub Trending··1 分钟阅读

τ²-Bench: Evaluating Conversational Agents in a Dual-Control Environment

项目统计:⭐ 634 stars | 🍴 152 forks📈 今日新增 5 stars

编程语言:Python

标签:ai, benchmark, conversational-agents, language-model-agent, llm

开源协议:MIT

GitHub 链接:https://github.com/sierra-research/tau2-bench 项目主页:https://arxiv.org/abs/2506.07982


#AI#科技#资讯
分享:

AI 智能摘要

快速理解文章核心

💡 AI 生成内容仅供参考

订阅 AI Daily 资讯

每周精选 AI 行业最新动态、技术解读与实用工具,直达您的邮箱。

免费订阅,随时取消

10,000+
订阅读者
每周
更新频率
100%
免费