text2sql论文14:Tool-Assisted Agent on SQL Inspection and Refinement in Real-World Scenarios

161 views

Tool-SQL：基于Agent智能体的Text2SQL解决方案，显著提升Text2SQL效果

1.背景与挑战

Text2SQL核心问题：自然语言转SQL在真实场景中面临数据库不匹配（Database Mismatches），包括：

方案类型	代表方法	缺点
自我纠正	DIN-SQL等	依赖静态规则，仅能处理有限错误类型
执行反馈	MAC-SQL等	仅能捕获执行异常（如语法错误），忽略数据库不匹配

核心思想：通过工具增强的Agent动态检测和修正SQL问题

两大核心工具：

检查WHERE/HAVING条件值是否匹配数据库
若无匹配 → 返回相似值供Agent参考
Agent选择修正值或调整条件
重复至成功或达最大尝试次数

外键关系缺失
JOIN冗余/缺失
列类型不匹配
GROUP BY子句误用

基于数据库模式（Schema）静态分析
避免直接执行高风险查询，提升安全性

Agent架构设计：将SQL生成分解为Python函数调用（如add_where()），结构化参数便于工具检测

动态迭代：工具反馈 → Agent修正 → 重新验证

真实场景适配：专为模糊条件和隐式约束优化，超越传统执行反馈方案

数据集：Spider、Spider-Realistic、Spider-Mismatch（自建真实场景数据集）

质量提升：解决传统方法忽略的数据库不匹配问题

安全性：通过静态分析减少高风险查询执行

可扩展性：工具库可灵活扩展（如新增业务规则检测）