← 返回信息流
数据库·更新于 2026/05/15 04:00

SEMA-SQL:用LLM语义算子扩展关系代数,自动生成混合查询

传统SQL无法处理实体语义匹配、非结构化文本分析等需求,而现有语义算子系统虽引入LLM能力,却要求用户手动编排查询管线。SEMA-SQL提出混合关系代数(HRA),将关系算子与LLM用户自定义函数(UDF)统一为声明式抽象,系统自动完成三件事:通过上下文学习生成含自然语言规格说明的HRA查询、基于代价的变换与UDF重写进行优化、以及通过智能批处理将语义连接中的LLM调用量平均减少93%。实验表明该方法显著扩展了查询能力。

速读

提出HRA混合关系代数,用LLM语义算子将UDF统一为声明式算子,自动生成优化执行三阶段使语义连接调用减少93%并实现基于代价的UDF重写优化

相关源 (1)