AskTable

AskTable 集成 Databend:结构化数据的 AI 查询新体验

AskTable 团队
AskTable 团队 2025年5月27日

AskTable 已兼容支持 10+ 款数据库,9 款数据仓库,几乎覆盖了所有的主流数据产品。不论你使用的是哪一类数据库,均可借助 AskTable 快速体验基于 AI 的智能问数功能。

AskTable集成Databend

近日,企业级智能数据分析工具 AskTable 在其产品中新增支持云原生数据湖仓Databend。继 MySQL、PostgreSQL、ClickHouse、TiDB 等之后,Databend 成为 AskTable 支持的又一款现代分析型数据库。此次集成将自然语言分析与高性能数仓能力结合,为用户带来更便捷、更智能的数据分析体验。

从写 SQL 到问问题,企业正在改变使用数据的方式

随着数据持续积累到数据库、数据湖或业务系统中,企业内部"想查点数据"却常常意味着找人写 SQL、排期做报表,数据工程师通过 Excel 来维护一个数据需求的列表。无论是运营分析、客户画像还是管理决策,这样的流程显然已经无法满足当下对效率和敏捷的要求。

AskTable 的出现,正是为了解决这个问题。它以自然语言为交互入口,用户只需像与 AI 对话一样提出问题,系统就能理解业务意图、自动生成 SQL 并返回分析结果。支持文本、表格、图表、Excel 下载等多种展现方式,真正让数据查询回归"说一句话就能看到答案"的理想状态。

作为中国首家企业级表格智能体(Table Agent as a Service)平台,AskTable 基于 DeepSeek、通义千问、GPT、Claude 等领先大模型,广泛支持 Excel、数据库、数据仓库和知识库的智能查询,并具备身份识别、权限控制、任务自动化、私有化部署等多种功能,已在金融、制造、教育等行业落地应用。

目前 AskTable 支持的功能包括:

AskTable核心架构

从 AskTable 的核心架构来看, AskTable 对语义到 SQL 的生成高度依赖大模型。生成 SQL 后,目标数据库执行并返回结果,其中一部分数据直接返回,另一部分则通过 AI 进行自动语义处理。

Databend + AskTable 将为用户带来什么?

Databend 是一个使用 Rust 研发、开源、基于对象存储设计的新一代云原生数据湖仓产品,提供极速的弹性扩展能力和按需、按量使用的产品体验,致力于打造开源版的 Snowflake。目前,Databend 已在游戏、社交、金融、广告、电商等多个行业领域中成功替代 Snowflake、Redshift、BigQuery、GreenPlum、ClickHouse、CDH 等产品,为客户提供了降本增效的数据分析平台。

集成 Databend 后,可以帮助 AskTable 用户获得以下收益:

Databend 将成为 AskTable 平台上一个兼具性能、易用性与性价比的数据数据平台选项,为企业打造"自然语言分析 + 高性能数据平台"的组合提供了数据+AI 方案,以较低的成本可以给决策层或业务使用方提供一个智能数据驾驶室。

AskTable + Databend 实战:5 个自然语言问题搞定 GitHub 日志分析

以 Databend Cloud (https://app.databend.cn)为例,我们选取了 2025 年 5 月 15 日的 GitHub 事件日志作为样本,测试 AskTable 生成 SQL 并访问 Databend 的效果。

建表 建表

Step 1:连接数据源

通过 AskTable 创建会话,连接 Databend Cloud,并选择要分析的表(支持最多 100 张表)。系统将自动读取表结构、字段统计信息,并准备好语义模型推理。

连接数据源界面

等待 AskTable 获取表的元数据和一些统计信息然后和大模型交流。这里如果表和字段太多,与大模型交互需要一些时间。 等待完成后,就可以开始第二步。

Step 2:发起查询对话,验证智能数据分析

系统自动将自然语言转为 SQL,发起查询,并将结果返回。我们在 AskTable 中依次提出以下 5 个自然语言问题:

Q1: 基于数据分析当前最热门的前十个项目是?

Q1查询结果

以下是对应的 SQL:

Q1 SQL

该表其实只有当天 2025年5月11日一天的数据,SQL 产生的逻辑是从数据的最小值到当前时间。

AskTable 给出的可观测性数据:

可观测性数据

下面是 Databend Cloud 提供的 SQL 执行相关的日志:

SQL执行日志

在 Databend Cloud 上的 SQL 日志中,执行时间为 640ms。但整体感觉时间应该有 9 秒左右,从两边时间上看还有不少调优空间。

下面是上述 SQL 在 Databend Cloud 上的执行计划:对应环节及用时。

执行计划

从可观测性看 AskTable 和 Databend 都具备较好的可观测性来分析性能问题。AskTable 私有化也提供可观测平台交付。

Q2: 最火的开发语言有哪些?显示 top 10 ,"null" 的不统计。

Q2查询结果

Q3: 显示被点 star 最多的项目前十名?

Q3查询结果

Q4:5 月 15 日 databend 相关 repo 都有谁在活跃?

Q4查询结果

这里显示竟然没有结果,通过检查发现是对应的 SQL 把 repo_name 写成了 like '%Databend%' ,应该主要是 D 大写了。需要给它一个提示:

Q4提示

Q4修正后结果

给出提示后可以完美展示出结果。 这种人机交互优化也可以通过术语表或语义别名机制进一步提升准确率。

Q5: 5月15日 GitHub 上共有多少事件?

Q5查询结果

这个问题和 Q4 形成了反差,提问都有点不通顺,反而 AskTable 也可以完美理解及完成工作。

使用体验总结

在实际体验中,我们观察到:

AskTable 的最佳使用方式是在平台内部嵌入会话窗口使用,让平台快速具备 AI 分析数据的能力。


本文转载自公众号:Databend