PolyBase 提供统一T-SQL接口实现跨源查询,支持Hadoop、Azure存储等外部数据源,通过创建外部表将远程数据虚拟化,C#可借助ADO.NET像查本地表一样查询外部数据,无需额外配置。

PolyBase 是 SQL Server 和 Azure Synapse Analytics 中的一项技术,它允许你直接通过 T-SQL 查询跨多种数据源的外部数据,比如 Hadoop、Azure Blob Storage、Azure Data Lake Storage 以及 Cosmos DB 等。它把外部数据源“虚拟化”成类似数据库表的形式,这样你就可以像查询本地表一样使用 SELECT 语句访问远程数据,而无需将数据导入到本地数据库。
统一查询接口:使用标准 T-SQL 查询异构数据源。
数据虚拟化:不移动数据,只在需要时读取外部数据。
可扩展性:适合大数据场景,支持分布式查询处理。
支持的数据源包括:
以 SQL Server 查询 Azure Blob Storage 中的 CSV 文件为例:
示例 T-SQL:
CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'your_password'; <p>CREATE DATABASE SCOPED CREDENTIAL AzureStorageCredential<br /> WITH IDENTITY = 'storageaccountname', Secret = 'storageaccountkey';</p><p>CREATE EXTERNAL DATA SOURCE AzureBlobStorage WITH ( TYPE = BLOB_STORAGE, LOCATION = '<a href="https://www.php.cn/link/52238db3e51471b5f923a3481975f65d">https://www.php.cn/link/52238db3e51471b5f923a3481975f65d</a>', CREDENTIAL = AzureStorageCredential );</p><p>CREATE EXTERNAL FILE FORMAT CsvFormat WITH ( FORMAT_TYPE = DELIMITEDTEXT, FORMAT_OPTIONS (FIELD_TERMINATOR = ',', STRING_DELIMITER = '"') );</p><p>CREATE EXTERNAL TABLE [dbo].[ExternalSalesData] ( [Id] INT, [ProductName] NVARCHAR(100), [Price] DECIMAL(10,2) ) WITH ( LOCATION = '/salesdata.csv', DATA_SOURCE = AzureBlobStorage, FILE_FORMAT = CsvFormat );</p>
之后你可以直接查询:
SELECT * FROM ExternalSalesData WHERE Price > 100;
PolyBase 本身运行在 SQL Server 内部,C# 不直接调用 PolyBase API,而是通过普通的 ADO.NET 调用已配置好的外部表或视图。
也就是说,你在 C# 中的操作和查询普通 SQL 表完全一样。
使用 SqlConnection 和 SqlCommand 查询已暴露的外部表:
using System;
using System.Data.SqlClient;
<p>class Program
{
static void Main()
{
string connectionString = "Server=your_server;Database=your_db;User Id=your_user;Password=your_password;";</p><pre class='brush:php;toolbar:false;'> using (var connection = new SqlConnection(connectionString))
{
connection.Open();
string query = "SELECT Id, ProductName, Price FROM ExternalSalesData WHERE Price > 100";
using (var command = new SqlCommand(query, connection))
{
using (var reader = command.ExecuteReader())
{
while (reader.Read())
{
Console.WriteLine($"Product: {reader["ProductName"]}, Price: {reader["Price"]}");
}
}
}
}
}}
PolyBase 在数据库层完成数据集成:所有外部数据源的连接、格式解析、安全认证都在 SQL Server 内部完成。
C# 只需关注业务逻辑:你写的代码就像在查本地表,底层由 PolyBase 透明地拉取外部数据。
性能提示:尽量让过滤条件下推到外部源(如 WHERE 子句),避免全量拉取。
基本上就这些。只要 SQL Server 配好了 PolyBase 并创建了外部表,C# 就能像查普通表一样使用 ADO.NET 查询,无需额外库或特殊语法。
以上就是什么是数据库的PolyBase?在C#中如何查询外部数据?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号