Parquet-S3-Datasource for Grafana

by tobiasworkstech

Query and visualize Apache Parquet files stored in Amazon S3 or S3-compatible storage directly in Grafana with full SQL support.

Overview

The Parquet-S3-Datasource plugin enables you to connect Grafana to your data lake stored in Parquet format on Amazon S3, MinIO, Wasabi, DigitalOcean Spaces, or any S3-compatible storage. Leverage the efficiency of columnar Parquet files for fast analytics and visualization without needing to load data into a traditional database.

Screenshots

Query Editor

Datasource Configuration

Iris Flower Dataset Dashboard

Titanic Survival Dataset Dashboard

Server Metrics Time-Series Dashboard

Template Variables

Features

Core Features

Direct Parquet File Access: Query Parquet files directly from S3 without intermediate databases
S3-Compatible Storage Support: Works with Amazon S3, MinIO, Wasabi, DigitalOcean Spaces, and more
Apache Arrow Integration: Efficient data processing using Apache Arrow for fast query execution
Configurable Endpoints: Support for custom S3 endpoints for private cloud deployments
Path-Style Routing: Automatic configuration for S3-compatible storage that requires path-style URLs

SQL Query Support (v1.1.0+)

Full SQL Syntax: SELECT, WHERE, GROUP BY, ORDER BY, LIMIT powered by DuckDB
Aggregation Functions: COUNT, SUM, AVG, MIN, MAX
Complex Filtering: Multiple conditions with AND/OR operators
Column Aliasing: Rename columns in query results

Visual Query Builder

PostgreSQL-Style Interface: Familiar query building experience
Column Selection: Pick columns with optional aggregations
Filter Toggle: Build WHERE conditions visually
Group Toggle: Add GROUP BY clauses easily
Order Toggle: Sort results with ASC/DESC
SQL Preview: See the generated SQL in real-time

Template Variables

List Files: Populate variables with parquet files from your bucket
List Prefixes: Get folder/prefix names for hierarchical navigation
SQL-Based Variables: Use SQL queries to generate variable values
Regex Filtering: Filter file lists with regex patterns

Grafana Explore

File Browser: Select parquet files with search and filtering
Builder Mode: Visual query construction
Code Mode: Raw SQL editing with syntax highlighting

Requirements

Grafana >= 11.0.0
S3 or S3-compatible storage with read access
Parquet files in your S3 bucket

Getting Started

Installation

Install the plugin using the Grafana CLI:

grafana-cli plugins install tobiasworkstech-parquets3-datasource

Or via Docker:

docker run -d -p 3000:3000 \
  -e "GF_INSTALL_PLUGINS=tobiasworkstech-parquets3-datasource" \
  grafana/grafana

Configuration

Navigate to Configuration > Data Sources in your Grafana instance
Click Add data source
Search for and select Parquet-S3-Datasource
Configure the following settings:
- Region: Your S3 region (e.g., us-east-1)
- Bucket: The name of your S3 bucket containing Parquet files
- Endpoint (optional): Custom S3 endpoint URL (e.g., http://minio:9000 for MinIO)
- Access Key: Your S3 access key ID
- Secret Key: Your S3 secret access key
Click Save & test to verify the connection

Basic Usage

Create a new dashboard or open an existing one
Add a new panel
Select your Parquet-S3-Datasource as the data source
Select a parquet file from the Table dropdown
Use the visual builder or write SQL directly
Click Run query to visualize your data

SQL Query Examples

-- Select all data
SELECT * FROM parquet

-- Filter and sort
SELECT name, value FROM parquet
WHERE value > 100
ORDER BY value DESC

-- Aggregations
SELECT category, COUNT(*) as count, AVG(price) as avg_price
FROM parquet
GROUP BY category

-- Top N results
SELECT * FROM parquet
ORDER BY timestamp DESC
LIMIT 10

Template Variable Examples

List all parquet files:

Query Type: List Files
File Pattern: *.parquet

List files in a folder:

Query Type: List Files
Prefix: data/2024/
File Pattern: *.parquet

SQL-based variable (unique values):

Query Type: SQL Query
Path: data.parquet
SQL: SELECT DISTINCT category FROM parquet

Configuration Examples

Amazon S3

Region: us-east-1
Bucket: my-data-lake
Endpoint: (leave empty)
Access Key: AKIA...
Secret Key: ***

MinIO (Local Development)

Region: us-east-1
Bucket: parquet-data
Endpoint: http://minio:9000
Access Key: minioadmin
Secret Key: minioadmin

Wasabi

Region: us-east-1
Bucket: my-bucket
Endpoint: https://s3.wasabisys.com
Access Key: YOUR_WASABI_KEY
Secret Key: ***

Supported Parquet Features

All primitive data types (INT32, INT64, FLOAT, DOUBLE, BOOLEAN, BINARY, STRING)
Nested structures (STRUCT, LIST, MAP)
Compression codecs (SNAPPY, GZIP, LZ4, ZSTD)
Column pruning for efficient data retrieval

Sample Dashboards

The plugin includes sample dashboards demonstrating various use cases:

Iris Dataset: Classic ML dataset with flower measurements
Titanic Dataset: Survival analysis with aggregations
Time Series Metrics: Server metrics visualization

Troubleshooting

Connection Failed

Verify your S3 credentials are correct
Ensure the bucket exists and is accessible
Check network connectivity to your S3 endpoint
For custom endpoints, verify the endpoint URL format

No Data Returned

Confirm the Parquet file path is correct
Ensure the file exists in the specified bucket
Check that your access key has read permissions

SQL Query Errors

Verify column names match exactly (case-sensitive)
Use double quotes for column names with special characters: "column.name"
Check SQL syntax - the plugin uses DuckDB SQL dialect

Invalid Plugin Signature (Development)

For development environments, add this to your Grafana configuration:

[plugins]
allow_loading_unsigned_plugins = tobiasworkstech-parquets3-datasource

Development

Prerequisites

Go >= 1.21
Node.js >= 20
Docker and Docker Compose

Building the Plugin

# Install dependencies
cd tobiasworkstech-parquets3-datasource
npm install

# Build frontend
npm run build

# Build backend for all platforms
GOOS=linux GOARCH=amd64 go build -o dist/gpx_parquet_s3_datasource_linux_amd64 ./pkg
GOOS=linux GOARCH=arm64 go build -o dist/gpx_parquet_s3_datasource_linux_arm64 ./pkg
GOOS=darwin GOARCH=arm64 go build -o dist/gpx_parquet_s3_datasource_darwin_arm64 ./pkg
GOOS=windows GOARCH=amd64 go build -o dist/gpx_parquet_s3_datasource_windows_amd64.exe ./pkg

Running Locally

docker compose up -d

Access Grafana at http://localhost:3001.

License

Apache 2.0 License - see LICENSE for details.

Contributing

Contributions are welcome! Please open an issue or submit a pull request on GitHub.

Support

For issues, questions, or feature requests, please visit the GitHub repository.

Name		Name	Last commit message	Last commit date
Latest commit History 49 Commits
.config		.config
.github		.github
.vscode		.vscode
docker		docker
pkg		pkg
provisioning		provisioning
src		src
tests		tests
.cprc.json		.cprc.json
.gitignore		.gitignore
.nvmrc		.nvmrc
.prettierrc.js		.prettierrc.js
CHANGELOG.md		CHANGELOG.md
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
Magefile.go		Magefile.go
README.md		README.md
eslint.config.mjs		eslint.config.mjs
go.mod		go.mod
go.sum		go.sum
jest-setup.js		jest-setup.js
jest.config.js		jest.config.js
package-lock.json		package-lock.json
package.json		package.json
playwright.config.ts		playwright.config.ts
tsconfig.json		tsconfig.json

License

tobiasworkstech/tobiasworkstech-parquets3-datasource

Folders and files

Latest commit

History

Repository files navigation

Parquet-S3-Datasource for Grafana

Overview

Screenshots

Query Editor

Datasource Configuration

Iris Flower Dataset Dashboard

Titanic Survival Dataset Dashboard

Server Metrics Time-Series Dashboard

Template Variables

Features

Core Features

SQL Query Support (v1.1.0+)

Visual Query Builder

Template Variables

Grafana Explore

Requirements

Getting Started

Installation

Configuration

Basic Usage

SQL Query Examples

Template Variable Examples

Configuration Examples

Amazon S3

MinIO (Local Development)

Wasabi

Supported Parquet Features

Sample Dashboards

Troubleshooting

Connection Failed

No Data Returned

SQL Query Errors

Invalid Plugin Signature (Development)

Development

Prerequisites

Building the Plugin

Running Locally

License

Contributing

Support

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 18

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages