18:["$","$L27",null,{"isLivePreviewRoute":false,"children":["$","$L5",null,{"appearance":"$undefined","codeblockTheme":"system","children":[false,["$","$L28",null,{"id":"_mintlify-banner-script","strategy":"beforeInteractive","dangerouslySetInnerHTML":{"__html":"(function j(a,b,c,d,e){try{let f,g,h=[];try{h=window.location.pathname.split(\"/\").filter(a=>\"\"!==a&&\"global\"!==a).slice(0,2)}catch{h=[]}let i=h.find(a=>c.includes(a)),j=[];for(let c of(i?j.push(i):j.push(b),j.push(\"global\"),j)){if(!c)continue;let b=a[c];if(b?.content){f=b.content,g=c;break}}if(!f)return void document.documentElement.setAttribute(d,\"hidden\");let k=!0,l=0;for(;l Snowflake, or between two SQL Server instances) to validate migrations, meet regulatory and compliance requirements, or ensure data is flowing successfully from source to target.","href":"/data-diff/cross-database-diffing/creating-a-new-data-diff"},{"title":"Results","mode":"immersive","description":"Once your data diff is complete, Datafold provides a concise, high-level summary of the detected changes in the Overview tab.","href":"/data-diff/cross-database-diffing/results"},{"title":"Best Practices","mode":"immersive","description":"When dealing with large datasets, it's crucial to approach diffing with specific optimization strategies in mind. We share best practices that will help you get the most accurate and efficient results from your data diffs.","href":"/data-diff/cross-database-diffing/best-practices"}]}]},{"group":"CI/CD TESTING","pages":[{"title":"How Datafold in CI Works","description":"Learn how Datafold integrates with your Continuous Integration (CI) process to create Data Diffs for all SQL code changes, catching issues before they make it into production.","mode":"immersive","href":"/deployment-testing/how-it-works"},{"group":"Getting Started","pages":[{"title":"Getting Started with CI/CD Testing","sidebarTitle":"Getting Started","mode":"wide","description":"Learn how to set up CI/CD testing with Datafold by integrating your data connections, code repositories, and CI pipeline for automated testing.","href":"/deployment-testing/getting-started"},{"group":"Universal","pages":[{"title":"No-Code","description":"Set up Datafold's No-Code CI integration to create and manage Data Diffs without writing code.","href":"/deployment-testing/getting-started/universal/no-code"},{"title":"API","description":"Learn how to set up and configure Datafold's API for CI/CD testing.","href":"/deployment-testing/getting-started/universal/api"}]}]},{"group":"Configuration","pages":[{"title":"Configuration","description":"Explore configuration options for CI/CD testing in Datafold.","href":"/deployment-testing/configuration"},{"title":"Primary Key Inference","description":"Datafold requires a primary key to perform data diffs. Using dbt metadata, Datafold identifies the column to use as the primary key for accurate data diffs.","href":"/deployment-testing/configuration/primary-key"},{"title":"Column Remapping","description":"Specify column renaming in your git commit message so Datafold can map renamed columns to their original counterparts in production for accurate comparison.","href":"/deployment-testing/configuration/column-remapping"},{"group":"Data Diff CI Triggers","pages":[{"title":"Running Data Diff for Specific PRs/MRs","description":"By default, Datafold CI runs on every new pull/merge request and commits to existing ones.","sidebarTitle":"Run CI On-Demand","href":"/deployment-testing/configuration/datafold-ci/on-demand"},{"title":"Running Data Diff on Specific Branches","description":"By default, Datafold CI runs on every new pull/merge request and commits to existing ones.","sidebarTitle":"Run CI for Specific Files","href":"/deployment-testing/configuration/datafold-ci/specifc"}]},{"group":"Model-specific CI Configuration","pages":[{"title":"SQL Filters","description":"Use dbt YAML configuration to set model-specific filters for Datafold CI.","href":"/deployment-testing/configuration/model-specific-ci/sql-filters"},{"title":"Time Travel","description":"Use `prod_time_travel` and `pr_time_travel` to diff tables from specific points in time.","href":"/deployment-testing/configuration/model-specific-ci/time-travel"},{"title":"Including/Excluding Columns","description":"Specify columns to include or exclude from the data diff using `include_columns` and `exclude_columns`.","href":"/deployment-testing/configuration/model-specific-ci/including-excluding-columns"},{"title":"Excluding Models","description":"Use `never_diff` to exclude a model or subdirectory of models from data diffs.","href":"/deployment-testing/configuration/model-specific-ci/excluding-models"},{"title":"Diff Timeline","description":"Specify a `time_column` to visualize match rates between tables for each column over time.","href":"/deployment-testing/configuration/model-specific-ci/diff-timeline"}]}]},{"group":"Best Practices","pages":[{"title":"Slim Diff","description":"Choose which downstream tables to diff to optimize time, cost, and performance.","href":"/deployment-testing/best-practices/slim-diff"},{"title":"Handling Data Drift","description":"Ensuring Datafold in CI executes apples-to-apples comparison between staging and production environments.","href":"/deployment-testing/best-practices/handling-data-drift"}]}]},{"group":"DATA MONITORS","pages":[{"group":"Monitor Types","pages":[{"title":"Monitor Types","description":"Monitoring your data for unexpected changes is one of the cornerstones of data observability.","href":"/data-monitoring/monitor-types"},{"title":"Data Diff Monitors","description":"Data Diff monitors compare datasets across or within databases, identifying row and column discrepancies with customizable scheduling and notifications.","href":"/data-monitoring/monitors/data-diff-monitors"},{"title":"Metric Monitors","description":"Metric monitors detect anomalies in your data using ML-based algorithms or manual thresholds, supporting standard and custom metrics for tables or columns.","href":"/data-monitoring/monitors/metric-monitors"},{"title":"Data Test Monitors","description":"Data Tests validate your data against off-the-shelf checks or custom business rules.","href":"/data-monitoring/monitors/data-test-monitors"},{"title":"Schema Change Monitors","description":"Schema Change monitors notify you when a table’s schema changes, such as when columns are added, removed, or data types are modified.","href":"/data-monitoring/monitors/schema-change-monitors"}]},{"title":"Monitors as Code","description":"Manage Datafold monitors via version-controlled YAML for greater scalability, governance, and flexibility in code-based workflows.","href":"/data-monitoring/monitors-as-code"}]},{"group":"DATA EXPLORER","pages":[{"title":"How It Works","description":"The UI visually maps workflows and tracks column-level or tabular lineages, helping users understand the impact of upstream changes.","href":"/data-explorer/how-it-works"},{"title":"Lineage","description":"Datafold offers a column-level and tabular lineage view.","href":"/data-explorer/lineage"},{"title":"Profile","description":"View a data profile that summarizes key table and column-level statistics, and any upstream dependencies.","href":"/data-explorer/profile"},{"group":"Best Practices","pages":[{"title":"dbt Metadata Sync","description":"Datafold can automatically ingest dbt metadata from your production environment and display it in Data Explorer.","href":"/data-explorer/best-practices/dbt-metadata-sync"}]}]},{"group":"SQL PROXY (BETA)","pages":[{"title":"SQL Proxy","sidebarTitle":"Overview","description":"Intelligent SQL routing for data platform workloads","noindex":true,"href":"/sql-proxy/overview"},{"title":"Routing Modes","description":"Control how SQL Proxy routes queries","noindex":true,"href":"/sql-proxy/routing-modes"},{"title":"Authentication","description":"Authentication setup for SQL Proxy","noindex":true,"href":"/sql-proxy/authentication"},{"title":"dbt Integration","description":"Configure SQL Proxy with dbt","noindex":true,"href":"/sql-proxy/dbt-integration"}]},{"group":"INTEGRATIONS","pages":[{"group":"Databases","pages":[{"title":"Set Up Your Data Connection","sidebarTitle":"Data Connections","description":"Set up your Data Connection with Datafold.","href":"/integrations/databases"},{"title":"Snowflake","description":null,"href":"/integrations/databases/snowflake"},{"title":"BigQuery","description":null,"href":"/integrations/databases/bigquery"},{"title":"Athena","description":null,"href":"/integrations/databases/athena"},{"title":"Redshift","description":null,"href":"/integrations/databases/redshift"},{"title":"Databricks","description":null,"href":"/integrations/databases/databricks"},{"title":"PostgreSQL","description":null,"href":"/integrations/databases/postgresql"},{"title":"Microsoft SQL Server","description":null,"href":"/integrations/databases/sql-server"},{"title":"Oracle","description":null,"href":"/integrations/databases/oracle"},{"title":"MySQL","description":null,"href":"/integrations/databases/mysql"},{"title":"Dremio","description":null,"href":"/integrations/databases/dremio"},{"title":"SAP HANA","description":null,"href":"/integrations/databases/sap-hana"},{"title":"Starburst","description":null,"href":"/integrations/databases/starburst"},{"title":"Teradata","description":null,"href":"/integrations/databases/teradata"},{"title":"Netezza","description":null,"href":"/integrations/databases/netezza"}]},{"title":"OAuth Support","description":"Set up OAuth App Connections in your supported data warehouses to securely execute data diffs on behalf of your users.","sidebarTitle":"OAuth","href":"/integrations/oauth"},{"group":"Orchestrators","pages":[{"title":"Integrate with Orchestrators","sidebarTitle":"Orchestrators","description":"Integrate Datafold with dbt Core, dbt Cloud, Airflow, or custom orchestrators to streamline your data workflows with automated monitoring, testing, and seamless CI integration.","href":"/integrations/orchestrators"},{"title":"dbt Core","description":"Set up Datafold’s integration with dbt Core to automate Data Diffs in your CI pipeline.","href":"/integrations/orchestrators/dbt-core"},{"title":"dbt Cloud","description":"Integrate Datafold with dbt Cloud to automate Data Diffs in your CI pipeline, leveraging dbt jobs to detect changes and ensure data quality before merging.","href":"/integrations/orchestrators/dbt-cloud"},{"title":"Custom Integrations","description":"Integrate Datafold with your custom orchestration using the Datafold SDK and REST API.","href":"/integrations/orchestrators/custom-integrations"}]},{"group":"BI & Data Apps","pages":[{"title":"Looker","description":null,"href":"/integrations/bi-data-apps/looker"},{"title":"Tableau","description":"Visualize downstream Tableau dependencies and understand how warehouse changes impact your BI layer.","href":"/integrations/bi-data-apps/tableau"},{"title":"Power BI","description":"Include Power BI entities in Data Explorer and column-level lineage.","href":"/integrations/bi-data-apps/power-bi"},{"title":"Mode","description":null,"href":"/integrations/bi-data-apps/mode"},{"title":"Hightouch","description":"Navigate to Settings > Integrations > Data Apps and add a Hightouch Integration.","href":"/integrations/bi-data-apps/hightouch"},{"title":"Tracking Jobs","description":"Track the completion and success of your data app integration syncs.","href":"/integrations/bi-data-apps/tracking-jobs"}]},{"group":"Code Repositories","pages":[{"title":"Integrate with Code Repositories","sidebarTitle":"Code Repositories","description":"Connect your code repositories with Datafold.","href":"/integrations/code-repositories"},{"title":"GitHub","description":null,"href":"/integrations/code-repositories/github"},{"title":"GitLab","description":null,"href":"/integrations/code-repositories/gitlab"},{"title":"Bitbucket","description":null,"href":"/integrations/code-repositories/bitbucket"},{"title":"Azure DevOps","description":null,"href":"/integrations/code-repositories/azure-devops"}]}]},{"group":"DEPLOYMENT","pages":[{"title":"Deployment Options","description":"Datafold is a web-based application with multiple deployment options, including multi-tenant SaaS and dedicated cloud (either customer- or Datafold-hosted).","href":"/datafold-deployment/datafold-deployment-options"},{"title":"Datafold VPC Deployment on AWS","sidebarTitle":"AWS","description":"Learn how to deploy Datafold in a Virtual Private Cloud (VPC) on AWS.","href":"/datafold-deployment/dedicated-cloud/aws"},{"title":"Datafold VPC Deployment on GCP","sidebarTitle":"GCP","description":"Learn how to deploy Datafold in a Virtual Private Cloud (VPC) on GCP.","href":"/datafold-deployment/dedicated-cloud/gcp"},{"title":"Datafold VPC Deployment on Azure","sidebarTitle":"Azure","description":"Learn how to deploy Datafold in a Virtual Private Cloud (VPC) on Azure.","href":"/datafold-deployment/dedicated-cloud/azure"}]},{"group":"SECURITY","pages":[{"title":"Compliance & Trust Center","url":"https://security.datafold.com/","description":null,"href":"/security/compilance-trust-center"},{"title":"Securing Connections","description":"Datafold supports multiple options to secure connections between your resources (e.g., databases and BI tools) and Datafold.","href":"/security/securing-connections"},{"group":"Single Sign-On (SSO)","pages":[{"title":"Single Sign-On","description":"Set up Single Sign-On with one of the following options.","href":"/security/single-sign-on"},{"title":"Rbac with sso","href":"/security/single-sign-on/rbac-with-sso"},{"title":"Okta (OIDC)","description":null,"href":"/security/single-sign-on/okta"},{"title":"Google OAuth","description":null,"href":"/security/single-sign-on/google-oauth"},{"group":"SAML","pages":[{"title":"SAML","description":"SAML (Security Assertion Markup Language) is a protocol that enables secure user authentication by integrating Identity Providers (IdPs) with Service Providers (SPs).","href":"/security/single-sign-on/saml"},{"Title":"Group Provisioning","description":"Automatically sync group membership with your SAML Identity Provider (IdP).","title":null,"href":"/security/single-sign-on/saml/group-provisioning"},{"group":"Examples","pages":[{"title":"Okta","description":null,"href":"/security/single-sign-on/saml/examples/okta"},{"title":"Microsoft Entra ID","description":null,"href":"/security/single-sign-on/saml/examples/microsoft-entra-id-configuration"},{"title":"Google","description":null,"href":"/security/single-sign-on/saml/examples/google"}]}]}]}]},{"group":"SUPPORT","pages":[{"title":"Support","description":"Datafold offers multiple support channels to assist users with troubleshooting and inquiries.","href":"/support/support"},{"title":"FAQ","url":"/faq/overview","description":null,"href":"/support/faq-redirect"}]}]},{"tab":"API Reference","groups":[{"group":"Cloud","pages":[{"group":"Datafold API","pages":[{"title":"Datafold API","description":null,"href":"/api-reference/datafold-api"},{"title":"Introduction","description":null,"href":"/api-reference/introduction"},{"title":"MCP Server","description":"Connect AI assistants to Datafold using the Model Context Protocol","href":"/api-reference/mcp-server-setup"},{"group":"CI","pages":[{"openapi":"get /api/v1/ci/{ci_config_id}/runs","title":"List CI runs","description":null,"href":"/api-reference/ci/list-ci-runs"},{"openapi":"post /api/v1/ci/{ci_config_id}/trigger","title":"Trigger a PR/MR run","description":null,"href":"/api-reference/ci/trigger-a-prmr-run"},{"openapi":"post /api/v1/ci/{ci_config_id}/{pr_num}","title":"Upload PR/MR changes","description":null,"href":"/api-reference/ci/upload-prmr-changes"}]},{"group":"Data Sources","pages":[{"openapi":"get /api/v1/data_sources","title":"List data sources","description":"Retrieves all data sources accessible to the authenticated user.\n\nReturns active data sources (not deleted, hidden, or draft) that the user has permission to access.\nFor non-admin users, only data sources belonging to their assigned groups are returned.","href":"/api-reference/data-sources/list-data-sources"},{"openapi":"post /api/v1/data_sources","title":"Create a data source","description":null,"href":"/api-reference/data-sources/create-a-data-source"},{"openapi":"get /api/v1/data_sources/test/{job_id}","title":"Get data source testing results","description":null,"href":"/api-reference/data-sources/get-data-source-testing-results"},{"openapi":"get /api/v1/data_sources/types","title":"List data source types","description":null,"href":"/api-reference/data-sources/list-data-source-types"},{"openapi":"get /api/v1/data_sources/{data_source_id}","title":"Get a data source","description":null,"href":"/api-reference/data-sources/get-a-data-source"},{"openapi":"get /api/v1/data_sources/{data_source_id}/summary","title":"Get a data source summary","description":null,"href":"/api-reference/data-sources/get-a-data-source-summary"},{"openapi":"post /api/v1/data_sources/{data_source_id}/test","title":"Test a data source connection","description":null,"href":"/api-reference/data-sources/test-a-data-source-connection"}]},{"group":"Data Diffs","pages":[{"openapi":"get /api/v1/datadiffs","title":"List data diffs","description":"All fields support multiple items, using just comma delimiter\nDate fields also support ranges using the following syntax:\n\n- ``DATETIME`` = after DATETIME\n- ``DATETIME`` = between DATETIME and DATETIME + 1 MINUTE\n- ``DATE`` = start of that DATE until DATE + 1 DAY\n- ``DATETIME1<DATETIME`` = after DATETIME\n- ``DATETIME`` = between DATETIME and DATETIME + 1 MINUTE\n- ``DATE`` = start of that DATE until DATE + 1 DAY\n- ``DATETIME1<

INTRODUCTION

DATA DIFFS

CI/CD TESTING

DATA MONITORS

DATA EXPLORER

SQL PROXY (BETA)

INTEGRATIONS

DEPLOYMENT

SECURITY

SUPPORT

Page Not Found