Azure Synapse Analyticsとは? 機能の特長や料金体系を解説

Azure Synapse Analyticsとは? 機能の特長や料金体系を解説

近年スマートフォンやIoTデバイスから取得したデータを、マーケティングや経営判断の参考情報として用いることは珍しくありません。データの分析を行う場合の様々なサービスが提供されていますが、ここではMicrosoftから提供されているAzure Synapse Analyticsについて特徴を含め説明します。

Azure Synapse Analyticsとは? 機能の特長や料金体系を解説

Microsoft Azure製品カタログ

データ分析サービスAzure Synapse Analyticsの機能概要

Azure Synapse Analyticsは、これまでAzure SQL Data Warehouseと呼ばれていたサービスを統合し、データ蓄積とデータウェアハウス(DWH)、そしてビックデータ解析の機能をひとつにまとめて提供されるプラットフォームサービスです。従来データ分析を行う際、様々なBIツールやDWHサービスを複数用いたり、企業内に乱立している複数のシステムからデータを連携したりする仕組みを構築する必要などがありました。これに対してAzure Synapse Analyticsではクラウド環境でデータ蓄積と分析が一元的に提供されるため、データ連携が容易になり、またクラウドであるため必要なときに時間をかけること無く大量のデータ分析を行うことができます。

国内外のIoT先進事例100選
Azure Cosmos DB 自習書 - Azure Cosmos DB Gremlin API 編 -

Azure Synapse Analyticsの特長

MicrosoftのAzureで提供されるデータ分析サービスであることから、Microsoftから提供されている他のサービスと連携が可能になるなど様々な特徴があります。ここからはその特徴について紹介します。

無限のスケール

通常DWHに蓄積されていくデータは運用されるにつれ増加していきます。また他のシステムからのデータ連携やオープンデータとして提供されているビックデータとの連携など、データ分析に必要とされるデータの容量は次第に大きくなっていきます。Azure Synapse Analyticsではペタバイト規模でのデータ分析が可能であり、またDWHとビッグデータのシームレスな連携が可能です。パイプラインと呼ばれるサービス間でのデータ移動やアクティビティ(データのコピーやSQLの実行など)をコードを記述すること無く行うことができます。

最高レベルのセキュリティおよびプライバシー機能

Azure Synapse Analyticsでは高度なセキュリティとプライバシー機能を備えており、自動化された驚異の検出や常時有効化されているデータ暗号化、データシートの行や列単位でのセキュリティ、動的データマスクと呼ばれる個人を特定できるメールアドレスなどを自動的にマスキングする機能など、多くの機能が提供されています。

またこの他にもAzure Private Linkを用いることでAzure Virtual Networkに接続することができ、Azure とユーザーの通信はインターネットから分離され外部からのセキュリティが確保されます。またこの他にもAzureのサービスとして提供されていることから、ISOを始め世界各国の政府機関や業界団体で定められている様々なデータ取扱規定に準拠しており、各国の規定に違反すること無くデータを取り扱うことができます。

幅広いプログラム言語との互換性

ビックデータの分析を行う場合、データを複数のサーバーを用いて分散処理することが多く、Azure Synapse AnalyticsでもApache Sparkのフレームワークを用いた分散処理環境が提供されています。またこの環境にはScala、Python、.Net、Javaといった主要な言語のライブラリが用意されており、エンジニアが使い慣れた言語を利用してデータ分析を行うことができます。

オンプレミス型との連携で分析速度が向上

オンプレミス環境に存在しているデータを分析する場合、サーバにMicrosoftから提供されているオンプレミスデータゲートウェイをインストールすることでAzure Synapse Analyticsからオンプレミス環境のデータを利用することが可能です。またこの方法で連携することで、Azureのリソースを利用してデータ分析を行うことが可能となるため、オンプレミス環境のリソースのみで分析を行う場合と比較し短時間に分析を完了することができます。

リアルタイムで分析情報を取得できる

Azure Synapse Link for Azure Cosmos DBを利用すると、Azure Cosmos分析ストアを直接利用することが可能になるため、リアルタイムでのデータ分析を行うことができます。

Azure Cosmos分析ストアは大量のデータを分析するために最適化されたデータ構造を用いており、またAzure Cosmos DBへのデータの追加、更新、削除が発生した直後から自動的にほぼリアルタイムで分析ストアへの同期が行われます。このため他のシステムなどからデータを連携する際のETL(Extract/Transform/Load:異なるシステムのデータフォーマット統一や不要なデータのクレンジング処理など)処理が不要になり、同期後のトランザクションデータをAzure Synapse Analyticsを用いてすぐにデータ分析することができます。

Azure Synapse Analyticsの料金

Azure Synapse Analyticsではどのような環境でデータ分析を行うかによって料金が異なります。以下の4パターンのプランがあり、それぞれどのように利用料金が発生するかご紹介します。

データ統合

データの蓄積と分析を行うための基本的なプランになります。例えば分析対象となるデータを取り込むためにコピーアクティビティを使用してSQL Serverから Azureのストレージにデータをコピーし、次にデータフローアクティビティを使用してストレージからAzure Synapse Analyticsプールにデータを変換する、というようにデータを蓄積して分析を行う環境を利用することができます。

データ統合の環境ではデータオーケストレーションアクティビティの実行回数、データコピーアクティビティの実行回数と利用時間、そしてデータフロー実行とデバッグに対してのコンピューティング種類、仮想コア数、実行時間に基づいた課金が行われます。

データの探索とデータウェアハウス

SQLプールを利用し、数百テラバイト程度のデータを分析する場合に適しています。MicrosoftのSQL Serverで用いられているTransact-SQLを用いて対話型、バッチ型、ストリーミング型、予測型の分析を行うことができます。サーバーレス環境と専用リソース環境を選択することができ、それぞれ課金形態が異なります。

サーバーレス環境では各クエリによって処理されたデータ量に基づき課金が行われます。専用リソース環境ではDWU(Data Warehouse Unit:SQL実行時に利用されたCPU、メモリ、およびIOを組み合わせた数値)の値によって利用料金が段階的に定められており、Dedicated SQLプールリソースの予約容量を購入しておくことで費用を抑制することができます。

Apache Sparkを使用したビッグデータ分析

ビックデータを扱うためのプランとなり、数千テラバイトから数ペタバイトの大容量データを分析するのに適しています。Apache Sparkを用いた分散処理を行うことで、時間をかけること無くビッグデータを分析することができます。インスタンスと呼ばれる仮想マシンを利用した数と利用時間により課金が行われます。

専用SQL プール

これまでSQL DWと呼ばれていた専用SQLプールを利用し、リレーショナルデータベースを用いてデータのクエリと分析を行うプランです。DWUの値によって段階的に課金が行われ、またこのプランでも予約容量を購入しておくことで、費用を抑制することが可能です。

まとめ

GAFAに代表される巨大IT企業ではユーザーが利用した様々なサービスの履歴データから、そのユーザーに適した商品やサービスを提供し成長を続けています。企業がより成長するためにもデータを分析し、そこに秘められた価値を得るためにAzure Synapse Analyticsの利用を検討してはいかがでしょうか。

RELATED POST関連記事


RECENT POST「データ分析、データベース」の最新記事


Azure Synapse Analyticsとは? 機能の特長や料金体系を解説

RANKING人気資料ランキング

RECENT POST 最新記事

RANKING人気記事ランキング

サイト掲載へのお問い合わせ