Azure Synapse Analyticsとは? データレイクとの違いを解説

Azure Synapse Analyticsとは? データレイクとの違いを解説

近年、さまざまな産業でDXの実現が喫緊の経営課題となっており、データ活用の重要性が高まっています。そんななかで注目を集めているのが「Azure Synapse Analytics」です。本記事はAzure Synapse Analyticsについて詳しく解説するとともに、具体的なメリットや企業の導入事例を紹介します。

Azure Synapse Analyticsとは? データレイクとの違いを解説

Microsoft Azure製品カタログ

Azure Synapse Analyticsとは?

Azure Synapse Analyticsとは、Microsoft社のAzure上で稼働する、ペタバイト単位の情報を高速で処理するデータ分析プラットフォームです。クラウド型のデータウェアハウスサービス「Azure SQL Data Warehouse」をリブランディングし、データ統合・データウェアハウス・ビッグデータ分析が1つにまとめられたソリューションとして2019年にリリースされました。

このソリューションがもつ最大の特徴は、データ分析における膨大な作業プロセスを統合的に管理できる点です。データ分析をマネジメントやマーケティングの領域で活用するためには、「データの収集・蓄積」→「データの抽出・加工」→「データの分析・可視化」という一連のプロセスが必要です。そして、これらの分析プロセスは、それぞれ異なるソリューションによって実行されます。

具体的には「データをデータレイクに収集・蓄積」→「ETLツールによってデータを抽出・加工」→「構造化されたデータをデータウェアハウスに保管」→「BIツールや機械学習(ML)と連携してデータを分析・可視化」という流れが一般的なデータ分析のプロセスです。この一連のプロセスを実行するためには各ソリューションを連携させる必要があり、データ分析における大きな障壁となっていました。Azure Synapse Analyticsは、これら複数のソリューションと連携し、1つのデータ分析プラットフォームとして稼働できます。

国内外のIoT先進事例100選
Azure Cosmos DB 自習書 - Azure Cosmos DB Gremlin API 編 -

データレイクとは

ここからは、データ分析において不可欠となる「データレイク」と「データウェアハウス」について掘り下げてみましょう。

データを「生のまま」保管しておくリポジトリのこと

データレイクとは、構造化・半構造化・非構造化といった形式を問わず、あらゆるデータをそのままのフォーマットで保管するデータリポジトリです。CSVやExcelなどの構造化データはもちろん、XMLのような半構造化データや画像ファイルのような非構造化データなど、あらゆる形式のデータを一元的に保管します。加工が一切施されていない生データを泳がせておくように保管するという特性が「Data Lake(情報の湖)」と呼ばれる所以です。

データウェアハウスとの違いは?

データウェアハウスとは、分析しやすいよう抽出・加工された構造化データのみを保管するデータリポジトリです。データレイクは膨大な生データをそのままの形式で保管可能というメリットがありますが、構造化されていないためデータの検索性が低く、情報の抽出や分析に多大な時間を要します。

データウェアハウスは、用途や目的に応じて構造化されたデータのみを保管することで、データの分析や検索を高速に処理できるという点が大きな特徴です。つまり、データレイクは「生データの保管に特化した情報の格納庫」で、データウェアハウスは「データの検索と分析に特化した情報の倉庫」といえます。このように、データを分析しやすい状態で管理する倉庫としての役割をもつことから「Data Warehouse(情報の倉庫)」と呼ばれています。

Azure Synapse Analyticsを導入するメリットとは?

ここからは、具体的な導入メリットについて見ていきましょう。主なメリットとして挙げられるのは、以下の5つです。

  • データレイク・データウェアハウス・ビッグデータ分析が一つになっている
  • 無限のスケールを持っている
  • 使い慣れたプログラミング言語を使用できる
  • BIと機械学習を統合して分析ができる
  • 最新のセキュリティを搭載している

データレイク・データウェアハウス・ビッグデータ分析が一つになっている

Azure Synapse Analyticsは、データウェアハウスでありながら、構造化データと非構造化データを横断して参照できるため、大容量データの収集・蓄積といった領域にも対応可能です。データレイクとデータウェアハウスそれぞれの性質を兼ね備えているため、スムーズなデータ連携による効率的なデータ分析基盤を整備できます。そして、データベースやETLツール、BIツールなどと連携し、1つの統合されたデータ分析プラットフォームをクラウド上に構築します。

無限のスケールを持っている

記事の冒頭で述べたように、Azure Synapse Analyticsはペタバイト単位の情報を高速処理するデータ分析プラットフォームであり、非常に優れたスケーラビリティを備えています。組織内に分散する各部門の業務データはもちろん、市場分析や需要動向といったアナリティクスデータも含めて無限ともいえるスケールで分析可能です。

使い慣れたプログラミング言語を使用できる

Azure Synapse Analyticsは、幅広いスクリプト言語やSQL言語と互換性があるため、さまざまな領域の分析やデータエンジニアリングに活用可能です。たとえば、汎用性が高く大規模開発向けのJava、統計解析に用いられるR、機械学習の領域を得意とするPython、SQL Serverで使用されるTransact-SQLなど、非常に多くの言語と互換性があります。

BIと機械学習を統合して分析ができる

先述したように、Azure Synapse Analyticsは、Azure上のETLツールやBIツールと連携し、1つの統合されたデータ分析プラットフォームとして運用できます。たとえば、ETLツールのData Factoryによって抽出・加工されたデータをAzure Synapse Analyticsに統合し、機械学習に特化したAzure Machine LearningやBIツールのPower BIと連携することで、スムーズなデータ運用と高速なビッグデータ分析が可能です。

最新のセキュリティを搭載している

Microsoft社のAzureは、AWSやGoogle Cloudと並んで世界3大クラウドコンピューティングサービスと呼ばれており、堅牢なセキュリティ体制を誇るソリューションです。国際的なセキュリティ認証「ISO認証」の取得数が業界トップと言われており、クラウドセキュリティ認証の「ISO/IEC 27017」、個人データの保護に関する「ISO/IEC 27018」、情報セキュリティ管理基準の「ISO/IEC 27001」など、数多くの認証を得ています。

Azure Synapse Analyticsの導入事例

ここからは、企業の導入事例について見ていきましょう。大手物流企業と大手金融系企業の2社の事例を紹介します。

経営改革プランの分析基盤として採用

大手物流企業のY社は、ビジネスモデルの「デジタル化」と経営体制の「データ活用」を推進すべく、2020年1月に経営構造改革プランを発表しました。そのプランにおける戦略のひとつがAzure Synapse Analyticsの導入です。ソリューションのパフォーマンスや機能、コストなどを比較検証して採用へと至り、定量的なデータ分析に基づく荷物量の予測や、機械学習による人材配置の最適化を実現しています。

ビジネスや社会の急激な変化に対応

大手金融系企業のS社は、クラウドファーストを掲げた業務改革を推進し、Azure Synapse Analyticsの導入へ踏み切りました。リソースを共有するパブリック型のクラウドは、セキュリティの脆弱性を懸念する声があり、金融業界では敬遠されていました。Azure Synapse Analyticsは、高度なセキュリティ要件を満たす機能を備えているため、データ分析基盤として導入され、順次システムをクラウド化しています。

まとめ

Azure Synapse Analyticsは、ETLツールやBIツールと連携することで、1つのデータ分析プラットフォームを構築できるソリューションです。自社に蓄積された経営データを活用し、新たな市場価値を創出していくためにも、Azure Synapse Analyticsの導入を検討してみてはいかがでしょうか。

RELATED POST関連記事


RECENT POST「データ分析、データベース」の最新記事


Azure Synapse Analyticsとは? データレイクとの違いを解説

RANKING人気資料ランキング

RECENT POST 最新記事

RANKING人気記事ランキング

サイト掲載へのお問い合わせ