Amazonは、Amazon S3データレイクとAmazon Redshiftデータウェアハウスのデータを統合する機能、Amazon SageMaker Lakehouseの一般提供開始を発表しました。これにより、単一のデータコピー上で強力な分析、AI/MLアプリケーションを構築できます。SageMaker Lakehouseは、次世代Amazon SageMakerの一部であり、データ、分析、AIのための統合プラットフォームです。広く採用されているAWSの機械学習と分析機能を統合し、分析とAIのための統合されたエクスペリエンスを提供します。
顧客はデータ活用をより一層促進したいと考えています。分析の迅速な進展のため、適切なストレージとデータベースを選択しています。しかし、データはデータレイク、データウェアハウス、そして様々なアプリケーションに分散し、データサイロ化されアクセスと活用が困難になっています。この断片化はデータの重複コピーと複雑なデータパイプラインを生み出し、組織のコスト増加につながります。さらに、顧客は特定のクエリエンジンやツールに制約され、データの保存方法と場所によって選択肢が制限されます。これは、顧客が望むようにデータと連携する能力を阻害します。最後に、一貫性のないデータアクセスは、顧客が情報に基づいたビジネス上の意思決定を行うことを困難にします。
SageMaker Lakehouseは、Amazon S3データレイクとAmazon Redshiftデータウェアハウスのデータを統合することで、これらの課題に対処します。Apache Icebergと互換性のあるすべてのエンジンとツールを使用して、データをその場でアクセスおよびクエリする柔軟性を提供します。SageMaker Lakehouseを使用すると、きめ細かい権限を中央で定義し、複数のAWSサービスに適用することで、データ共有とコラボレーションを簡素化できます。SageMaker Lakehouseへのデータの取り込みは簡単です。既存のデータレイクとデータウェアハウスからシームレスにデータにアクセスすることに加えて、Amazon Aurora、Amazon RDS for MySQL、Amazon DynamoDBなどの運用データベース、SalesforceやSAPなどのアプリケーションからゼロETLを利用できます。SageMaker Lakehouseは既存の環境に適合します。
特に、SageMaker Lakehouseの他のAWSサービスとの統合は注目に値します。この統合により、データ管理と分析が大幅に簡素化され、より簡単かつ効率的になります。分析とAI機能を向上させたいと考えている企業にとって、このサービスは非常に価値のあるものになると確信しています。