見出し画像

AWS DASに合格した話

今まで取得したAWS資格

アソシエイト: SAA/DVA
プロフェッショナル: SAP
スペシャリティ:DBS

直近、DBSに合格しましたので、S3、RedShift、DynamoDBなどの内容が共通しているDAS(AWS Certified Data Analytics Specialty)も間をあけずにで受けました。

試験準備

試験の準備には10日かかりました。

最初の8日は、MaarekとKaneのUdemy講座を見ました。

最後の2日は、講座の問題試験とUdemyの模擬試験をやりました。問題数が合計130でしたが、今まで受けたコース、特にSAPとDBSと重複した問題がいくつかありました。

試験結果

4月初に廃止される試験なので、興味がある方は早めに準備したが方がいいですね。

勉強法

AWSでソルーションを実現させる道は多々ありますが、コスト削減やパーフォマンスを最大化する方法こそが大事です。

例えば、AthenaもRedShift Spectrumも外部のS3をSQLに叩けますが、使うシナリオが違います。前者の方がセットアップしやすいし(運営コスト低い)、ランニングコストも低い。後者は高いけど、パフォーマンスを最大化できる上、RedShiftの既存のデータと結合できるのはメリットです。

サービスの連携も大事です。KDF(Kinesis Data Firehose)はRedShiftとOpenSearchにストリーミングする時、内部でデータ変換するのにLambdaを利用できます。

しかし、KDFの内部Lambdaでデータを送信できない点が要注意です。KDFは直接DynamoDBやRDSにストリーミングできないので、S3を経由してS3 eventsからLambda/SNSを呼び出し、DBにデータを挿入する手法があります。

引用: Snowflake Snowpipe、Amazon S3、Amazon SNS、Amazon Data Firehose を使用して、Snowflake データベースへのデータストリームの取り込みを自動化する

感想

最初はHDFS、Hive、SparkなどのBig Dataの内容が問われると思いましたが、実際の試験にはほとんどありませんでした。Udemyの講座は元々すでに廃止されたBDS(AWS Certified Big Data Specialty)をベースにした内容でしたが、DASの試験範囲と大分離れました。

KinesisとGlueは試験の中心でした。この二つのサービスとS3とLambdaの連携も問われます。

  • MSKとKinesis: KDF, KDA, KDA (Flink)

  • Glue, Glue Crawler

  • S3とAWS Lake Formation

  • Glue WorkflowとStep Functionの違い

  • GlueのSparkとEMRのSparkの違い

  • RedShift SpectrumとAthenaの違い

  • AthenaとQuickSightとOpenSearchの違い

  • QuickSight図形の選び方

  • 他のサービス:AWS Connect, AppFlow, DMR

大学院でHadoop、YARN、SparkなどのBig Data技術の研修を受けたときはとても楽しかったです。今回試験の準備で復習できて有意義な時間だと感じました。試験内容と違ってもこれから役に立つかもしれないです。

この記事が気に入ったらサポートをしてみませんか?