見出し画像

[データエンジニア]Dataiku Advanced Designerに合格した話

今回は、Dataikuにおける上位資格のAdvanced Designer に挑戦したので、体験談をまとめたいと思います。前回のML Practitionerはデータサイエンティスト寄りの内容でしたが、Advanced Designerは完全にデータエンジニア向けの内容でした!

Dataikuのトライアル環境作成・Dataikuアカデミーへのアクセス、認定資格の受験、すべて無料で出来ますので、データサイエンス・データエンジニアに興味がある方には是非おすすめです!

以前に取得した資格の体験談はこちら👇

Dataiku Advanced Designer とは

Dataikuの資格は5種類あり、Dataiku Advanced Designer の資格はその中核となるレベルに位置しています。受験に際してはCore Designerに合格していることが条件になります。


受験までの準備

💡トライアル延長について
Dataikuでは2週間の無料トライアルが提供されています。ラーニングパスの学習の目的で延長が必要な場合は、申請すればさらに2週間延ばしてもらえます。DSS上のチャットボットから申請すればOKでした。

Dataikuでは、各資格に対応する形でラーニングパスが用意されています。(すべて無料)

ここからAdvanced Desginer を選択し、必須コースにそれぞれ取り組みます。コース内では動画閲覧・小クイズ・ハンズオンが用意されています。

必須コースのほか、オプションのコースもありますが、
私は必須コースでお腹いっぱいだったのでやりませんでしたw

Advanced Desginer のラーニングパスでは、より実践的にデータエンジニアリングの観点から、

  • ウィンドウ関数、正規表現、ピボット、上位・下位ランクの抽出

  • Dataikuフローの整理の仕方

  • プロジェクト変数・プラグイン

  • 自動化(メトリクス、チェック、シナリオ)など

について学びます。

Advanced Designerの学習に要した時間は7時間くらいで、これまでのラーニングパスと比べると格段に時間がかかりました💦 コンセプトをきちんと理解していないと解けないハンズオンが多かったです。

認定試験の受験にあたっては、上記のハンズオンで学んだ内容がまんべんなく出題されます。(データセットは認定試験用に新たに提供されます。)

出題内容は認定試験用のハンズオンを行わないと回答できない問題が40%くらい、残りの60%くらいが関連する機能の正誤などに関する出題でした。

あると便利な事前知識

Advanced Designerではデータ加工・データ準備の分野を学ぶことになります。以下のような経験があるとスムーズに学習を進められると思いました。

  • エクセルで関数を使って集計・ピボットした経験

  • SQLの経験

  • データ準備ツールの経験(Alteryx, Talend, Tableau, Informatica, Qlick, Sagemakerなど)

  • データパイプラインの設計・運用経験

学んだこと

Dataikuは機械学習プラットフォームとしてだけではなく、データ準備ツールとしても本番運用が可能な強力な製品であることが分かりました!

特に実際の業務では、一度フローを作って終わり、ではなく日々新しいデータをフローに通して加工することになります。その際にデータ品質のモニタリング・検証のために使えるメトリクス、チェック、シナリオの存在はとても心強いと思いました。

一方で、ラーニングパスに関して
改善してもらいたい点もいくつか見えてきました😅

ハンズオンの動画があると嬉しい。

ラーニングパスにてコンセプトの学習部分では動画が用意されていますが、ハンズオンはほぼ完全にテキストベースです。ひたすら文章を読んで(しかも英語)自分の環境で試す、というのはなかなか大変でした。Dataikuのインターフェースに慣れてないので、どこをクリックしたらよいか分からないシーンも多くありました。

無料でラーニングパスを提供して頂けているだけでもありがたいですが、動画が難しくても、せめてもう少しスクリーンショットを増やしてもらえるともっとスムーズに進められるなと思いました。

解答の解説が欲しい。

私の理解が及んでいないというのが一番の理由なのですが、全体を通して、何度チャレンジしても正答が分からない問題がいくつかありました。Dataiku公式ドキュメントのどこに記載のある内容かも分からなかったので、解答には一言でもいいので解説、または公式ドキュメントの参照リンクがあると嬉しかったです。

プラグインが上手くいかない…

Advanced Designerの最終試験では、必須のプラグインがあるのですが、私の場合はインストール + 有効化まではうまくいってるはずなのに、フローのアクションには出てこない、という状況になりました。多分私のやり方が悪かったのだと思いますが、同じ状況になった方のために書き残しておきます。(これが理由で、1問どうしても解けなかったので、他の問題で点数を稼ぐ必要がありました😂)

以上となります。

個人的にはAdvanced DesignerはこれまでのDataikuの資格の中で一番大変でしたが、この資格習得を通して、Dataikuのデータエンジニアリングツールとしての強みが理解できて良かったです。ご興味のある方の参考になれば幸いです!


最後までお読みいただきありがとうございました!
スキ・フォローよろしくお願いします☺


この記事が気に入ったらサポートをしてみませんか?