データサイエンティスト(本場アメリカで戦うもの向け)のための面接 – データサイエンスに向けて

データサイエンスの面接は確かに簡単ではない。私はそれを身をもって知っている。私は昨年1年間、競争率の高いインターンシップに応募しながら、50回以上の個人面接と電話審査に参加した。このエキサイティングでやや(時には非常に)辛いプロセスを通じて、私はデータサイエンスの面接に備え、最終的に合格するのに役立つ有用なリソースを大量に蓄積してきた。

面接のための全て

長くなったが、データサイエンスのリソースの包括的なリストを提供するために、ブックマークやメモを整理することにした。

このリストがあれば、次に大きな面接の準備をするときに、十分すぎるほど効果的なツールを自由に使えるはずだ。
これらのリソースの多くは、私の専門分野であるデータサイエンスのエントリーレベルやインターン向けのものです。それを念頭に置いて楽しんでほしい!

データサイエンティストでさえ、アルゴリズムコーディングの面接から逃れることはできない。私の経験では、これが100%のケースではないが、HackerRankの簡単な問題や中程度の問題に似たものをこなすよう求められる可能性はある。

言語に関しては、ほとんどの会社では好きな言語を使わせてくれる。個人的には、PythonやRのプログラマーを対象とした求人があったにもかかわらず、アルゴリズム・コーディングのほとんどすべてをJavaで行った。

あなたが問題を通して考え、効果的にコーディングできることが面接官に伝われば、よりデータサイエンスに特化したアプリケーションに進む可能性がある。面接官や職種にもよりますが、おそらくPythonとRのどちらかを選択することになるでしょう。私はPythonが好きなので、以下のリソースは主にPandasとNumPyをデータ分析に効果的に使うことに焦点を当てます。

データサイエンスの面接は、通常SQLの知識をチェックしなければ完了しません。これは電話やライブコーディングの質問で行われることがありますが、後者の方が多いでしょう。これらの質問の難易度は、非常に簡単なものから、複雑な結合や不明瞭な関数を要求するものまで、かなり幅があることがわかった。

統計学

私たちの良き友人である統計学は、データサイエンティストにとって依然として重要であり、面接でもそのように反映されます。私は多くの面接で、一般的な統計や確率の概念を簡単で簡潔な言葉で説明できるかどうかを確認することから始めました。

職位が上がるにつれて、伝統的な統計の質問が、この投稿で後述するA/Bテストのシナリオのような、より実践的な形を取るようになり、このようなことは少なくなってきていると思います。

ここでは、他のセクションよりも多くのリソースをまとめていることにお気づきだろう。これは間違いではない。機械学習は複雑な分野であり、今日のデータサイエンスの面接では事実上保証されています。

しかし、あなたが機械学習についてテストされる方法は様々です。クロスバリデーションやバイアスと分散のトレードオフに関する概念的な質問として出てくるかもしれないし、データセットを添付した持ち帰り課題の形をとるかもしれない。私はその両方を何度か見てきたので、何事にも備えなければならない。

次の面接や就職活動で、これらが役に立つことを願っている。

Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です