Python学習チャンネル by PyQ

Pythonのオンライン学習プラットフォームPyQのオフィシャルブログです

【エンジニア列伝vol.7 kananさん (2/4)】「Pythonだとデータ連携がスムーズに行えます」Pythonを活用してデータ分析を行うメリットについてお聞きしました。

この記事は第7回Pythonエンジニア列伝の2記事目です

Pythonエンジニア列伝は、「Pythonエンジニアたちのインタビューを通して、Pythonを使う人達がどんな人なのか、どんな場面で活用しているのか、なぜPythonに出会ったか」などを紐解く連載です。

連載はトピックごとになっているので、記事単体でも読むことができます。

f:id:kenken0326:20190408175500p:plain

関連記事・バックナンバー

データ分析のスペシャリストが登場

f:id:kenken0326:20190403121818p:plain
hirokikyこの度はインタビューをご快諾いただきありがとうございます。今回は三菱総研DCSにてデータ分析業務支援などに従事されているkananさんにお越しいただきました。

kananよろしくお願いします。
f:id:kenken0326:20190403105446p:plain

f:id:kenken0326:20190403121818p:plain
hirokiky本インタビューでは、エンジニアやプログラミングを扱っている方々のキャリアや経歴、活動にスポットを当てることで「エンジニア」という人種にどのような人がいるのかを紹介しています。

Kananさんはデータサイエンティストの育成研修の講師も務められているので、Pythonの活用方法に加えて勉強方法についても伺わせて頂きます。

kananはい、よろしくお願いします。
f:id:kenken0326:20190403105446p:plain

Pythonの活用でコスト削減

f:id:kenken0326:20190403121818p:plain
hirokikyKananさんは三菱総研DCSでデータ分析の支援のお仕事に携われているとのことですが、どのようなお仕事なのでしょうか?

f:id:kenken0326:20190416162954j:plain

kanan現在はお客様から頂いたデータを分析し、その結果を報告したり、PoCの支援を行っています。
そのほかに、データ分析の研修の講師を務めています。
データ分析支援の業務ではお客様は金融関連の方が多いので、割と空気は固いですね。
f:id:kenken0326:20190403105446p:plain

PoC

Proof of Concept(概念実証)の略称。
プロトタイプの前段階のものを作成し、新しい概念や理論、原理などを実現できるのか検証するものです。

URL:http://e-words.jp/w/POC.html

f:id:kenken0326:20190403121818p:plain
hirokikyお仕事の様子の写真を拝見しましたが、確かに普段のkananさんとは少し違う空気を感じますね。その中でどのようにPythonを使われていますか?

kanan1年前からデータ分析で使っています。
それまではSAS言語をメインに使っていました。
ですが、SASは商用利用については有償のツールなので、PoCの段階からSASを活用するのにはコスト面で課題があったのでPythonを始めました。
f:id:kenken0326:20190403105446p:plain

SAS言語

米SAS Institute社が提供する統計解析システムで活用する統計プログラミング言語です。

URL:https://www.sas.com/ja_jp/software/iml.html

pandasを使って可視化やレポーティング

f:id:kenken0326:20190403121818p:plain
hirokikyPythonでデータ分析を行う際は、ライブラリなどでどのような手法・技術を使っていますか?

kananpandasをメインに使っています。データの分析支援は機械学習のようなシステムに組み込むというよりは、分析用に受領したデータをpandasで可視化したりレポーティングすることが多いです。

f:id:kenken0326:20190403105446p:plain

pandas

Pythonでデータ解析を支援する、オープンソースライブラリです。表やテーブル、時系列データなどを操作するためのデータ構造と、それらを扱うメソッド・関数などが提供されています。

URL:https://pandas.pydata.org/

第二言語が欲しくて移行

f:id:kenken0326:20190403121818p:plain
hirokikykananさんはデータ分析の幅を広げたいという理由でPythonを始められたのでしょうか?

kananはい。先ほどはコスト面での理由をあげましたが、個人的な話をしますと今まではSAS技術者として働いていたのですが、第二言語が欲しかったこともPythonを始めた理由の一つです。
当時、業務ではマーケティングデータを使って、施策立案や効果検証を目的とした分析が中心だったのですが、Pythonを勉強し始めたことでAI領域にも取り組みたくなり、自然言語処理やディープラーニングを始めました。

f:id:kenken0326:20190403105446p:plain
f:id:kenken0326:20190416162935j:plain
f:id:kenken0326:20190403121818p:plain
hirokiky他の分野でPythonを使われる場面はありますか?

kanan弊社には、マーケティング業務を行いながら、データの分析を行いたいお客様が多数いらっしゃいます。
そのようなノンプログラマーの方を対象とした、データ分析の研修においても、Pythonを採用した講義を行なっています。
f:id:kenken0326:20190403105446p:plain

SASとPythonそれぞれの利点

f:id:kenken0326:20190403113437p:plain
nao_yデータ分析について教えてくれる人がいるのは心強いですよね。それではSASを使用するメリットを教えてください。

kanan SAS大量のデータを高速処理できますし、GUIがあるのでプログラミングができなくても分析することができます。あとは、分析する際に避けて通れないデータ加工の機能もとても強力で、ほぼマウス操作で簡単に加工処理ができるのはメリットですね。
あと、SASのViyaという製品はPythonから操作できるようになったんですよ。
f:id:kenken0326:20190403105446p:plain

f:id:kenken0326:20190403121818p:plain
hirokikyなるほど。Pythonのメリットについても教えて下さい。

kanan Pythonは、他とのデータ連携がスムーズに行えることが大きな魅力です。これは様々な用途で使えるPythonの強みだと思います。そして、テストするハードルも低いので、データ量がそこまで大きくなく、今後システムに組み込むことを想定しているお客様にはPythonを提案するような流れにしていきたいと思います。
f:id:kenken0326:20190403105446p:plain

データサイエンティストに必要なスキルとは

f:id:kenken0326:20190403113437p:plain
nao_yデータ分析のお仕事についてお聞きします。kananさんのクライアントは「データの意味するところが何かは知っているけれど、分析の仕方やデータの性質はわからない」という悩みを抱える方ですか?

kananそうですね。データを見ないで今まで経験と勘でやっていた人が多いイメージです。
これまで埋もれていた、お客様社内の様々な情報を分析・可視化することでビジネスに還元してPDCAを回せるように目指している人が主になります。
f:id:kenken0326:20190403105446p:plain
f:id:kenken0326:20190416172559p:plain
f:id:kenken0326:20190403121818p:plain
hirokikyそうなると研修でもエンジニアではない人が多く参加されてますか?

kananはい。ユーザー側の方が多いですね。エンジニアの方々の依頼もありますが、これからデータ分析などを活用したいと思われてる方が統計をメインに学ばれることが多いです。
f:id:kenken0326:20190403105446p:plain

データ分析には数学は必須なのか

f:id:kenken0326:20190403121818p:plain
hirokikyPythonを学んでいる人の中でもデータの分析支援を学びたいと考えている人は多いのですが、本格的に学ぶ上で知っておいたほうがいいことはありますか?

kananやりたいことにもよると思いますが、データサイエンティスト協会ではビジネス力データサイエンス力データエンジニアリング力の3つのスキルが必要だと定義しています。3つのスキルを身につけるのは不可能に近いので、この中でどれか2つを得意にすればデータサイエンティストとして強い人材になれると思います。
f:id:kenken0326:20190403105446p:plain

データサイエンティスト協会

2013年当時新しい職種であったデータサイエンティストを定義する目的で設立されました。

データサイエンティストに必要となるスキル・知識を定義付けるほか、育成のカリキュラム作成、評価制度の構築など、高度IT人材の育成や啓蒙活動を行っています。

URL:https://www.datascientist.or.jp/

f:id:kenken0326:20190403121818p:plain
hirokikyプログラミングがある程度得意でデータサイエンティストに興味を持っている人はビジネススキルか統計を学ばれるといいですね。反対に活用部分で考えるとマーケターであればプログラミングか統計を学習すれば2つの技能を身につけられる可能性がありますね。
データ分析を学びたい人は「数学はやらなきゃいけないの?」と考えられている方も多いと思うのでこの質問をしました。

kanan機械学習でハードな言語処理・ディープラーニングに取り組むのであれば数学は必要だと思います。ですが、それだけでは結局次のステップに進めなくなってしまいます。

そのため目的を明確にできるビジネス力や、データの傾向を見られるデータサイエンス力を身に着けることが必要です。そうすることでデータの活用方法を明確にできると思っています。
f:id:kenken0326:20190403105446p:plain

f:id:kenken0326:20190403121818p:plain
hirokikyこの学習方法のほうが夢がありますね。この考え方だと例えば、プログラマーやマーケターの人が自分の得意分野を軸にしながら、
それぞれ足りないところを補い合って学習できますね。

kananそうですね。2つの分野に精通していればデータ分析の視野が広がるだけでなく、各分野の人と話すときに知識が言葉の橋渡しなってくれます。
データ分析の仕事はいくつかのロール(役割)に分けて行います。そういった意味でも2つの分野を学ぶことを薦めています。
f:id:kenken0326:20190403105446p:plain

理想の学習方法とは基礎から始めること

f:id:kenken0326:20190403121818p:plain
hirokikyとても納得できる意見ですね。そうなるとPythonを学び始めてデータ分析の範囲に入るまで段階があると思います。どういう流れで学んでいくのが理想ですか?

kanan私自身はデータ分析がやりたいという理由でPythonを始めました。
その時にいきなりpandasから勉強したことが原因でPythonの基礎構文でつまづいてモチベーションを失ったことがあります。
f:id:kenken0326:20190403105446p:plain
f:id:kenken0326:20190416163005j:plain
f:id:kenken0326:20190403121818p:plain
hirokikyPythonの基礎の部分ですね。飛ばさないで欲しいところです。

kanan初めて勉強される方も多いと思うので、しっかりとPythonの基本構文を押さえた上でデータ分析に入られることをお勧めしたいです。
f:id:kenken0326:20190403105446p:plain

f:id:kenken0326:20190403113437p:plain
nao_y自分の体験が教訓となって、基礎から積み上げる大切さを学ばれましたね。

kananだからといって基礎ばかりやっていてもつまらない(笑)
ですが、pandasも割とクセはあります。いきなりPythonの基本文法を知らずに入ると、pandasがPythonというイメージにもつながりかねないと思っています。
f:id:kenken0326:20190403105446p:plain

f:id:kenken0326:20190403121818p:plain
hirokiky

たしかに自分が学びたいものを学んでいただくのは大事だと思っていますが、私たちとしてもPythonの基礎文法から入ってくれると嬉しいです。この辺りのことは弊社の課題でもあります。

では、kananさんの会社の研修についてアピールしたいポイントを教えてください。

kanan

データ分析・研修業務を行う企業は、基本的にベースカリキュラムを持っています。そしてコンテンツ通りの内容になっているところが多い印象です。

弊社では受講者の業種に応じたカスタマイズも行っています。育成したい人材像やお客様の業種に合わせて、様々な事例やコンテンツを用意してます。

興味があればぜひお問い合わせください。

f:id:kenken0326:20190403105446p:plain

www.dcs.co.jp

次回の内容

Pythonを活用するメリットとデータサイエンティストに必要なスキルついて伺いました。
その3では、kananさんが研修の講師をする時に心がけていることを伺います。
その3は以下から読むことができます。

blog.pyq.jp

関連記事・バックナンバー

Copyright ©2017- BeProud Inc. All rights reserved.