pythonを使ったデータサイエンティストのセミナーに行ってきた!!




pythonを使ったデータサイエンティストのセミナーに行ってきた!!

今回は、先月から今月までの2か月間で

行われたデータサイエンティストの

セミナーについてレビュー記事です。

 

pythonを使ったデータのコーディネイトについて

どうやったら良いのか?ということの導入部分を

知る機会があったセミナーでした。

 

セミナーを通じて、やったこと、

税務への可能性も記事にしていきます!

 

それでは、スタートです!!

 

データサイエンティストとは?

データサイエンスとは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。(Wikipediaより引用)

 

データサイエンスを一言で言うと、

データを科学する手法のことであり、

 

データサイエンティストとは、

データサイエンスを実際に仕事にする人

ということになります。

 

今回、私が参加したセミナーでは、

データサイエンスを前提として、

 

どのようにデータサイエンティストが

仕事をするのかという導入部分を

pythonとディープラーニングを使って

理解することが目的でした。

 

そこで、会社とデータサイエンティストをつなぐ

ビジネストランスレーターとしての何ができるか

ということを理解するためのセミナーでしたね。

 

セミナーでやったことは?

さて、セミナーでやったことを振り返って

みたいと思います。

 

以下のことを行いました。

・機械学習の中身を理解する
・pythonでのプログラミング入力
・機械学習をやってみる
・回帰分析、ランダムフォレストなど
・AIベンチャーの技術的評価をやってみよう

 

先ほども申し上げましたが、

ビジネストランスレーターの仕事を

理解してもらうことがゴールになります。

 

ビジネストランスレーターとは、

会社とデータサイエンティストをつなぐ

つなぎ手の役割を果たす人のことです。

 

ですから、ある程度の知識が必要なのです。

 

今回はセミナーを通じて、ある程度の知識を

理解してもらうことに重点が置かれていました。

 

従って、pythonでのプログラミング、

機械学習(ディープラーニング)も体験しました。

 

 

 

 

pythonに関しては、ExcelのVBAを想像してもらうと

イメージが付きやすいと思います。

 

私としては、VBAよりも理解しやすいと

思っています。

 

プログラミング体験が全くなくても、

一定のコードが分かれば、ある程度のコードを

書けるようになりますね。

 

今回のセミナーで使った機械学習は、

不動産価格を算定するというお題で活用しました。

 

どのように活用したのかというと、

データの加工(python)⇒データのグラフ化(python)

⇒予測モデルの構築(機械学習)としてやりました。

 

現状としては、機械学習の前段階が

重要となってきます。

 

なぜなら、適切なデータを用意しないと

いけないからです。

 

現在は、適切に機械学習に組み込めるデータを

クラウド上で探し出すツールがあります。

 

それを機械学習、今回はScikit Learnという

ツールを用いて、線形回帰モデルを構築しました。

 

何を言っているのか分からないと思いますが、

要するにディープラーニングを使って、

線形回帰モデルというものを作ったわけです。

 

税務におけるpythonの可能性

それでは、税務におけるpythonの可能性について、

ちょっと考えてみたいと思います。

 

基本的には、python+ディープラーニングで、

考えることができることです。

 

国税局は、現在、税務行政のAI化を進めようと

実験をしているようです。

 

現状で、どこまでできているのかは

分かりませんが、

 

まずは、税務相談チャットbotを制作して

税務行政の効率化を図ることになっています。

 

しかし、python+ディープラーニングでは、

次のような分析をすることができます。

 

決算書から税務リスクが非常に高い

事業者を選定するモデルを作ることです。

 

つまり、税務調査に入れば、高確率で、

追徴課税を狙える会社、個人事業主を

特定判別することができます。

 

この点は、pyhtonを使わなくても

現状でも散布図を作成して、同業他社と比較し、

乖離した事業者に税務調査に入るといった

モデルを構築することもできます。

 

まあ、税務調査官達の様子を見ると、

分析というよりも、人の手でやっていますが。

 

今後は、pythonで分析して、

税務調査効率の良いデータモデルの制作、

ディープラーニングによる税務リスクを

行うであろう性別、年齢、事業、個人を

特定しやすいと思います。

 

逆に、私が考えているのは、

税法上の不確定概念をディープラーニングにて

確定的に寄せていく方法です。

 

例えば、高額役員報酬、高額役員退職金など、

どこからが高額なのかという判断は

不確定概念として残っています。

 

これに、アルゴリズムを加えて、

国税庁発表のデータを活用し、

高額とならないデータ散布図を作成して、

ぎりぎりまで役員報酬を高く設定する

ということもできますね。

 

基本的に、高額役員報酬などは、

税務署内で処理せずに、国税局マターに

なりますので、裁判を前提とした

処理が必要だと思います。

 

データを使えば、全国津々浦々の分析をして、

適正な役員報酬を選択することができますので、

データ分析から、恣意的でなく、かつ、高額でもない

という反証が納税者側からできるようになります。

 

AIは、国、税理士、納税者それぞれにとって

メリットがあるツールだと思いますね。

 

 

 


編集後記

今日は、午後から東京税理士政治連盟の

定期総会に出席してきます。

 

私は、新宿政治連盟を通じて、

今期から代議員となりますので、

定期総会に出席することができるようです。

 

 

ではぼっち税理士の齋藤でした~
それではまた👍

 

youtube始めました!
税理士さいとうゆきおチャンネル

 

税務顧問や執筆などのご依頼はこちら↓

Liens税理士事務所ホームページ

 

この記事は、その時の状況、心情で書いています。
また、法令に関しては、その後改正された場合には、
異なる取り扱いになる可能性があります。

 

 




ABOUT US
齋藤 幸生税理士・行政書士・経営革新等支援機関・ブロガー
都内税理士事務所にて7年間の勤務後独立。 2017年に税理士として独立後は建設業、フォワーディング業、IT業に特化した税務を行っています。また財務支援として資金繰り支援(会社の資金繰りと資金調達支援)を行っています。行政書士としては建設業許可、利用貨物運送事業の許可業務に特化しております。