Python学院
メールマガジンバックナンバー

  • ChatGPT
  • メールマガジン

ChatGPTで簡単に本格的なデータ分析を行う方法をご紹介!

今回は、プログラミングの知識がなくてもChatGPTで簡単に本格的なデータ分析をする方法について、
ご紹介いたします。

ChatGPTでデータ分析を行う方法は、必要なExcel関数の出力、分析用のPythonコードの出力、GPTsの活用など、さまざまあります。 今回は、簡単に本格的なデータ分析ができる「Code Interpreter」を活用し、データを分析する方法について、お伝えします。
※本メールで紹介する内容はGPT-4以降のモデルにて利用可能です。

(約5分で読めます)

~~~~~~~~~~~~~~~目次~~~~~~~~~~~~~~~
1.Code Interpreterを活用したデータ分析の方法
2.実際にChatGPTでデータ分析をやってみよう!
3.おわりに
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


1.Code Interpreterを活用したデータ分析の方法

基本的なデータ分析は、以下の5ステップで行います。

(1)目的の明確化と仮説構築


なぜデータ分析を行いたいのか?という目的を明確にし、この目的に基づいて自身の仮説を立てます。

(2)目的に合わせたデータの選択


目的に合わせて、使用するデータの種類、項目、内容、期間などを選択します。

(3)データの整形・加工


取得したデータを、分析しやすい形に整形・加工します。

(4)データの分析・可視化


データの大きさや傾向を把握します。また、データを見やすくする、共有するために可視化します。

(5)分析データのビジネス活用


分析したデータをもとに、問題の原因を理解します。また、解決策の立案や効果検証も行っていきます。
Code Interpreterを使ってデータを分析する場合も同様のステップで行います。
この機能では(3)データの整形・加工、(4)データの分析・可視化、(5)分析データのビジネス活用の ステップにおいて、対話型でデータの操作やデータに関する提案を受けることができます。

【PR】Code Interpreterの使い方を学べる研修はコチラ
(半日研修)GPT-4理解研修~話し言葉でプログラムが書けるCode Interpreterで業務を効率化する
https://www.insource.co.jp/bup/bup-code-interpreter.html

2.実際にChatGPTでデータ分析をやってみよう!

それでは早速、ChatGPTを使ってデータを分析していきます。
■前提
このデータは、あるシリーズの商品をご購入いただいた方を抽出したデータです。
※実際のデータを使用する場合は、個人情報を削除してからChatGPTに入力してください。

■データの詳細
・「顧客ID、性別、年齢、購入日、商品ID」が入った5列のデータ
・データの個数は300個

■ダミーデータ


(1)目的の明確化と仮説構築


目的:
・どのような層にどの商品が売れるのか、という傾向を明らかにする
・その傾向を活かし、新しい商品の開発や販促に役立てる
仮説:
(例)商品IDが2の商品は、30代男性に男性によく売れている など

(2)目的に合わせたデータの選択


立てた仮説より、年齢と性別と購入した商品がわかるデータを用意する

(3)データの整形・加工


Code Interpreterは、左下のクリップボタンよりファイルを読み込んで使用します。

それでは早速使用してみます。

ChatGPTへの質問内容:

あるExcelデータをアップロードするので、データを分析していただきたいと考えています。
まず、前処理を行ってください。特に空欄のセルがあった場合は、適切に処理をしてください。


結果:


(4)データの分析・可視化


ChatGPTへの質問内容:

以下の目的のためにどのように分析を行うのが良いか提案してください。
#前提条件
・目的:どのような層にどの商品が売れるのか、という傾向を明らかにしたい


ChatGPTからの提案:

次のステップとして、データの分析と可視化を行います。
どのような層にどの商品が売れるのかという傾向を明らかにするために、以下のような分析を行う予定です。

1. 年齢層別の商品の売上傾向を把握するために、年齢をグループ分けし、
  各グループごとの商品購入傾向を分析。
2. 性別による商品の売上傾向を把握するために、性別ごとに商品の購入傾向を分析。どの分析から始めたいですか、または特定の質問や見たいグラフなどがあれば教えてください。


返答:

どちらも見たいので、まずは1からお願いします。
また、棒グラフが見たいです。


結果:
1. 年齢層別

→グラフの下に記載されている数字は、「何歳から何歳まで」という年代を表しており、
   10個の棒グラフは商品IDを表しています。

2. 性別

→1の年齢層別と同様に、10個の棒グラフは商品IDを表しています。

【PR】 今回の分析には「Python」というプログラミング言語が使われています。
Pythonを知らなくても、ChatGPTでデータを分析できますが、より詳しい観点を分析したい場合や特定のデータを出力したい場合などは、コードを理解できる程度の知識を習得することをおすすめしています。

・Python学院~基本文法編/プログラミング未経験から業務への活用方法を学ぶ(1日間)
https://www.insource.co.jp/bup/bup_python_programming_basic.html

(5)分析データのビジネス活用


結果:


3.おわりに

今回は、ChatGPTの「Code Interpreter」という機能を使用し、データ分析を行ってみました!
面白いと感じていただけましたら幸いです。
今回ご覧いただいたChatGPTのニュースも活かし、ぜひ今後の業務改善にもご活用くださいませ。

関連研修