第 1 回 | 実施日 |
事前学習 Pandasというライブラリーについてインターネットで調べてみる。 30分 | 授業内容 ・Pandasライブラリの紹介とインストール ・データフレームの作成と基本的な操作(選択、インデックス操作、列の追加と削除) ・CSVファイルの読み込みと書き出し | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 2 回 | 実施日 |
事前学習 データの探索と統計的分析について調べる。 60分 | 授業内容 ・データの要約統計(平均、中央値、標準偏差など) ・データのグルーピングと集約操作 ・基本的なデータの可視化(棒グラフ、ヒストグラム) | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 3 回 | 実施日 |
事前学習 データのクリーニングと前処理について調べる。 60分 | 授業内容 ・欠損値の処理(削除、補完) ・文字列データの操作(分割、結合、変換) ・データ型の変更(数値、カテゴリ) | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 4 回 | 実施日 |
事前学習 Pandasによるデータ操作について調べる。 60分 | 授業内容 ・条件に基づくデータ操作 ・データフレームのソートとランキング ・ユニークな値と値のカウント | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 5 回 | 実施日 |
事前学習 データの結合と統合について調べる。 60分 | 授業内容 ・異なるデータソースからのデータの結合 ・マージ(内部結合、外部結合) ・連結と結合の違い | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 6 回 | 実施日 |
事前学習 時系列データの操作について調べる。 60分 | 授業内容 ・日付と時刻のデータ型 ・時系列データの読み込みと操作 ・時系列データのリサンプリング | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 7 回 | 実施日 |
事前学習 データの可視化について調べる。 60分 | 授業内容 ・Matplotlibとの統合 ・複数のグラフの作成 ・データの可視化のためのヒントとテクニック | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 8 回 | 実施日 |
事前学習 Pandasのほかの高度な機能について調べる。 60分 | 授業内容 ・マルチインデックスと階層的インデックス ・ピボットテーブルの作成 ・データの正規化と標準化 | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 9 回 | 実施日 |
事前学習 データの変換と特徴エンジニアリングについて調べる。 60分 | 授業内容 ・データの変換(ロギング、スケーリング) ・カテゴリカルデータのエンコーディング ・特徴量の選択と生成 | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 10 回 | 実施日 |
事前学習 外部データソースとの連携について調べる。 60分 | 授業内容 ・Webからのデータの取得 ・APIを通じたデータの取得 ・データベースからのデータの読み込み | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 11 回 | 実施日 |
事前学習 ケーススタディ - 実データセットの分析について調べる。 60分 | 授業内容 ・実際のデータセットを用いた分析の実施 | 事後学習 ・本日の授業内容を複数する。 60分 | 参考文献 |
第 12 回 | 実施日 |
事前学習 ケーススタディ - 実データセットの分析を行ってみる。 120分 | 授業内容 ・データの問題点の特定と解決 ・データストーリーテリングの基本 | 事後学習 ・本日の授業内容を複数する。 120分 | 参考文献 |
第 13 回 | 実施日 |
事前学習 プロジェクト作業準備。 120分 | 授業内容 ・自選のデータセットを用いた分析プロジェクトの計画 ・データの収集、加工、分析の実施 | 事後学習 ・本日の授業内容を複数する。 120分 | 参考文献 |
第 14 回 | 実施日 |
事前学習 プロジェクト作業の準備。 120分 | 授業内容 ・分析結果の報告とプレゼンテーションの準備 | 事後学習 ・本日の授業内容を複数する。 120分 | 参考文献 |
第 15 回 | 実施日 |
事前学習 プロジェクト発表の準備。 120分 | 授業内容 ・プロジェクトの発表 ・プロジェクトの評価とフィードバック ・データ加工と分析の今後の応用についての議論 | 事後学習 ・この授業を顧みる。 60分 | 参考文献 |