2025年度「Kaggle講義」(ライブ配信)

2024年度 受講生専用ページです。

公開日:2025年11月xx日

Kaggle講義(ライブ配信)


日時:カリキュラムの通り
会場:オンライン開催(通知のZoomミーティングに5分前までにお入りください。出欠をとります。)

担当教員:原田 慧教授
講師:パナソニック株式会社 阪田 隆司氏
申込:Slackの「41_Kaggle講義」のチャンネルにご参加ください。
使用データと教材:上記のSlack「41_Kaggle講義」のチャンネルにアップします。


トピック: UEC_DS_Programs_2025
Zoom ミーティングに参加する
https://uec-tokyo.zoom.us/j/97191230178?pwd=GfzssC0G7M5i5bTD4m8ZQ5a3dMl8aC.1
ミーティング ID: 971 9123 0178
パスコード: 8141072315

全回共通のURLとなります。

学習のテーマと使用データ

1)学習のテーマ:

「データサイエンス」という言葉に比べれば機械学習モデルの構築は狭い領域ですが、モデル構築一つとっても、データを見て実際に処理してみないとわからないことが多く、教科書にならない独特のノウハウがあります。このようなノウハウの習得には、座学だけではなく、自分でデータを見て、自分でコードを書いた、実践経験の積み重ねが不可欠です。Kaggleなどのコンペに参加することで、そのような職に就く前に擬似的な実践経験を積むことができます。ここでは各回座学1コマ、演習2コマで、コンペ形式の演習を通して、モデル構築の技術を体得していただきます。

参考図書:Kaggleで勝つデータ分析の技術(技術評論社、門脇・阪田・保坂・平松)

2)使用データ:
・講義の中で適宜指定します。データそのものは、Slackなどで共有します。

カリキュラム(予定)

日時内容講師その他調査票※
111/9(土)
13:00 – 18:00
機械学習モデリング入門
シンプルなデータでモデル構築の一連の流れを学びます。特徴量作成、GBDTモデルの構築とチューニング、モデルの検証方法(クロスバリデーションなど)、以後の講義で必要になる事項を含みます。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
阪田 隆司氏(パナソニック株式会社)
下記の事前準備をお願いします。
1)Kaggleにご自身のアカウント登録をお願いします。
https://www.kaggle.com/
2)Kaggle講義(Google Classroom※)
※電通大のGoogleアカウントでログインした状態でお入りください。
211/16(土)
13:00 – 18:00
特徴量エンジニアリング
特徴量エンジニアリングは機械学習モデルの精度に対して非常に大きな影響を与え、表形式のデータを扱うコンペティションにおいては最も重要な要素の一つです。本講義では、特徴量エンジニアリングのテクニックを網羅的に紹介していきます。特に複数テーブルを組み合わせて分析を行う際の特徴量エンジニアリングやカテゴリ変数に対する処理を重点的に紹介します。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
311/30(土)
13:00 – 18:00
時系列データ処理
モデル構築の目的の多くは将来予測となります。データサイエンスが対象とするデータの多くは人間の社会行動、経済行動で、時間に伴い変化します。本講義では、特に時系列データを扱った際のモデルの検証方法や学習されたモデルの妥当性の検証方法について重点的に紹介します。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
阪田 隆司氏(パナソニック株式会社)
412/7(土)
13:00 – 18:00
レコメンデーション
推薦技術はビジネス価値につながるものも多く、コンペティションにおいても花形のひとつです。推薦問題に取り組む上では多用なアプローチが存在しており、本講義では幾つかの代表的なアプローチを紹介していきます。あわせて、ニューラルネットワークの学習手法に関する精度向上テクニックも本講義において紹介していきます。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
512/14(土)
13:00 – 18:00
マルチモーダルデータ処理
表形式のデータとテキストデータの両方を含む課題を扱います。テキストデータを単にカテゴリ変数として扱うだけでなく、自然言語処理の問題との複合問題として扱います。このような問題は「マルチモーダル」と言われ、画像や音声などにも同様の拡張が可能です。講義では自然言語処理と画像処理の代表手法を紹介していきます。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
阪田 隆司氏(パナソニック株式会社)

※調査票の回答
全5回の講義を受講後、上記フォームから調査票のご提出をお願いいたします。

  • 忌憚のない率直な評価、ご意見をお願いいたします。
  • 講師は記入者が分からないように完全匿名化されております。
  • 成績には全く影響いたしません。

その他

  • 録画したファイルを公開しますので、それを視聴して復習してください。なお、録画ファイルや公開した資料はご自身の学習のため以外には使用・公開なさらないようにお願いします。

お問合せ先

・連絡事項、不明点は下記にご連絡ください。

国立大学法人電気通信大学 データアントレプレナーフェロープログラム事務局
E-Mail : defp@sangaku.uec.ac.jp

上記お問合せ対応時間 平日 午前9時 ~ 午後4時
上記時間外のお問合せ等につきましては、翌営業日以降のご対応となりますので予めご了承ください。
なお、非営業日は土日、祝祭日、年末年始となります。