シラバス参照

講義概要/Course Information
2025/04/27 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
データマイニング
英文授業科目名
/Course title (English)
Data Mining
科目番号
/Code
開講年度
/Academic year
2023年度 開講年次
/Year offered
全学年
開講学期
/Semester(s) offered
前学期 開講コース・課程
/Faculty offering the course
博士前期課程
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
大学院専門教育科目 - 専門科目Ⅰ
開講類・専攻
/Cluster/Department
情報学専攻
担当教員名
/Lecturer(s)
○山本 渉
居室
/Office
なし
公開E-mail
/e-mail
講義の初回に提示
授業関連Webページ
/Course website
http://stat.sixthfloor.org/doku.php?id=dm:2023
更新日
/Last update
2023/04/07 11:50:37 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
主題および
達成目標(2,000文字以内)
/Themes and goals(up to 2,000 letters)
Data mining is a meeting point of statistical science and computer science.  There are a lot of techniques which have been developed in computer science and are new to statisticians.  Each technique has its genuine origin.  But when they are used for data analysis, or data mining, a philosophy should be shared in common.  It is most important to view their performances through statistical ones, i.e. estimation and testing for prediction. That is the main topic of this course.

データマイニングに現れる種々の手法を、基本的な事項から始めて、手法の実装に必要な理論を解説した後、実際の問題に適用するまでの一連の過程を通じて、学んでもらう。 毎年、トピックを一つないし複数を選んで、講義する。

今年度は"Introduction to Statistical Learning" の第2版をテキストに使い、機械学習を中心とした講義を行う。この書籍は統計的な機械学習の最新の入門書のひとつで、各自での購入もお勧めできる良書である。
前もって履修
しておくべき科目(1,000文字以内)
/Prerequisites(up to 1,000 letters)
Undergraduate level courses on probability, statistics, and multivariate analysis.
学部レベルの確率論、統計学、多変量解析に関する科目。
前もって履修しておくこ
とが望ましい科目(1,000文字以内)
/Recommended prerequisites and preparation(up to 1,000 letters)
None.

なし。
教科書等(1,000文字以内)
/Course textbooks and materials(up to 1,000 letters)
Gareth James, Daniela Witten, Trevor Hattie, and Robert Tibshirani (2021): An Introduction to Statistical Learning with Applications in R, Second Edition, Springer.
授業内容と
その進め方(2,000文字以内)
/Course outline and weekly schedule(up to 2,000 letters)
Ca:(日本語で説明し、英語の教材・資料を使う)に対応する科目であり、授業を教室で行う場合には、板書とスライドと配布資料は全て英語で、説明は日本語で講義を実施する。

This is a course belonged to English Ca.  Handouts, viewgraphs, and other materials including whiteboard writings are provided in English.  The teacher is allowed to speak Japanese in this class.  But I will not speak anything usually.  

全15回の予定である。

① Introduction
② Statistical Learning
③ Linear Regression
④ Classification
⑤ Resampling Methods
⑥ Linear Model Selection and Regularization
⑦ Moving Beyond Linearity
⑧ Tree-Based Methods
⑨ Support Vector Machines
⑩ Deep Learning
⑪ Survival Analysis and Censored Data
⑫ Unsupervised Learning
⑬ Multiple Testing
⑭ Lab 1
⑮ Lab 2
実務経験を活かした
授業内容
(実務経験内容も含む)
/Course content utilizing practical experience
授業時間外の学習
(予習・復習等)(1,000文字以内)
/Preparation and review outside class(up to 1,000 letters)
レポート課題への取り組みを通じた予習と復習を推奨している。
成績評価方法
および評価基準
(最低達成基準を含む)
(1,000文字以内)
/Evaluation and grading
(up to 1,000 letters)
Quizzes and assignments.

学期間中および学期末に課すレポート課題に基づいて、授業内容の理解度、および実際の問題への適用の達成度を測る。各分析手法を理解して、正しく適用できることを、最低達成基準とする。
オフィスアワー:
授業相談(1,000文字以内)
/Office hours(up to 1,000 letters)
Friday 12p-1p

金曜は電通大にいますので、昼休みをオフィスアワーにします。
学生へのメッセージ(1,000文字以内)
/Message for students(up to 1,000 letters)
講義時間に説明できることは限られている。自身による積極的な自習を期待する。昨年までの内容とは全く異なることを付記しておく。
その他
/Others
このクラスでは、Google Classroomを利用します。UECクラウドアカウントで
  https://classroom.google.com/
にアクセスできるようにご準備ください。
キーワード
/Keywords
Statistical learning, data mining, R, Python.
統計的学習理論, データマイニング, R言語, Python言語.