シラバス参照

講義概要/Course Information
2024/04/29 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
データマイニング
英文授業科目名
/Course title (English)
Data Mining
科目番号
/Code
開講年度
/Academic year
2021年度 開講年次
/Year offered
全学年
開講学期
/Semester(s) offered
前学期 開講コース・課程
/Faculty offering the course
博士前期課程
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
大学院専門教育科目 - 専門科目Ⅰ
開講類・専攻
/Cluster/Department
情報学専攻
担当教員名
/Lecturer(s)
山本 渉
居室
/Office
西5-601
公開E-mail
/e-mail
講義の初回に提示
授業関連Webページ
/Course website
http://stat.inf.uec.ac.jp/doku.php?id=dm:2021
更新日
/Last update
2021/04/05 11:34:58 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
主題および
達成目標(2,000文字以内)
/Themes and goals(up to 2,000 letters)
Data mining is a meeting point of statistical science and computer science.  There are a lot of techniques which have been developed in computer science and are new to statisticians.  Each technique has its genuine origin.  But when they are used for data analysis, or data mining, a philosophy should be shared in common.  It is most important to view their performances through statistical ones, i.e. estimation and testing for prediction. That is the main topic of this course.

データマイニングに現れる種々の手法を、基本的な事項から始めて、手法の実装に必要な理論を解説した後、実際の問題に適用するまでの一連の過程を通じて、学んでもらう。 毎年、トピックを一つないし複数を選んで、講義する。

今年度は"Deep Learning" をテキストに使い、機械学習を中心とした講義を行う。この書籍は深層学習の最新の入門書のひとつで、各自での購入もお勧めできる良書である。
前もって履修
しておくべき科目(1,000文字以内)
/Prerequisites(up to 1,000 letters)
Undergraduate level courses on probability, statistics, and multivariate analysis.
学部レベルの確率論、統計学、多変量解析に関する科目。
前もって履修しておくこ
とが望ましい科目(1,000文字以内)
/Recommended prerequisites and preparation(up to 1,000 letters)
None.

なし。
教科書等(1,000文字以内)
/Course textbooks and materials(up to 1,000 letters)
Ian Goodfellow, Yoshua Bengio, Aaron Courville (2016): Deep Learning, Adaptive Computation and Machine Learning series, MIT Press.
授業内容と
その進め方(2,000文字以内)
/Course outline and weekly schedule(up to 2,000 letters)
この科目は英語ベースIIの科目であり、その規定に従って板書とスライドと配布資料は全て英語で、説明は日本語で講義を実施する。

This is a course belonged to English Type II.  Handouts, viewgraphs, and other materials including whiteboard writings are provided in English.  The teacher is allowed to speak Japanese in this class.  

全15回の予定である。

① History and motivation
Evolution and DL
② SGD and backprop
Backprop in practice
③ Parameter transformation
CNN
④ 1D convolutions
⑤ Optimisation I
Optimisation II
⑥ CNN applications
RNNs and attention
⑦ Energy-Based Models
SSL, EBM
⑧ Contrastive methods
Regularised latent
⑨ Sparsity
World model, GANs
⑩ CV SSL I
CV SSL II
⑪ Activations
Losses
⑫ DL for NLP I
DL for NLP II
⑬ GCNs I
GCNs II
⑭ Structured Prediction
Graphical methods
⑮ Inference for Latent-Variable EBMs
Training Latent-Variable EBMs
実務経験を活かした
授業内容
(実務経験内容も含む)
/Course content utilizing practical experience
授業時間外の学習
(予習・復習等)(1,000文字以内)
/Preparation and review outside class(up to 1,000 letters)
レポート課題への取り組みを通じた予習と復習を推奨している。
成績評価方法
および評価基準
(最低達成基準を含む)
(1,000文字以内)
/Evaluation and grading
(up to 1,000 letters)
Quizzes and assignments.

学期間中および学期末に課すレポート課題に基づいて、授業内容の理解度、および実際の問題への適用の達成度を測る。各分析手法を理解して、正しく適用できることを、最低達成基準とする。
オフィスアワー:
授業相談(1,000文字以内)
/Office hours(up to 1,000 letters)
Monday 6p-7p

月曜5限をオフィスアワーとする。ただし、簡単な質問であれば講義の後の休憩時間に相談に応じることができる。また、込み入った相談の場合には、休憩時間に日程調整を申し出てくれるか、あるいはメールでアポイントメントを取り付けてくれたら、オフィスアワー以外でも応じられることがある。
学生へのメッセージ(1,000文字以内)
/Message for students(up to 1,000 letters)
講義時間に説明できることは限られている。自身による積極的な自習を期待する。
その他
/Others
このクラスでは、Google Classroomを利用します。UECクラウドアカウントで
  https://classroom.google.com/
にアクセスできるようにご準備ください。

キーワード
/Keywords
Statistical learning, data mining, R, Python.
統計的学習理論, データマイニング, R言語, Python言語.