シラバス参照

講義概要/Course Information
2024/07/19 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
データマイニング
英文授業科目名
/Course title (English)
Data Mining
科目番号
/Code
開講年度
/Academic year
2024年度 開講年次
/Year offered
全学年
開講学期
/Semester(s) offered
前学期 開講コース・課程
/Faculty offering the course
博士前期課程
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
大学院専門教育科目 - 専門科目Ⅰ
開講類・専攻
/Cluster/Department
情報学専攻
担当教員名
/Lecturer(s)
岡本 一志、原田 慧、高木 正則
居室
/Office
Dr. Kazushi Okamoto / 岡本 一志:西5-503,Dr. Kei Harada / 原田 慧:東3-820,Dr. Masanori Takagi / 高木 正則:西5-705
公開E-mail
/e-mail
Dr. Kazushi Okamoto / 岡本 一志:kazushi@uec.ac.jp,Dr. Kei Harada / 原田 慧:harada@uec.ac.jp,Dr. Masanori Takagi / 高木 正則:takagi-m@uec.ac.jp
授業関連Webページ
/Course website
See WebClass.
更新日
/Last update
2024/03/11 13:54:53 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
主題および
達成目標(2,000文字以内)
/Themes and goals(up to 2,000 letters)
Data mining is a meeting point of statistical science and computer science. There are a lot of techniques which have been developed in computer science and are new to statisticians. Each technique has its genuine origin.  But when they are used for data analysis, or data mining, a philosophy should be shared in common. It is most important to view their performances through statistical ones, i.e. estimation and testing for prediction. That is the main topic of this course.

データマイニングに現れる種々の手法を,基本的な事項から始めて,手法の実装に必要な理論を解説した後,実際の問題に適用するまでの一連の過程を通じて学ぶ.
前もって履修
しておくべき科目(1,000文字以内)
/Prerequisites(up to 1,000 letters)
Undergraduate level courses on probability, statistics, and multivariate analysis.

学部レベルの確率論,統計学,多変量解析に関する科目.
前もって履修しておくこ
とが望ましい科目(1,000文字以内)
/Recommended prerequisites and preparation(up to 1,000 letters)
None.
教科書等(1,000文字以内)
/Course textbooks and materials(up to 1,000 letters)
Textbook / 教科書:Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, Jonathan Taylor: An Introduction to Statistical Learning with Applications in Python, Springer, 2023.

Full text and data sets of the textbook are available at the following URL.

電子版のテキストや用いているデータセットは以下のURLから入手可能である.

https://www.statlearning.com
授業内容と
その進め方(2,000文字以内)
/Course outline and weekly schedule(up to 2,000 letters)
English course type: Ca

This is a course belonging to English Ca. Therefore, slides, handouts, and other materials including whiteboard writings will be provided in English, while the faculty staff will give lectures in Japanese.

本科目は,Ca(日本語で説明し,英語の教材・資料を使う)に対応する科目である.板書・スライド・配布資料等は全て英語で,説明は日本語で行う.

Outline
#01 Guidance and introduction
#02 Statistical learning
#03 Linear regression
#04 Classification
#05 Resampling methods
#06 Linear model selection and regularization
#07 Moving beyond linearity
#08 Summary of the basic topics above
#09 Tree-based methods
#10 Support vector machines
#11 Deep learning
#12 Summary of the three advanced topics above
#13 Educational data mining
#14 Learning analytics
#15 Exercise: Analysis of  learning record data

This course will be given in an omnibus format. The assignments for each lecture are as follows.

本科目は3名の教員によるオムニバス形式で実施する.担当回は次のとおりである.

Dr. Kazushi Okamoto: #01 - #08
Dr. Kei Harada: #09 - #12
Dr. Masanori Tagagi: #13 - #15
実務経験を活かした
授業内容
(実務経験内容も含む)
/Course content utilizing practical experience
授業時間外の学習
(予習・復習等)(1,000文字以内)
/Preparation and review outside class(up to 1,000 letters)
Students should prepare for class by using the textbook beforehand and should review after class by reviewing lecture materials and working on reports and other assignments.

授業前に教科書にて予習を行い,授業後は講義資料の見直しやレポート課題等への取り組みを通じた復習を推奨している.
成績評価方法
および評価基準
(最低達成基準を含む)
(1,000文字以内)
/Evaluation and grading
(up to 1,000 letters)
(a) Evaluation method / 評価方法
Each faculty member will assign assignments, and the summary and point distribution will be as follows.

教員毎に課題を課すこととし,その概要と配点は次のとおりである.

Dr. Kazushi Okamoto: 50% (quizzes: 20%, one report: 30%)
Dr. Kei Harada: 25% (one report)
Dr. Masanori Tagagi: 25% (one report)

(b) Evaluation criteria / 評価基準
The overall assessment is based on whether the contents described in the “Topic and goals” section have been mastered. This will be done using the scoring method above (a), and a score of 60% or higher on the overall assessment is considered a passing score.

達成目標に記載の内容を習得できたかの観点で総合的に評価する.これは(a)に記載の評価方法で行うこととし,総合評価で60%以上を合格とする.
オフィスアワー:
授業相談(1,000文字以内)
/Office hours(up to 1,000 letters)
We will respond to consultations as appropriate, but please contact us via e-mail in advance.

適宜相談に応じるが,事前に電子メールで連絡すること.
学生へのメッセージ(1,000文字以内)
/Message for students(up to 1,000 letters)
The amount of content that can be covered in lecture time is limited. Self-motivated study is expected.

講義時間に説明できることは限られている.自身による積極的な自習を期待する.
その他
/Others
None.
キーワード
/Keywords
statistical learning; data mining; Python language

統計的学習理論; データマイニング; Python言語