シラバス参照

講義概要/Course Information
2025/05/09 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
データマイニング(T科)
英文授業科目名
/Course title (English)
Data Mining
科目番号
/Code
開講年度
/Academic year
2011年度 開講年次
/Year offered
3/4
開講学期
/Semester(s) offered
後学期 開講コース・課程
/Faculty offering the course
昼間コース
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
専門科目 - 専門科目 - 選択科目
開講類・専攻
/Cluster/Department
システム工学科
担当教員名
/Lecturer(s)
山本 渉
居室
/Office
西5-601
公開E-mail
/e-mail
授業関連Webページに記載(下のURLは学内限定です)
授業関連Webページ
/Course website
http://port.se.uec.ac.jp/incampus/moin.cgi/DataMiningIntroduction/2011
更新日
/Last update
2011/03/05 16:00:55 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
主題および
達成目標(2,000文字以内)
/Themes and goals(up to 2,000 letters)
データマイニング(data mining)とは、金鉱が埋まっているデータの山を掘る(mine)、という意味の用語で、大規模データからの問題発見の手法の総称の一つである。 データマイニングする、というと横文字で何だか新しい雰囲気を醸し出しそうですが、実際には、多くのデータを集めてくる、データを加工して分析ツールで扱える形に整える、金鉱を見つけるのに必要な情報をデータに追加する、などデータマイニングを実施している時間の多くは、データマイニングツール利用の準備に費やされる。

本講義では、それらの実践よりは、データマイニングで用いられる手法に焦点をあて、主に分類に興味がある状況のデータマイニングの理論を扱う。
前もって履修
しておくべき科目(1,000文字以内)
/Prerequisites(up to 1,000 letters)
コンピュータ・リテラシー、基礎プログラミング、情報リテラシー、情報リテラシー演習
前もって履修しておくこ
とが望ましい科目(1,000文字以内)
/Recommended prerequisites and preparation(up to 1,000 letters)
確率統計学第一、確率統計学第二、多変量解析などの内容は、既習得として講義する。
少なくとも統計についての一定の知識は有していることを前提とする。
教科書等(1,000文字以内)
/Course textbooks and materials(up to 1,000 letters)
教科書は特に指定しない。 参考書は講義中に提示する。
授業内容と
その進め方(2,000文字以内)
/Course outline and weekly schedule(up to 2,000 letters)
全15週の予定で、下記の内容で講義する。

1. 統計学の復習
1.1 確率統計の基本事項の確認 (1週)
2. 統計的学習理論I 統計的決定理論
2.1 統計的決定理論 (2週)
2.2 統計的学習理論 (2週)
3. 線形学習機械
3.1 重回帰分析 (1週)
3.2 フィッシャーの判別関数 (1週)
3.3 ロジスティック判別 (1週)
3.4 オフライン学習とオンライン学習 (1週)
4. 統計的学習理論II アンサンブル学習
4.1 汎化能力とVC次元 (1週)
4.2 クロスバリデーションとブートストラップ (1週)
5. 非線形学習機械
5.1 決定木 (1週)
5.1 サポートベクトルマシン (1週)
5.2 ブースティング (1週)
5.3 その他の学習機械 (1週)
実務経験を活かした
授業内容
(実務経験内容も含む)
/Course content utilizing practical experience
授業時間外の学習
(予習・復習等)(1,000文字以内)
/Preparation and review outside class(up to 1,000 letters)
時間外にレポート課題に取り組むことで、講義の内容を体験的に学習してもらう。レポート課題には、演習作業の結果だけでなく、課題に関連して調べたこと、考えたことを、まとめて記すことをお願いしている。
成績評価方法
および評価基準
(最低達成基準を含む)
(1,000文字以内)
/Evaluation and grading
(up to 1,000 letters)
学期中に数回課すレポート課題(通常は4通か5通)を基礎資料とする。原則として、レポート課題の評価の難易度による重み付き和で、成績評価をする。

それぞれの課題を通じて、本講義の主題である、教師付き学習による分類問題の分析とそのデータマイニングへの応用を理解し、各手法の長所や限界を正しく理解していること、を最低達成基準とする。
オフィスアワー:
授業相談(1,000文字以内)
/Office hours(up to 1,000 letters)
木曜5限をオフィスアワーとする。質問等は講義の後に尋ねて頂いても良いし、講義の後もしくはメールにてアポイントメントをとって訪ねてもらっても構わない。またメールでの質問も受け付けるが、込み入った話であれば、対面での相談をこちらは望みたい。
学生へのメッセージ(1,000文字以内)
/Message for students(up to 1,000 letters)
本科目は今年度が最終年度となるので、少し違った話もしてみたい。
その他
/Others
本講義は、昨年度よりシステム工学科計算機室を使用していない。学生が個々に、R言語を実行する環境を用意する必要があるが、インストール方法などについては、講義時間中に適宜、解説したり資料を配付するなどを行う。

またデータマイニング全般については、下記の項目がある。

概論:データマイニングとは(概論, レポート課題1)
相関1:多次元データのまとめ方
相関2:分割表の推論
相関3:OLAPとアソシエーション・ルール(連関分析)
相関4:演習(レポート課題2)
分類1:階層型クラスタリング
分類2:非階層型クラスタリング
分類3:演習(レポート課題3)
判別1:線形判別分析
判別2:二次判別分析
判別3:線型モデルによる判別(ロジスティック判別1)
判別4:一般化加法モデルによる判別(ロジスティック判別2)
判別5:決定木
判別6:ニューラルネットワーク
判別7:サポートベクターマシン
判別8:演習(レポート課題4)
予測1:線形モデルと非線形モデル
予測2:一般化線形モデルによる回帰分析
予測3:一般化加法モデルによる回帰分析
予測4:その他の回帰分析
予測5:演習(レポート課題5)
補論1:データ・クレンジング
補論2:データ・レポジトリ

本講義では、これらの話題のうち、教師あり学習に基づく分類問題、としてのデータマイニング手法に焦点をあてている。講義以外の話題について、興味がある学生は成書を紹介できるので、適宜、申し出られたい。
キーワード
/Keywords
データマイニング