シラバス参照

講義概要/Course Information
2024/05/02 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
データベース論1
英文授業科目名
/Course title (English)
Database Systems 1
開講年度
/Academic year
2019年度 開講年次
/Year offered
全年次
開講学期
/Semester(s) offered
前学期 開講コース・課程
/Faculty offering the course
博士前期課程、博士後期課程
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
選択科目
開講類・専攻
/Cluster/Department
情報システム基盤学専攻
担当教員名
/Lecturer(s)
新谷 隆彦
居室
/Office
西10-531
公開E-mail
/e-mail
shintani@iuec.ac.jp
授業関連Webページ
/Course website
http://home.hol.is.uec.ac.jp/shintani/Lecture/de1/
更新日
/Last update
2019/03/18 00:08:45 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
講義の狙い、目標 データ収集技術の普及により大規模なデータが蓄積されるようになり,データベースシステムの重要性がますます高まっている。本講義では,データベース学の応用として,大規模なデータを扱う技術であるデータマイニングについて原理から応用までを学習する。
内容 データマイニングに関して,以下の内容を講義する。
- データ構造と前処理(クレンジング)
- パターン/ルール抽出(frequent pattern / association rule mining),クラスタリング(clustering),クラス分類(classification)などの概念、アルゴリズム、拡張技術
- 各種データ(時系列、データストリーム、グラフ)への応用

大規模なデータを扱うための理論と技術を両面から学ぶために,データ解析としてのアルゴリズムだけではなく,それぞれの技術は大規模なデータを処理するためにどのような工夫がされているか,どのように利用されるかについても述べる。
適宜、データベースの最先端研究論文や実システムの紹介も行う。

本講義によって,データマイニング技術を理解すると共に,実問題に適用出来るようになるための考え方を学習することが可能である。

質問などある場合には、IS棟5階531号室にお越し下さい。水曜日4限を基本としますが、その他の時間も受け付けます。事前にメールなどでアポイントメントを取って下さい。
教科書、参考書 特になし。配布資料を基本に講義を行う。
参考資料は以下の通り。
- P.N.Tan, M.Steinbach, V.Kumar, "Introduction to Data Mining", Addison Wesley Pub.
- J.Han, M.Kamber, "Data Mining: Concepts and Techniques", 3nd edition, Morgan Kaufmann Pub.
どちらもデータマイニングの技術から応用までしっかりと書かれており、深く学ぶことができる。
- A.Rajaraman, J.D.Ullman, “Mining of Massive Datasets”, Cambridge
University Press
データマイニングだけでなく、機械学習やクラスタコンピューティングまでまとめられている。

その他、日本語の参考書。
- 石川博,「データマイニングと集合知」, 共立出版
- 福田剛志, 徳山豪, 森本康彦, 「データマイニング(データサイエンスシリーズ3)」, 共立出版
- A. Rajaraman, J. D. Ullman 著, 岩野和生, 浦本直彦訳, 「大規模データのマイニング」, 共立出版
予備知識 データベース、統計学に関する基本的な知識。ただし,必須条件とはしない。
演習 演習は行わない。
成績評価方法
および評価基準
評価方法:レポート課題,および,質問や意見などによる授業への積極的な参加状況
評価基準:レポート課題が受理されていること,および,データマイニングの基本技術であるパターンマイニング,分類規則,クラスタリングの概念とアルゴリズム,応用例を説明できること
その他
/Others
前学期のデータベース論2と同時に受講することが望ましい。
キーワード
/Keywords
データマイニング,データベース,データ工学,頻出パターン,相関ルール,クラスタリング,クラシフィケーション,決定木,アルゴリズム