シラバス参照

講義概要/Course Information
2020/04/28 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
データ工学原論1
英文授業科目名
/Course title (English)
Principles of Data Engineering 1
科目番号
/Code
開講年度
/Academic year
2020年度 開講年次
/Year offered
全学年
開講学期
/Semester(s) offered
前学期 開講コース・課程
/Faculty offering the course
博士前期課程、博士後期課程
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
大学院専門教育科目 - 専門科目Ⅱ
開講学科・専攻
/Cluster/Department
情報・ネットワーク工学専攻
担当教員名
/Lecturer(s)
新谷 隆彦
居室
/Office
西10-531
公開E-Mail
/e-mail
shintani@uec.ac.jp
授業関連Webページ
/Course website
http://home.hol.is.uec.ac.jp/shintani/Lecture/de1/
更新日
/Last updated
2020/03/17 14:47:17 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
主題および
達成目標
/Topic and goals
データ収集技術の普及により大規模なデータが蓄積されるようになり、データベースシステムの重要性がますます高まっています。本講義では、データベース学の応用として、大規模なデータを扱う技術であるデータマイニングを中心に大規模データ処理技術について原理から応用までを学習します。

Due to the advances in data collection and storage technologies, the importance of database systems is increasing.  As application of data engineering, this lecture provides the concepts and techniques of data mining and big data processing.
前もって履修
しておくべき科目
/Prerequisites
アルゴリズム論、統計学、離散数学を履修しておくべきです。

Students should have knowledge of algorithms and data structures, statistics and discrete mathematics.
前もって履修しておくこ
とが望ましい科目
/Recommended prerequisites and preparation
データベースに関する科目を履修しておくことが望ましいです。

Students should have taken courses on databases.
教科書等
/Course textbooks and materials
配布資料を基本に講義を行います。
参考資料は以下の通りです。
- P.N.Tan, M.Steinbach, V.Kumar, "Introduction to Data Mining", Addison Wesley Pub.
- J.Han, M.Kamber, "Data Mining: Concepts and Techniques", 3nd edition, Morgan Kaufmann Pub.
どちらもデータマイニングの技術から応用までしっかりと書かれており、深く学ぶことができます。
- A.Rajaraman, J.D.Ullman, "Mining of Massive Datasets", Cambridge
University Press
データマイニングだけでなく、機械学習やクラスタコンピューティングまでまとめられています。

その他、日本語の参考書。
- 石川博,「データマイニングと集合知」, 共立出版
- 福田剛志, 徳山豪, 森本康彦, 「データマイニング(データサイエンスシリーズ3)」, 共立出版
- A. Rajaraman, J. D. Ullman 著, 岩野和生, 浦本直彦訳, 「大規模データのマイニング」, 共立出版


In each lecture, a summary of the lectures is distributed.  This course does not use any textbooks.  However, some good references are below:
- P.N.Tan, M.Steinbach, V.Kumar, "Introduction to Data Mining", Addison Wesley Pub.
- J.Han, M.Kamber, "Data Mining: Concepts and Techniques", 3rd edition, Morgan Kaufmann Pub.
- A.Rajaraman, J.D.Ullman, Mining of Massive Datasets, Cambridge University Press
授業内容と
その進め方
/Course outline and weekly schedule
データマイニングに関して、以下の内容を講義します。
- データ構造と前処理(クレンジング)
- パターン/ルール抽出(frequent pattern / association rule mining),クラスタリング(clustering),クラス分類(classification)などの概念、アルゴリズム、拡張技術
- 各種データ(時系列、データストリーム、グラフ)への応用

大規模なデータを扱うための理論と技術を両面から学ぶために、データ解析、情報抽出としてのアルゴリズムだけではなく、それぞれの技術は大規模なデータを処理するためにどのような工夫がされているか、どのように利用されるかについても述べます。
適宜、データベースの最先端研究論文や実システムの紹介も行います。

本講義によって、データマイニング技術を理解すると共に、大規模なデータの処理にの考え方を学習してもらいます。


This course teaches concepts and techniques for data mining and big data analysis.
- data structures and data cleaning.
- frequent pattern/itemset mining, association rule mining, clustering and classification.
- mining complex data types as sequence, data stream, graph, time-series and so on.
実務経験を活かした
授業内容
(実務経験内容も含む)
/Course content utilizing practical experience
授業時間外の学習
(予習・復習等)
/Preparation and review outside class
特にないがですが、出典論文などを読み、深く理解することが望ましいです。
成績評価方法
および評価基準
(最低達成基準を含む)
/Evaluation and grading
評価方法:小演習、レポート課題、質問や意見などによる授業への積極的な参加状況
評価基準:レポート課題が受理されていること、および、データマイニングの基本技術であるパターンマイニング、分類、クラスタリングの概念とアルゴリズム、応用例を説明できること

To pass, students must be able to do the followings:
- Have handed in the mid-term reports and the end term report.
- Understand and describe the behavior of algorithms and applications of pattern mining, classification and clustering.
オフィスアワー:
授業相談
/Office hours
質問などある場合には、西10号館5階531号室にお越し下さい。水曜日4限を基本としますが、その他の時間も受け付けます。事前にメールなどで連絡を下さい。

The office hour is 16:10 - 17:40 on every Wednesday, however, it is better to be appointed.
学生へのメッセージ
/Message for students
実社会で膨大なデータが生成され続けており、このような大規模なデータを活用するための技術としてデータ工学の研究が進められています。データベースや情報抽出の基本的な技術を学ぶことでデータ工学に興味を持ってもらいたいと考えています。
その他
/Others
前学期のデータ工学原論2と同時に聴講することが望ましいです。

Students should take the course "Principles of Data Engineering 1".
キーワード
/Keyword(s)
データマイニング、データベース、データ工学、頻出パターン、相関ルール、クラスタリング、クラス分類、クラシフィケーション、分類器、決定木、アルゴリズム、並列分散処理

Data Mining, Databases, Frequent pattern/itemset, Association rule, Clustering, Classification, Classifier, Decision tree, Algorithms, Parallel Distributed Processing