シラバス参照

講義概要/Course Information
2020/04/28 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
データ工学原論2
英文授業科目名
/Course title (English)
Principles of Data Engineering 2
科目番号
/Code
開講年度
/Academic year
2020年度 開講年次
/Year offered
全学年
開講学期
/Semester(s) offered
前学期 開講コース・課程
/Faculty offering the course
博士前期課程、博士後期課程
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
大学院専門教育科目 - 専門科目Ⅱ
開講学科・専攻
/Cluster/Department
情報・ネットワーク工学専攻
担当教員名
/Lecturer(s)
大森 匡
居室
/Office
西10-529
公開E-Mail
/e-mail
omori@is.uec.ac.jp
授業関連Webページ
/Course website
http://home.hol.is.uec.ac.jp/omori
更新日
/Last updated
2020/03/11 13:19:36 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
主題および
達成目標
/Topic and goals
今日のデータベース研究の主題となる諸原理と技術動向を学ぶ.具体的には,分散・巨大化したデータ永続記憶の作り方,大量データからの情報抽出・検索・変形を行うシステムの原理,一貫性維持,多様な新しいデータの応用などについて,その原理,実装,アルゴリズム,システム制御,を紹介します.
前もって履修
しておくべき科目
/Prerequisites
情報系学部科目のうち,アルゴリズム論,データベース論,OS論の3つ.分野外から始める学生でも分かるように注意しますが,良く理解するには必要です.
// undergraduate level classes of algorithms, database systems, operating systems
前もって履修しておくこ
とが望ましい科目
/Recommended prerequisites and preparation
関係データベースに関する学部科目の履修経験があるほうが話は理解しやすい.なくても一部入門的な内容は解説する.
// undergraduate course of relational database systems is helpful.
2018年度から情報学専攻で学部3年のデータベース論を担当しているので,それとの接続という性格も考慮して「分かり易く」「2010年代以後の」データベース領域の研究の話題を取り上げるように努力します.
教科書等
/Course textbooks and materials
配布資料を使って行う.学生にとっての参考書は下記のとおり:
// materials are supplied in each topic. References are as follows:

基礎編

入門:川越恭二 著  「楽しく学べるデータベース」オーム社.(2007)

標準的な学部教科書:北川  「データベースシステム」(オーム社から再販中) (正確で論述が堅いが中身は普通の学部3年向け程度.元は昭晃堂から発刊.)

先進編
1.グレイ、ロイター著 喜連川監訳 「トランザクション処理 概念と技法」
(J.Gray, A.Reuter, "Transaction Processing: Concepts and Techniques, Morgan Kaufmann Pub.) (並行分散トランザクション処理技術の専門書).

2.DBLPサイトからACM SIGMOD, VLDB, ICDE国際会議の論文を宿題に出すかもしれない.
  (DBLP site, the bibliography of database research papers. All papers of ACM SIGMOD, VLDB, ICDE can be downloaded freely.)

3.Mining of Massive Datasets, 2nd edition,  A.Rajaraman, J.D.Ullman.Cambridge Univ. Press, 2015. (All materials and slides are accessible from the authors' web site. )

その他:英語の古典的なDB教科書.大学院初年次くらいの内容で良くまとまっている.
- Ramakrishnan, Gehrke, "Database Management Systems," 3rd edition, McGrawHill Pub.
授業内容と
その進め方
/Course outline and weekly schedule
 本講義は長年,大学院情報システム学研究科でデータベース・データ工学分野のシステムソフトウェア設計とデータベース処理のアルゴリズム・処理演算系の研究を行うための基本を教える大学院講義として編成されてきました.

 2019年度からは,2010年代以降に登場した新しいデータ処理基盤の研究動向を軸に,その概念やアルゴリズム,システム,の原理と先端研究を紹介する方針で見直しています.以下,履修学生の状況に応じて,各項目のコマ数は2~3回程度で前後する予定:

1. 講義ガイダンス
2.大規模データ記憶システムの原理 (2~3回)
3.関係データベースの原理 (2回)
4.並列分散データベース  (2~3回)
5.空間・時系列・多次元・距離空間のデータ (2回)
6.各種データ応用とデータベース研究の話題 (2~3回)
7.トランザクション処理 の現在 (2~3回)
   
なお,頻出アイテムセット計算やクラスタリングなどの古典的なデータマイニングの技法についてはデータ工学原論1(新谷)が専門で扱うため,この講義では主軸にしません.また,セマンティックウェブ,自然言語処理,統計論的機械学習など,MI/CSの他大学院講義が主軸とする内容も扱いません.また,この講義は,Postgres等のプログラミングや内部実装の解説ではありません.こうした内容については大森が学部3年(J専攻)で実施している「データベース論」を参照してください.
実務経験を活かした
授業内容
(実務経験内容も含む)
/Course content utilizing practical experience
該当せず.
授業時間外の学習
(予習・復習等)
/Preparation and review outside class
データベース研究を代表する国際会議はACM SIGMOD, VLDB, IEEE ICDEの3つですが,論文内容の影響力は巨大IT系の研究なのでとても大きいのですが,内容はかなり難しいです.そのため,宿題で論文解説などを出したときは,授業資料を基にしてだいぶ思考してもらうことになります.
成績評価方法
および評価基準
(最低達成基準を含む)
/Evaluation and grading
履修学生と相談の上で,最近の国際会議のSIGMODやVLDBから論文概要を宿題で出すかもしれません.それらの宿題と,最終レポートで総合成績とします.
オフィスアワー:
授業相談
/Office hours
講義終了後の時間帯.
学生へのメッセージ
/Message for students
データベース研究を代表する国際会議であるACM SIGMOD, VLDB,の2017, 2018年の一覧などを見て,巨大データの記憶・検索・情報抽出や現在のデータ応用との相互関係についての知見を深めてもらいたいです.
その他
/Others
H30年度後期から総合情報学専攻・セキュリティ情報コースの学部3年向けに「データベース論」を教えており,データベース研究・データ応用を論じる上での学部入門編として位置づけています.本大学院講義は,当該の学部講義からの発展的な接続として大学院でデータベース研究・データ応用分野で研究するために必要な諸原理を紹介する,という講義になります.
キーワード
/Keyword(s)
データベース研究,データ工学,データ処理基盤,アルゴリズム,高価値情報抽出,データ分散共有のアルゴリズム,時空間データ応用,など.